• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 110
  • 8
  • 5
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 124
  • 57
  • 31
  • 30
  • 29
  • 29
  • 29
  • 28
  • 24
  • 24
  • 23
  • 22
  • 22
  • 21
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Redes probabilísticas de K-dependência para problemas de classificação binária / Redes probabilísticas de K-dependência para problemas de classificação binária

Souza, Anderson Luiz de 28 February 2012 (has links)
Made available in DSpace on 2016-06-02T20:06:06Z (GMT). No. of bitstreams: 1 4338.pdf: 1335557 bytes, checksum: 8e0bef5711ff8c398be194e335deecec (MD5) Previous issue date: 2012-02-28 / Universidade Federal de Sao Carlos / Classification consists in the discovery of rules of prediction to assist with planning and decision-making, being a continuously indispensable tool and a highly discussed subject in literature. As a special case in classification, we have the process of credit risk rating, within which there is interest in identifying good and bad paying customers through binary classification methods. Therefore, in many application backgrounds, as in financial, several techniques can be utilized, such as discriminating analysis, probit analysis, logistic regression and neural nets. However, the Probabilistic Nets technique, also known as Bayesian Networks, have showed itself as a practical convenient classification method with successful applications in several areas. In this paper, we aim to display the appliance of Probabilistic Nets in the classification scenario, specifically, the technique named K-dependence Bayesian Networks also known as KDB nets, as well as compared its performance with conventional techniques applied within context of the Credit Scoring and Medical diagnosis. Applications of the technique based in real and artificial datasets and its performance assisted by the bagging procedure will be displayed as results. / A classificação consiste na descoberta de regras de previsão para auxílio no planejamento e tomada de decisões, sendo uma ferramenta indispensável e um tema bastante discutido na literatura. Como caso especial de classificação, temos o processo de avaliação de risco de crédito, no qual temos o interesse de identificar clientes bons e maus pagadores através de métodos de classificação binária. Assim, em diversos enredos de aplicação, como nas financeiras, diversas técnicas podem ser utilizadas, tais como análise discriminante, análise probito, regressão logística e redes neurais. Porém, a técnica de Redes Probabilísticas, também conhecida como Redes Bayesianas, tem se mostrado um método prático de classificação e com aplicações bem sucedidas em diversos campos. Neste trabalho, visamos exibir a aplicação das Redes Probabilísticas no contexto de classificação, em específico, a técnica denominada Redes Probabilísticas com K-dependência, também conhecidas como redes KDB, bem como comparar seu desempenho com as técnicas convencionais aplicadas no contexto de Credit Scoring e Diagnose Médica. Exibiremos como resultado aplicações da técnica baseadas em conjuntos de dados reais e artificiais e seu desempenho auxiliado pelo procedimento de bagging.
52

Redes lógicas de Markov aplicadas ao aprendizado de classificadores automáticos de dados. / Markov logic networks applied to learning of automatic data classifiers.

Silva, Victor Anselmo 15 June 2010 (has links)
Sistemas de computação têm se tornado maiores e mais complexos com o objetivo de lidar com a vasta quantidade de dados disponíveis. Uma tarefa decisiva em tais sistemas é classificar estes dados, bem como extrair informação útil destes. Nesta dissertação, testam-se as redes lógicas de Markov como linguagem para especificação e aprendizado de classificadores automáticos de dados. Esta linguagem combina fragmentos da lógica de primeira ordem e modelos probabilísticos gráficos (redes de Markov) em uma única representação. A junção destas duas técnicas permite a modelagem de conhecimento relacional através da lógica, e também de incertezas por meio de probabilidades e grafos não-direcionados. Neste trabalho, classificadores são aprendidos segundo dois paradigmas de aprendizado de máquina: o supervisionado, foco desta dissertação, e também o aprendizado semi-supervisionado com restrições determinísticas. Para investigar a utilidade das redes lógicas de Markov no treinamento de classificadores, uma série de experimentos de aprendizado é desenvolvida a partir de bases de dados de treino reais disponíveis em repositórios na internet. Como ferramenta auxiliar nos experimentos, esta dissertação testa também o pacote Alchemy, que provê um conjunto de algoritmos para tarefas gerais de aprendizado de máquina e inferência probabilística em redes lógicas de Markov. Para mensurar o desempenho dos classificadores aprendidos, três métricas tradicionais são empregadas: acurácia, precisão e revocação. Os resultados alcançados com classificadores semi-supervisionados com restrições indicam que a linguagem ainda não é própria para este paradigma de aprendizado. Por outro lado, o êxito obtido no desempenho dos classificadores treinados de forma supervisionada sugere que as redes lógicas de Markov são um formalismo lógico-probabilístico promissor para aplicações de classificação, e devem ser objeto de pesquisas futuras. / Computing systems have become larger and more complex in order to deal with the vast amount of available data. An important task in such systems is to classify these data, so as to extract useful information from them. In this dissertation, Markov logic networks are tested as a language to specify and learn automatic data classifiers. This language combines fragments of first-order logic and probabilistic graphical models (Markov networks), in a single representation. Together, both techniques allow one to model relational knowledge through a logic formalism, and uncertainty through probabilities and undirected graphs. In this work, data classifiers are learned by two machine learning paradigms: the supervised, the main focus of this dissertation, and also the semisupervised learning under deterministic constraints. To investigate the usefulness of Markov logic networks in training data classifiers, a set of experiments is developed from real databases available in repositories at the internet. As a support tool for experiments, this dissertation tests also the Alchemy package, which provides a set of algorithms for general machine learning tasks and probabilistic inference in Markov logic networks. To measure the performance of data classifiers, three traditional metrics are employed: accuracy, precision and recall. The results reached with semisupervised data classifiers indicate that the language is not yet suitable for learning based on this paradigm. On the other hand, the success achieved with classifiers trained in a supervised context suggests that Markov logic networks are a promising logical-probabilistic formalism to approach classification applications, and should be considered in future research.
53

Ensembles na classificação relacional / Ensembles in relational classification

Llerena, Nils Ever Murrugarra 08 September 2011 (has links)
Em diversos domínios, além das informações sobre os objetos ou entidades que os compõem, existem, também, informaçõoes a respeito das relações entre esses objetos. Alguns desses domínios são, por exemplo, as redes de co-autoria, e as páginas Web. Nesse sentido, é natural procurar por técnicas de classificação que levem em conta estas informações. Dentre essas técnicas estão as denominadas classificação baseada em grafos, que visam classificar os exemplos levando em conta as relações existentes entre eles. Este trabalho aborda o desenvolvimento de métodos para melhorar o desempenho de classificadores baseados em grafos utilizando estratégias de ensembles. Um classificador ensemble considera um conjunto de classificadores cujas predições individuais são combinadas de alguma forma. Este classificador normalmente apresenta um melhor desempenho do que seus classificadores individualmente. Assim, foram desenvolvidas três técnicas: a primeira para dados originalmente no formato proposicional e transformados para formato relacional baseado em grafo e a segunda e terceira para dados originalmente já no formato de grafo. A primeira técnica, inspirada no algoritmo de boosting, originou o algoritmo KNN Adaptativo Baseado em Grafos (A-KNN). A segunda ténica, inspirada no algoritmo de Bagging originou trê abordagens de Bagging Baseado em Grafos (BG). Finalmente, a terceira técnica, inspirada no algoritmo de Cross-Validated Committees, originou o Cross-Validated Committees Baseado em Grafos (CVCG). Os experimentos foram realizados em 38 conjuntos de dados, sendo 22 conjuntos proposicionais e 16 conjuntos no formato relacional. Na avaliação foi utilizado o esquema de 10-fold stratified cross-validation e para determinar diferenças estatísticas entre classificadores foi utilizado o método proposto por Demsar (2006). Em relação aos resultados, as três técnicas melhoraram ou mantiveram o desempenho dos classificadores bases. Concluindo, ensembles aplicados em classificadores baseados em grafos apresentam bons resultados no desempenho destes / In many fields, besides information about the objects or entities that compose them, there is also information about the relationships between objects. Some of these fields are, for example, co-authorship networks and Web pages. Therefore, it is natural to search for classification techniques that take into account this information. Among these techniques are the so-called graphbased classification, which seek to classify examples taking into account the relationships between them. This paper presents the development of methods to improve the performance of graph-based classifiers by using strategies of ensembles. An ensemble classifier considers a set of classifiers whose individual predictions are combined in some way. This combined classifier usually performs better than its individual classifiers. Three techniques have been developed: the first applied for originally propositional data transformed to relational format based on graphs and the second and the third applied for data originally in graph format. The first technique, inspired by the boosting algorithm originated the Adaptive Graph-Based K-Nearest Neighbor (A-KNN). The second technique, inspired by the bagging algorithm led to three approaches of Graph-Based Bagging (BG). Finally the third technique, inspired by the Cross- Validated Committees algorithm led to the Graph-Based Cross-Validated Committees (CVCG). The experiments were performed on 38 data sets, 22 datasets in propositional format and 16 in relational format. Evaluation was performed using the scheme of 10-fold stratified cross-validation and to determine statistical differences between the classifiers it was used the method proposed by Demsar (2006). Regarding the results, these three techniques improved or at least maintain the performance of the base classifiers. In conclusion, ensembles applied to graph-based classifiers have good results in the performance of them
54

Desenvolvimento de técnica para recomendar atividades em workflows científicos: uma abordagem baseada em ontologias / Development of a strategy to scientific workflow activities recommendation: An ontology-based approach

Khouri, Adilson Lopes 16 March 2016 (has links)
O número de atividades disponibilizadas pelos sistemas gerenciadores de workflows científicos é grande, o que exige dos cientistas conhecerem muitas delas para aproveitar a capacidade de reutilização desses sistemas. Para minimizar este problema, a literatura apresenta algumas técnicas para recomendar atividades durante a construção de workflows científicos. Este projeto especificou e desenvolveu um sistema de recomendação de atividades híbrido, considerando informação sobre frequência, entrada e saídas das atividades, e anotações ontológicas para recomendar. Além disso, neste projeto é apresentada uma modelagem da recomendação de atividades como um problema de classificação e regressão, usando para isso cinco classificadores; cinco regressores; um classificador SVM composto, o qual usa o resultado dos outros classificadores e regressores para recomendar; e um ensemble de classificadores Rotation Forest. A técnica proposta foi comparada com as outras técnicas da literatura e com os classificadores e regressores, por meio da validação cruzada em 10 subconjuntos, apresentando como resultado uma recomendação mais precisa, com medida MRR ao menos 70% maior do que as obtidas pelas outras técnicas / The number of activities provided by scientific workflow management systems is large, which requires scientists to know many of them to take advantage of the reusability of these systems. To minimize this problem, the literature presents some techniques to recommend activities during the scientific workflow construction. This project specified and developed a hybrid activity recommendation system considering information on frequency, input and outputs of activities and ontological annotations. Additionally, this project presents a modeling of activities recommendation as a classification problem, tested using 5 classifiers; 5 regressors; a SVM classifier, which uses the results of other classifiers and regressors to recommend; and Rotation Forest , an ensemble of classifiers. The proposed technique was compared to other related techniques and to classifiers and regressors, using 10-fold-cross-validation, achieving a MRR at least 70% greater than those obtained by other techniques
55

Classifica??o com algoritmo AdaBoost.M1 : o mito do limiar de erro de treinamento

Le?es Neto, Ant?nio do Nascimento 20 November 2017 (has links)
Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-02-16T13:18:07Z No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) / Approved for entry into archive by Caroline Xavier (caroline.xavier@pucrs.br) on 2018-02-22T16:34:51Z (GMT) No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) / Made available in DSpace on 2018-02-22T16:40:19Z (GMT). No. of bitstreams: 1 Ant?nio_do_Nascimento_Le?es_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) Previous issue date: 2017-11-20 / The accelerated growth of data repositories, in the different areas of activity, opens space for research in the area of data mining, in particular, with the methods of classification and combination of classifiers. The Boosting method is one of them, which combines the results of several classifiers in order to obtain better results. The main purpose of this dissertation is the experimentation of alternatives to increase the effectiveness and performance of the algorithm AdaBoost.M1, which is the implementation often employed by the Boosting method. An empirical study was perfered taking into account stochastic aspects trying to shed some light on an obscure internal parameter, in which algorithm creators and other researchers assumed that the training error threshold should be correlated with the number of classes in the target data set and logically, most data sets should use a value of 0.5. In this paper, we present an empirical evidence that this is not a fact, but probably a myth originated by the mistaken application of the theoretical assumption of the joint effect. To achieve this goal, adaptations were proposed for the algorithm, focusing on finding a better suggestion to define this threshold in a general case. / O crescimento acelerado dos reposit?rios de dados, nas diversas ?reas de atua??o, abre espa?o para pesquisas na ?rea da minera??o de dados, em espec?fico, com os m?todos de classifica??o e de combina??o de classificadores. O Boosting ? um desses m?todos, e combina os resultados de diversos classificadores com intuito de obter melhores resultados. O prop?sito central desta disserta??o ? responder a quest?o de pesquisa com a experimenta??o de alternativas para aumentar a efic?cia e o desempenho do algoritmo AdaBoost.M1 que ? a implementa??o frequentemente empregada pelo Boosting. Foi feito um estudo emp?rico levando em considera??o aspectos estoc?sticos tentando lan?ar alguma luz sobre um par?metro interno obscuro em que criadores do algoritmo e outros pesquisadores assumiram que o limiar de erro de treinamento deve ser correlacionado com o n?mero de classes no conjunto de dados de destino e, logicamente, a maioria dos conjuntos de dados deve usar um valor de 0.5. Neste trabalho, apresentamos evid?ncias emp?ricas de que isso n?o ? um fato, mas provavelmente um mito originado pela aplica??o da primeira defini??o do algoritmo. Para alcan?ar esse objetivo, foram propostas adapta??es para o algoritmo, focando em encontrar uma sugest?o melhor para definir esse limiar em um caso geral.
56

Uma nova família de filtros digitais para classificação de dados com aplicações ao pré-diagnóstico de patologias na laringe / A new family of digital filters for data classification with applications to the pre-diagnosis of larynx pathologies

Rodrigues, Luciene Cavalcanti 12 December 2012 (has links)
O presente trabalho de doutorado tem por objetivo a criação de uma nova família de filtros digitais específica para o processo de classificação de dados, particularmente aplicada ao pré-diagnóstico de patologias na laringe. Antes de explicar a criação dessa nova família de filtros, foi apresentada uma breve revisão bibliográfica sobre o funcionamento do aparelho fonador humano, sobre o processo de diagnóstico de patologias e sobre a transformada discreta Wavelet, que serviu de base para a construção dos filtros propostos. Em seguida, é descrita a tecnologia proposta para a criação da nova família de filtros, que é baseada na construção da Transformada Wavelet de Daubechies, além disso, apresenta-se uma breve comparação com outras técnicas já descritas na literatura para a mesma finalidade. Posteriormente, são apresentados os resultados obtidos com base na técnica proposta, verificando-se uma taxa de acerto na classificação de vozes normais de 100% e uma taxa de acerto de 95,52% para vozes patológicas. / The main purpose of this thesis is the development of a new family of digital filters used for data classification, particularly applied to the pre-diagnosis of pathologies in the larynx. A brief bibliographical review, that concentrates on the functioning of the human vocal tract, on the process of disease diagnosis, and on the discrete wavelet transform, which formed the basis for the construction of the proposed filters, is presented. The technology used to develop these new families of filters, that is based on the Daubechies Wavelet Transform, is also described, moreover, a comparison with other techniques described in the specialized literature for the same purpose is also presented. The investigation shows the results obtained with the proposed technique, in which the accuracy of 100% in normal voice classifications and of 95,52% in pathological voice classifications, was obtained.
57

A contabilidade dos nomes no português brasileiro / Countability of nouns in brazilian portuguese

Martins, Nize da Rocha Santos Paraguassú 27 August 2010 (has links)
Esta tese investiga a denotação dos nomes comuns nas línguas naturais. De forma mais específica enfoca a denotação dos nomes comuns no português brasileiro (PB). O objetivo é investigar os mecanismos que licenciam contabilidade no PB. Primeiramente investiga-se a denotação dos nomes no PB frente à proposta de Borer (2005). A autora defende que interpretações contáveis são licenciadas estruturalmente, mas que interpretações massivas não, e, nesse sentido, interpretações massivas são default. Segundo Borer (2005), o plural, em línguas como o inglês, e os classificadores, em línguas como o chinês, são sintagmas de classificação que originam interpretações contáveis, cujo núcleo tem um valor aberto div, onde DIV é um operador de divisão. A ausência desses sintagmas confere uma interpretação massiva aos nomes. Diferentemente da maioria das línguas germânicas e românicas que permitem a ocorrência do plural nu, mas não permitem a ocorrência do singular nu, no PB, o singular nu é extremamente produtivo. Assim, se Borer (2005) estiver certa, no PB os nomes são massivos, pois os nomes nessa língua podem ocorrer sem nenhuma estrutura que os divida, denotando uma massa amorfa, sem divisão. No entanto, a análise dos dados do PB mostra, contra as previsões de Borer (2005), que a denotação default dos nomes, independentemente de ser indeterminada para número, pode ser massiva ou contável e que tais nomes já vêm com essa denotação marcada do léxico. Em segundo lugar, investiga-se a denotação dos nomes lexicalmente contáveis em estruturas não marcadas para contabilidade. Como Rullmann e You (2003) defendem para o chinês, o PB é uma língua em que os nomes possuem número geral, isto é, não são singular nem plural, são neutros para número, como defendem Müller (2001) e Schmitt e Munn (1999, 2002) para o PB. Línguas que possuem número geral geralmente não possuem morfologia de número, entretanto, o PB é um exemplo de língua que possui número geral, classificação e morfologia de número. Em terceiro lugar, investiga-se a denotação dos nomes segundo a proposta de Rothstein (2007). A autora defende que interpretações contáveis são licenciadas por um mecanismo de contabilidade gramatical. Segundo Rothstein (2007), o singular em línguas como o inglês e os classificadores numéricos em línguas como o chinês são operações gramaticais que licenciam interpretações contáveis. Como o PB é uma língua que possui número geral, classificadores numéricos e morfologia de número, defende-se a tese de que nessa língua o que licencia contabilidade são as operações de número e de classificação. / This thesis investigates common noun denotations in natural languages. To be more specific, it encompasses common noun denotations in Brazilian Portuguese (BP). Its objective is to investigate the mechanisms which licence countability in BP. Firstly, noun denotation in BP is investigated according to Borers proposal (2005). The author argues that count interpretations are structurally licensed, while mass interpretations are not, thus in this sense, mass interpretations are default. According to Borer (2005), the plural morphology, in languages such as English, and the classifiers, in languages such as Chinese, are classifiers phrases which originate count interpretations with opened value nucleus div, where DIV is a division operator. The absence of these classifiers phrases bestows mass interpretation to the nouns. Contrary to most Germanic and Romance languages which permit bare plurals, but do not permit bare singulars, in BP, the bare singular is extremely productive. Thus, if Borer (2005) is right, nouns are mass-denoting in BP since they can occur without any distinctive structure, denoted amorphous mass, undivided. However, data analysis in BP opposes the predictions of Borer (2005) that a default noun denotation, regardless of being indeterminate in number, can be a mass or count denotation, and that such nouns already have this lexical denotation. Secondly, lexical denotation of count nouns in unmarked structures is investigated for countability. As Rullman and Aili You (2003) defend Chinese, BP is a language in which nouns have general number, that is, they are neither singular nor plural, they are neutral for number, as defended by Müller (2001) and Schmitt e Munn (1999, 2002). Languages with general number do not have plural morphology, but BP is an example of a language that has general number, numeral classifier and plural morpheme. Thirdly, denotation of names according to Rothstein (2007) is investigated. The author argues that countable interpretations are licensed by a mechanism of grammatical countability. According to Rothstein (2007), singular morphology in languages such as English and numeral classifiers in languages such as Chinese are grammatical operations which licence count interpretations. Since BP is a language that has general number, numeral classifiers and plural morphology, the thesis that, in this language, number and classification operations licence countability is defended.
58

Redes lógicas de Markov aplicadas ao aprendizado de classificadores automáticos de dados. / Markov logic networks applied to learning of automatic data classifiers.

Victor Anselmo Silva 15 June 2010 (has links)
Sistemas de computação têm se tornado maiores e mais complexos com o objetivo de lidar com a vasta quantidade de dados disponíveis. Uma tarefa decisiva em tais sistemas é classificar estes dados, bem como extrair informação útil destes. Nesta dissertação, testam-se as redes lógicas de Markov como linguagem para especificação e aprendizado de classificadores automáticos de dados. Esta linguagem combina fragmentos da lógica de primeira ordem e modelos probabilísticos gráficos (redes de Markov) em uma única representação. A junção destas duas técnicas permite a modelagem de conhecimento relacional através da lógica, e também de incertezas por meio de probabilidades e grafos não-direcionados. Neste trabalho, classificadores são aprendidos segundo dois paradigmas de aprendizado de máquina: o supervisionado, foco desta dissertação, e também o aprendizado semi-supervisionado com restrições determinísticas. Para investigar a utilidade das redes lógicas de Markov no treinamento de classificadores, uma série de experimentos de aprendizado é desenvolvida a partir de bases de dados de treino reais disponíveis em repositórios na internet. Como ferramenta auxiliar nos experimentos, esta dissertação testa também o pacote Alchemy, que provê um conjunto de algoritmos para tarefas gerais de aprendizado de máquina e inferência probabilística em redes lógicas de Markov. Para mensurar o desempenho dos classificadores aprendidos, três métricas tradicionais são empregadas: acurácia, precisão e revocação. Os resultados alcançados com classificadores semi-supervisionados com restrições indicam que a linguagem ainda não é própria para este paradigma de aprendizado. Por outro lado, o êxito obtido no desempenho dos classificadores treinados de forma supervisionada sugere que as redes lógicas de Markov são um formalismo lógico-probabilístico promissor para aplicações de classificação, e devem ser objeto de pesquisas futuras. / Computing systems have become larger and more complex in order to deal with the vast amount of available data. An important task in such systems is to classify these data, so as to extract useful information from them. In this dissertation, Markov logic networks are tested as a language to specify and learn automatic data classifiers. This language combines fragments of first-order logic and probabilistic graphical models (Markov networks), in a single representation. Together, both techniques allow one to model relational knowledge through a logic formalism, and uncertainty through probabilities and undirected graphs. In this work, data classifiers are learned by two machine learning paradigms: the supervised, the main focus of this dissertation, and also the semisupervised learning under deterministic constraints. To investigate the usefulness of Markov logic networks in training data classifiers, a set of experiments is developed from real databases available in repositories at the internet. As a support tool for experiments, this dissertation tests also the Alchemy package, which provides a set of algorithms for general machine learning tasks and probabilistic inference in Markov logic networks. To measure the performance of data classifiers, three traditional metrics are employed: accuracy, precision and recall. The results reached with semisupervised data classifiers indicate that the language is not yet suitable for learning based on this paradigm. On the other hand, the success achieved with classifiers trained in a supervised context suggests that Markov logic networks are a promising logical-probabilistic formalism to approach classification applications, and should be considered in future research.
59

DeteÃÃo de manchas de Ãleo em imagens SAR atravÃs da combinaÃÃo de caracterÃsticas e de classificadores. / Detection of oil spill in SAR images through combination of features and classifiers.

Geraldo Luis Bezerra Ramalho 14 December 2007 (has links)
nÃo hà / O mapeamento da poluiÃÃo de Ãleo no mar utilizando imagens de Radar de Abertura SintÃtica (SAR, do inglÃs Synthetic Aperture Radar) à uma importante Ãrea de interesse na Ãrea da vigilÃncia ambiental. Pode-se utilizar imagens SAR para extrair caracterÃsticas atravÃs de diferentes mÃtodos com o objetivo de predizer atravÃs de Redes Neurais Artificiais (RNAs) se uma regiÃo especÃfica contÃm ou nÃo uma mancha de Ãleo. O principal problema dessa abordagem à a ocorrÃncia de excessivos alarmes falsos decorrentes de erros de classificaÃÃo. Manchas de Ãleo sÃo eventos raros e a pequena disponibilidade de imagens contendo manchas à um fator limitante do desempenho dos classificadores. Este trabalho propÃe a utilizaÃÃo de mÃltiplos conjuntos de caracterÃsticas e mÃtodos de combinaÃÃo de classificadores para minimizar o nÃmero de alarmes falsos a fim de possibilitar a reduÃÃo de custos operacionais de sistemas automÃticos de deteÃÃo de manchas de Ãleo. As imagens SAR utilizadas neste trabalho nÃo estÃo limitadas a um Ãnico sistema de imageamento e diferentes conjuntos de caracterÃsticas baseados na geometria e textura das manchas foram testados. Os desempenhos de generalizaÃÃo de mÃtodos de combinaÃÃo de classificadores, como boosting e bagging, foram comparados com aqueles obtidos com classificadores individuais, como Perceptron Multi-Camadas (MLP, do inglÃs Multi-Layer Perceptron) e MÃquina de Vetor de Suporte (SVM, do inglÃs Support Vector Machine). Os resultados experimentais sugerem que a caracterizaÃÃo das manchas de Ãleo pode ser significativamente melhorada atravÃs do uso do boosting,mesmo quando poucas imagens amostrais estÃo disponÃveis. / Mapping ocean oil pollution by using Synthetic Aperture Radar (SAR) images is an important area of interest for environmental surveillance. One can make use of the SAR images to extract features by using different methods in order to predict if a specific region contains an oil spill or not using Artificial Neural Networks (ANN). A major problem in this approach is the number of false alarms due to misclassification. Oil spills are rare events and the number of available images containing spills is atistically small which is a limitation for the classifier performance. This work proposes the use of multiple feature sets and classifier combining methods to minimize the number of false alarms and thus, reduce the operational costs of automatic oil spill detection systems. The SAR images used in this work are not limited to a specific imaging system and different feature sets based on geometry and texture of the spills were tested. The generalization performances of classifier combination methods as boosting and bagging were compared with those resulting from single classifiers as Multilayer Perceptron (MLP) and Support Vector Machines (SVM). The experimental results suggest that oil spill characterization can be significantly improved using boosting even when few image samples are available and the feature sets have high dimensionality.
60

Avaliação de classificadores na classificação de radiografias de tórax para o diagnóstico de pneumonia infantil / Classifiers evaluation in chest radiograph classification to childhood pneumonia diagnosis

Sousa, Rafael Teixeira 20 September 2013 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2014-10-14T21:24:19Z No. of bitstreams: 2 Dissertação - Rafael Teixeira Sousa - 2013.pdf: 2536972 bytes, checksum: 5a0aa0899207e8f66f11c5b819fcc211 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Jaqueline Silva (jtas29@gmail.com) on 2014-10-16T18:20:52Z (GMT) No. of bitstreams: 2 Dissertação - Rafael Teixeira Sousa - 2013.pdf: 2536972 bytes, checksum: 5a0aa0899207e8f66f11c5b819fcc211 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2014-10-16T18:20:52Z (GMT). No. of bitstreams: 2 Dissertação - Rafael Teixeira Sousa - 2013.pdf: 2536972 bytes, checksum: 5a0aa0899207e8f66f11c5b819fcc211 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2013-09-20 / This work extends a Computer-Aided Diagnosis system called PneumoCAD for detecting pneumonia in infants using radiographic images, with the aim of improving the system’s accuracy, robustness and test the features previously extracted. We implement and compare five contemporary machine learning classifiers, namely: Naïve Bayes, K-Nearest Neighbor (KNN), Support Vector Machines (SVM), Multi-Layer Perceptron (MLP) and Decision Tree, combined with three dimensionality reduction algorithms: the feature selection wrapper Sequential Forward Elimination (SFE), and two feature filter algotithms: Principal Component Analysis (PCA) and Kernel Principal Component Analysis (KPCA). Current Results of demonstrate that the Naïve Bayes classifier combined with KPCA produces the best overall results. Also confirming the efficiency os features. / Avaliação de classificadores na classificação de radiografias de tórax para o diagnóstico de pneumonia infantil Este trabalho dá continuidade ao Sistema de Auxílio a Diagnóstico chamado de PneumoCAD para a detecção de pneumonia infantil por meio de imagens radiográficas, com o objetivo de aprimorar a acurácia, robustez e testar as características extraídas anteriormente. Nós implementamos cinco classificadores contemporâneos, sendo estes: Naïve Bayes, K-Nearest Neighbor (KNN), Support Vector Machines (SVM), Multi-Layer Perceptron (MLP) e Árvore de decisão. Combinamos os classificadores com três algoritmos de redução de dimensionalidade: o wrapper Sequential Forward Elimination (SFE) e dois filtros: Principal Component Analysis (PCA) e Kernel Principal Component Analysis (KPCA). Os resultados atuais mostram que o Naïve Bayes combinado com o KPCA produzem o melhor resultado (96% de acurácia). Também confirmando a eficiência das características.

Page generated in 0.4722 seconds