Global ETD Search

1	Um algoritmo evolutivo para indu??o de ?rvores de regress?o robusto a valores ausentes Blomberg, Luciano Costa 22 August 2014 (has links) Made available in DSpace on 2015-04-14T14:50:16Z (GMT). No. of bitstreams: 1 461465.pdf: 5428729 bytes, checksum: d0627f774922501baa685975c40465f5 (MD5) Previous issue date: 2014-08-22 / A common concern in many fields of knowledge involves problems of low quality data, such as noise and missing data. In the machine learning area, for example, missing data has generated serious problems in the knowledge extraction process, hiding important information about the dataset, skewing results and affecting the accuracy of the induced models. In order to deal with these problems, much has been discussed in the literature about missing values treatment strategies, either by preprocessing tasks or by the implementation of robust algorithms to missing data. In this thesis, we introduce a new evolutionary algorithm for induction of regression trees, including multiple strategies in its evolutionary cycle for dealing with missing data. Aiming to make a comparative analysis, we evaluated six traditional regression algorithms over 10 public datasets artificially modified to present different levels of missing data. Results from the experimental analysis show that the proposed solution presents a good trade-off between model interpretability and predictive performance, especially for datasets with more than 40% of missing data. / Uma preocupa??o comum em muitas ?reas do conhecimento envolve problemas de baixa qualidade de dados, tais como ru?dos e dados ausentes. Na ?rea de aprendizado de m?quina, por exemplo, dados ausentes t?m gerado s?rios problemas no processo de extra??o de conhecimento, ocultando importantes informa??es sobre o dataset, enviesando resultados e afetando o desempenho preditivo dos modelos induzidos. Para lidar com esse problema, muito tem se discutido na literatura sobre estrat?gias de tratamento, seja por pr?-processamento ou por meio do desenvolvimento de algoritmos robustos a dados ausentes. Neste trabalho, prop?e-se um novo algoritmo evolutivo para indu??o de ?rvores de regress?o, agregando em seu ciclo evolutivo m?ltiplas estrat?gias para lidar com dados ausentes. Com o objetivo de fazer uma an?lise comparativa, foram avaliados 6 tradicionais algoritmos de regress?o, considerando para tanto, 10 datasets artificialmente modificados para manterem diferentes n?veis de dados ausentes. Resultados da an?lise experimental mostram que a solu??o proposta apresenta uma boa rela??o custo-benef?cio entre compreensibilidade dos modelos e desempenho preditivo, especialmente para as bases de dados com mais de 40% de dados ausentes. INFORM?TICA APRENDIZAGEM DE M?QUINA ALGORITMOS (PROGRAMA??O)
2	Classifica??o autom?tica do Diaphorina citri em imagens de microscopia Melo, Jos? Leonardo dos Santos 08 April 2016 (has links) Submitted by Ricardo Cedraz Duque Moliterno (ricardo.moliterno@uefs.br) on 2016-08-29T21:08:03Z No. of bitstreams: 1 Dissertacao-Leonardo_Melo-UEFS_PGCA-2.pdf: 1657755 bytes, checksum: 78e6ca37c9610faf17a158b94e25bcb8 (MD5) / Made available in DSpace on 2016-08-29T21:08:03Z (GMT). No. of bitstreams: 1 Dissertacao-Leonardo_Melo-UEFS_PGCA-2.pdf: 1657755 bytes, checksum: 78e6ca37c9610faf17a158b94e25bcb8 (MD5) Previous issue date: 2016-04-08 / Funda??o de Amparo ? Pesquisa do Estado da Bahia - FAPEB / The Huanglongbing (HLB) is the disease of greatest concern for growers because they spread quickly and cause severe symptoms. The Diaphorina citri insect is the main vector of the HLB. The application of insecticides is a control measure of the vector insect of the HLB widely adopted. The amount of pesticides needed for an effective control of this insect is better estimated if such application is combined with a monitoring of its population by yellow sticky traps. These insects are captured for a manual count in research centers. So, this research aims to discover a computational approach of classification of Diaphorina citri insect images with higher accuracy rate that the classification rate currently used in manual counting procedure and thus enable the automation of this important counting procedure. For this, have been tried and combined computational methods for features extraction (ORB, SIFT, SURF, BRISK and FREAK), grouping of characteristics (Mini Batch K-Means) and features classification for machine learning (KNN and SVM), using a generated bank with 1152 images of insects. The best found classification approach (extractor SURF/SIFT, BoF with Diaphorina citri features and SVM with core RBF) generated classification performance results for the metric accuracy, which outperformed the best measured result in research that evaluated the counting manual process. In this approach, the highest achieved accuracy, in the cross validation process, was 98.17% and was 2.54% as standard deviation and the accuracy of the final test of generalization model was 99.14%. The achieved result is of great importance for the control of HLB. The achieved classification accuracy rates were higher than rates reported in the manual procedure, making possible the construction of computer systems to high accuracy for the control of this insect. This automated control can provide significant savings of funds. / O Huanglongbing (HLB) ? a doen?a de maior preocupa??o para os citricultores por se propagar com rapidez e provocar severos sintomas. O inseto Diaphorina citri ? o principal vetor do HLB. A aplica??o de inseticidas ? uma medida de controle do inseto vetor do HLB amplamente adotada. A quantidade de inseticidas necess?ria para um controle efetivo desse inseto ? melhor estimada se essa aplica??o for combinada a um monitoramento de sua popula??o por meio de armadilhas adesivas amarelas. Esses insetos s?o capturados para uma contagem manual em centros de pesquisa. Ent?o, esta pesquisa tem por objetivo descobrir uma abordagem computacional de classifica??o de imagens de insetos Diaphorina citri com taxa de acur?cia de classifica??o maiores que a taxa de classifica??o utilizada atualmente no procedimento manual de contagem e, assim, possibilitar a automa??o desse importante procedimento de contagem. Para isso, foram experimentados e combinados m?todos computacionais para a extra??o de caracter?sticas (ORB, SIFT, SURF, BRISK e FREAK), agrupamento de caracter?sticas (Mini Batch K-Means) e classifica??o de caracter?sticas por aprendizagem de m?quina (KNN e SVM), utilizando um banco gerado com 1152 imagens de insetos. A melhor abordagem de classifica??o encontrada (extrator SURF/SIFT, BoF com caracter?sticas do Diaphorina citri e SVM com n?cleo RBF) gerou resultados de desempenho de classifica??o, pela m?trica da acur?cia, que superaram o melhor resultado medido na pesquisa que avaliou o processo de contagem manual. Nessa abordagem, a maior acur?cia atingida no processo de valida??o cruzada foi de 98,17% e teve 2,54% como desvio padr?o e a acur?cia do teste final de generaliza??o de modelo foi de 99,14%. O resultado alcan?ado ? de grande import?ncia para o controle do HLB. As taxas de acur?cia de classifica??o alcan?adas foram superiores as taxas relatadas no procedimento manual, tornando vi?vel a constru??o de sistemas computacionais de alta acur?cia para o controle desse inseto. Esse controle automatizado pode proporcionar uma economia significativa de recursos financeiros. Diaphorina Citri Armadilhas adesivas amarelas Aprendizagem de m?quina
3	Resolu??o de correfer?ncia e categorias de entidades nomeadas Moraes, Tatiane Coreixas 10 March 2010 (has links) Made available in DSpace on 2015-04-14T14:49:27Z (GMT). No. of bitstreams: 1 427028.pdf: 957635 bytes, checksum: fbedf4df218091e4bc1e919c4ffd808b (MD5) Previous issue date: 2010-03-10 / Define-se correfer?ncia como a rela??o entre diversos componentes lingu?sticos com uma mesma entidade de mundo. A resolu??o autom?tica de correfer?ncia textual est? inserida num contexto muito importante na ?rea de Processamento da Linguagem Natural, pois v?rios sistemas necessitam dessa tarefa. O n?vel de processamento lingu?stico depende do conhecimento de mundo, e isso ainda ? um desafio para a ?rea. Esse desafio estimulou e tornou-se o objeto de estudo desta disserta??o. Nesse sentido, analisamos o papel das categorias de entidades nomeadas e, atrav?s de aprendizado de m?quina, verificamos as condi??es de resolu??o em diferentes categorias. Os resultados dos experimentos demonstraram que o conhecimento de mundo, representado nas categorias de entidades nomeadas, auxilia nessa tarefa, pois o percentual de retorno do sistema com base nas categorias teve uma melhora de 17% em compara??o com a vers?o sem as categorias. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGU?STICA COMPUTACIONAL APRENDIZAGEM DE M?QUINA
4	Resolu??o de correfer?ncias em l?ngua portuguesa : pessoa, local e organiza??o Fonseca, Evandro Brasil 21 March 2014 (has links) Made available in DSpace on 2015-04-14T14:50:12Z (GMT). No. of bitstreams: 1 458767.pdf: 3173862 bytes, checksum: 0f4ea1ec0b9741e176522697d0d4dd1d (MD5) Previous issue date: 2014-03-21 / Coreference resolution is a process that consists in identifying the several forms that a specific named entity may assume on certain text. In other words, this process consists in identifying certain terms and expressions that refer certain named entity. The automatic textual coreference resolution is in a very important context in the Natural Language Processing (NLP) area, because several systems need itstasks, such as the relation extraction between named entities. The linguistic processing level depends on the knowledgeabout the world, and this is a challenge for thisarea, mainly for the Portuguese language. The growing necessity of NLP tools and the lack of open source resources for Portuguese have inspired the research on this language, and they became the focus of this dissertation. The present work aims at building an open source tool for the Coreference resolution in Portuguese, focusing on the Person, Location and Organization domains. These three categories were chosen given their relevance for most NLP tasks, because they represent more specifically entities of common interest.Furthermore, they are the most explored categories in the related works. The choice for working only with open source resourcesis because most of related works forPortuguese usesprivate software, which limits his availability and his usability.The methodology is based on supervised machine learning. For this task, the use of features that help on the correct classification of noun phrase pairs as coreferent or non-coreferent are essential for grouping them later, thus building coreference chains.Although there are still many challenges to be overcome, the results of the system described in this dissertationare encouraging when compared indirectly, by using the same metric,to the current state of the art. / Resolu??o de correfer?ncias ? um processo que consiste em identificar as diversas formas que uma mesma entidade nomeada pode assumir em um determinado texto. Em outras palavras, esse processo consiste em identificar determinados termos e express?es que remetem a uma mesma entidade. A resolu??o autom?tica de correfer?ncia textual est? inserida num contexto muito importante na ?rea de Processamento da Linguagem Natural (PLN), pois v?rios sistemas necessitam dessa tarefa, como, por exemplo, a extra??o de rela??o entre entidades nomeadas. O n?vel de processamento lingu?stico depende do conhecimento de mundo, e isso ainda ? um desafio para a ?rea. A necessidade crescente por ferramentas de PLN e a escassez de recursos livres para a l?ngua portuguesa motivaram trabalhar com essa l?ngua nesta disserta??o de mestrado. O presente trabalho teve por objetivo desenvolver uma ferramenta open source para a resolu??o de correfer?ncias em l?ngua portuguesa, tendo como foco as categorias de entidades nomeadas Pessoa, Local e Organiza??o. Optou-se por essas tr?s categorias por essas serem as mais relevantes para a maioria das tarefas de PLN, pelo fato de tratarem entidades mais espec?ficas e de interesse comum. Al?m disso, s?o as categorias mais exploradas em trabalhos voltados ? resolu??o de correfer?ncia. Escolheu-se trabalhar apenas com recursos open source pelo fato de a maioria dos trabalhos para a l?ngua portuguesa utilizar recursos propriet?rios. Isso acaba limitando a disponibilidade da ferramenta e, consequentemente, o seu uso. A metodologia utilizada ? baseada em aprendizado de m?quina supervisionado. Para tal, o uso de features que auxiliem na correta classifica??o de pares de sintagmas como correferentes ou n?o-correferentes ? fundamental para,posteriormente,agrup?-los, gerando cadeias de correfer?ncia.Embora ainda existam muitos desafios a serem resolvidos, os resultados do sistema descrito nesta disserta??o s?o animadores, quando comparados indiretamente, por meio de uma mesma m?trica, ao atual estado da arte. INFORM?TICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGU?STICA COMPUTACIONAL APRENDIZAGEM DE M?QUINA
5	Estudo comparativo de diferentes classificadores baseados em aprendizagem de m?quina para o processo de Reconhecimento de Entidades Nomeadas Santos, Jadson da Silva 09 September 2016 (has links) Submitted by Jadson Francisco de Jesus SILVA (jadson@uefs.br) on 2018-01-24T22:42:26Z No. of bitstreams: 1 JadsonDisst.pdf: 3499973 bytes, checksum: 5deaf9020f758e9c07f86e9e62890129 (MD5) / Made available in DSpace on 2018-01-24T22:42:26Z (GMT). No. of bitstreams: 1 JadsonDisst.pdf: 3499973 bytes, checksum: 5deaf9020f758e9c07f86e9e62890129 (MD5) Previous issue date: 2016-09-09 / The Named Entity Recognition (NER) process is the task of identifying relevant termsintextsandassigningthemalabel.Suchwordscanreferencenamesofpeople, organizations, and places. The variety of techniques that can be used in the named entityrecognitionprocessislarge.Thetechniquescanbeclassifiedintothreedistinct approaches: rule-based, machine learning and hybrid. Concerning to the machine learningapproaches,severalfactorsmayinfluenceitsaccuracy,includingtheselected classifier, the set of features extracted from the terms, the characteristics of the textual bases, and the number of entity labels. In this work, we compared classifiers that use machine learning applied to the NER task. The comparative study includes classifiers based on CRF (Conditional Random Fields), MEMM (MaximumEntropy Markov Model) and HMM (Hidden Markov Model), which are compared in two corpora in Portuguese derived from WikiNer, and HAREM, and two corporas in English derived from CoNLL-03 and WikiNer. The comparison of the classifiers shows that the CRF is superior to the other classifiers, both with Portuguese and English texts. This study also includes the comparison of the individual and joint contribution of features, including contextual features, besides the comparison ofthe NER per named entity labels, between classifiers andcorpora. / O processo de Reconhecimento de Entidades Nomeadas (REN) ? a tarefa de iden- tificar termos relevantes em textos e atribu?-los um r?tulo. Tais palavras podem referenciar nomes de pessoas, organiza??es e locais. A variedade de t?cnicas que podem ser usadas no processo de reconhecimento de entidades nomeadas ? grande. As t?cnicas podem ser classificadas em tr?s abordagens distintas: baseadas em regras, baseadas em aprendizagem de m?quina e h?bridas. No que diz respeito as abordagens de aprendizagem de m?quina, diversos fatores podem influenciar sua exatida?, incluindo o classificador selecionado, o conjunto de features extra?das dos termos, as caracter?sticas das bases textuais e o n?mero de r?tulos de entidades. Neste trabalho, comparamos classificadores que utilizam aprendizagem de m?quina aplicadas a tarefa do REN. O estudo comparativo inclui classificadores baseados no CRF (Condicional Random Fields), MEMM (Maximum Entropy Markov Model) e HMM (Hidden Markov Model), os quais s?o comparados em dois corporas em portugu?s derivados do WikiNer, e HAREM, e dois corporas em ingl?s derivados doCoNLL-03 e WikiNer. A compara??o dos classificadores demonstra que o CRF ? superior aos demais classificadores, tanto com textos em portugu?s, quanto ingl?s. Este estudo tamb?m inclui a compara??o da contribui??o, individual e em conjunto de features, incluindo features de contexto, al?m da compara??o do REN por r?otulos de entidades nomeadas, entre os classificadores e os corpora. Reconhecimento de Entidades Nomeadas Aprendizagem de M?quina Extra??o de Informa??o Processamento de Linguagem Natural Named Entity Recognition Machine Learning Information Extraction Natural Linguage Process
6	Combina??o de classificadores na categoriza??o de textos Linden, Gustavo Sandini 06 December 2007 (has links) Made available in DSpace on 2015-04-14T14:49:04Z (GMT). No. of bitstreams: 1 409150.pdf: 923910 bytes, checksum: 44e59b532fd1e8f249aeacfa7777f126 (MD5) Previous issue date: 2007-12-06 / Este trabalho apresenta e avalia uma proposta para Categoriza??o Hier?rquica de Textos com uso combinado dos classificadores k-Nearest Neighbors (k-NN) e Support Vector Machines (SVM). O estudo foi embasado numa s?rie de experimentos os quais fizeram uso da cole??o Folha-RIcol de textos em l?ngua portuguesa, que se encontram hierarquicamente organizados em categorias. Nos experimentos realizados, os classificadores k-NN e SVM tiveram seu desempenho analisado, primeiro individualmente, com uma variante da metodologia de avalia??o hold-out, e ap?s, de modo combinado. A combina??o proposta, denominada k-NN+SVM, teve seu desempenho comparado com aquele dos classificadores individuais e com o da combina??o por voto. Em s?ntese, a combina??o k-NN+SVM n?o apresentou desempenho superior ?s demais alternativas, todavia o estudo permitiu a observa??o do comportamento dos classificadores e seu uso combinado, a identifica??o de problemas e poss?veis solu??es, bem como algumas considera??es sobre a cole??o de documentos utilizada INFORM?TICA CATEGORIZA??O (LING??STICA) LING??STICA COMPUTACIONAL PROCESSAMENTO DE TEXTOS (COMPUTA??O) APRENDIZAGEM DE M?QUINA
7	Uma arquitetura baseada em agentes para configura??o din?mica de aplica??es inteligentes em ambiente foundation fieldbus Machado, Vinicius Ponte 11 December 2009 (has links) Made available in DSpace on 2014-12-17T14:54:53Z (GMT). No. of bitstreams: 1 ViniciusPM.pdf: 1794851 bytes, checksum: 2a77c7f1b263be186ffa64cbc38b4cc3 (MD5) Previous issue date: 2009-12-11 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The industrial automation is directly linked to the development of information tecnology. Better hardware solutions, as well as improvements in software development methodologies make possible the rapid growth of the productive process control. In this thesis, we propose an architecture that will allow the joining of two technologies in hardware (industrial network) and software field (multiagent systems). The objective of this proposal is to join those technologies in a multiagent architecture to allow control strategies implementations in to field devices. With this, we intend develop an agents architecture to detect and solve problems which may occur in the industrial network environment. Our work ally machine learning with industrial context, become proposed multiagent architecture adaptable to unfamiliar or unexpected production environment. We used neural networks and presented an allocation strategies of these networks in industrial network field devices. With this we intend to improve decision support at plant level and allow operations human intervention independent / A automa??o industrial est? diretamente ligada ao crescimento da tecnologia da informa??o. Tanto as melhorias em solu??es de hardware quanto o aprimoramento em metodologias de desenvolvimento de software propiciaram o crescimento do controle do processo produtivo ao longo dos anos. Nesta tese, propomos uma arquitetura que permitir? a uni?o de duas tecnologias no ?mbito de hardware (redes industriais) e software (sistemas multiagente). O objetivo de nossa proposta ? unir essas tecnologias em uma arquitetura multiagente para permitir implementa??o de aplica??es inteligentes nos dispositivos de campo. Com isso pretendemos fazer que os agentes possam detectar e apontar solu??es para problemas encontrados no ambiente de rede industrial. Este trabalho ainda alia a aprendizagem de m?quina ao contexto industrial, permitindo dessa forma que a arquitetura de agentes proposta possa se tornar adapt?vel a um contexto de produ??o desconhecido ou inesperado. Para isso, utilizamos redes neurais e mostramos uma estrat?gia para aloca??o destas redes em dispositivos da rede industrial. Pretendemos assim viabilizar uma melhoria no suporte a decis?o em ocorr?ncias no n?vel de planta auxiliando os operadores na detec??o e corre??o de problemas e falhas Redes industriais Sistemas multiagente Redes neurais Aprendizagem de m?quina Industrial networks Multi-agents systems Neural networks Machine learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA

1

Page generated in 0.0335 seconds