Global ETD Search

291	Aplicando técnicas de aprendizado de máquina em planejamento Sousa, Jean Lucas de 02 June 2014 (has links) In terms of classical planning, planners objectives are generate a sequence of actions that converts an initial conguration (state) into another state that attends a goal. Planning systems have been used in solving a variety of problems with success. However, no planner is capable of outperforming all the others when applied to distinct problems. Probabilistic planning is an extension of classical planning that works with stochastic environments. Just as in classical planning, several planners were proposed to solve probalistic planning problems. However, no planner is capable of outperform all others when applied to distinct problems. In this work we describe our approach that is capable of extracting features of a planning problem and determining a classical or probabilistic planner from a portfolio that can solve the problem. We use machine learning algorithms to determine the best planner from the porfolio that solves a problem. Our approach showed good results in the experiments. Our approach outperformed the best planners from a recent planning competition in both areas (classical and probabilistic planning). / Em termos de abordagem clássica, sistemas de planejamento ou planejadores concentramse em gerar automaticamente uma sequência de ações que transforma uma conguração (estado) inicial de objetos em outro estado em que um dado objetivo é satisfeito. Sistemas de planejamento foram utilizados para resolver uma variedade de problemas com sucesso. Apesar disso, nenhum planejador é melhor que todos os outros quando aplicados a problemas distintos. O planejamento probabilístico é uma extensão do planejamento clássico que trabalha sobre um ambiente não determinístico. Assim como no planejamento clássico, diversos planejadores foram propostos para resolver problemas, porém nenhum planejador é capaz de superar totalmente os outros em todos os problemas. Neste trabalho, descreve-se uma abordagem que consiste em extrair características do problema a ser resolvido e determinar, a partir de um conjunto de planejadores clássicos e probabilísticos, um que seja capaz de resolver o problema com eciência. Em nossa abordagem, são utilizados algoritmos de aprendizado de máquina para determinar o melhor planejador dentre o portfólio que resolve o problema. A seleção dos planejadores se mostrou eciente nos testes tendo mostrado bons resultados nos experimentos ao superar os planejadores de portfólio que conseguiram os melhores resultados nas competições de planejamento em ambas as áreas (planejamento clássico e probabilístico). / Mestre em Ciência da Computação Classificação Portfólio Aprendizado de máquina Planejamento clássico Planejamento probabilístico Aprendizado do computador Planejamento Classification Portfolio Machine learning Classical planning Probabilistic planning
292	Seleção e construção de features relevantes para o aprendizado de máquina. / Relevant feature selection and construction for machine learning. Huei Diana Lee 27 April 2000 (has links) No Aprendizado de Máquina Supervisionado - AM - é apresentado ao algoritmo de indução um conjunto de instâncias de treinamento, no qual cada instância é um vetor de features rotulado com a classe. O algoritmo de indução tem como tarefa induzir um classificador que será utilizado para classificar novas instâncias. Algoritmos de indução convencionais baseam-se nos dados fornecidos pelo usuário para construir as descrições dos conceitos. Uma representação inadequada do espaço de busca ou da linguagem de descrição do conjunto de instâncias, bem como erros nos exemplos de treinamento, podem tornar os problemas de aprendizado difícies. Um dos problemas centrais em AM é a Seleção de um Subconjunto de Features - SSF - na qual o objetivo é tentar diminuir o número de features que serão fornecidas ao algoritmo de indução. São várias as razões para a realização de SSF. A primeira é que a maioria dos algoritmos de AM, computacionalmente viáveis, não trabalham bem na presença de muitas features, isto é a precisão dos classificadores gerados pode ser melhorada com a aplicação de SSF. Ainda, com um número menor de features, a compreensibilidade do conceito induzido pode ser melhorada. Uma terceira razão é o alto custo para coletar e processar grande quantidade de dados. Existem, basicamente, três abordagens para a SSF: embedded, filtro e wrapper. Por outro lado, se as features utilizadas para descrever os exemplos de treinamento são inadequadas, os algoritmos de aprendizado estão propensos a criar descrições excessivamente complexas e imprecisas. Porém, essas features, individualmente inadequadas, podem algumas vezes serem, convenientemente, combinadas gerando novas features que podem mostrar-se altamente representativas para a descrição de um conceito. O processo de construção de novas features é conhecido como Construção de Features ou Indução Construtiva - IC. Neste trabalho são enfocadas as abordagens filtro e wrapper para a realização de SSF, bem como a IC guiada pelo conhecimento. É descrita uma série de experimentos usando SSF e IC utilizando quatro conjuntos de dados naturais e diversos algoritmos simbólicos de indução. Para cada conjunto de dados e cada indutor, são realizadas várias medidas, tais como, precisão, tempo de execução do indutor e número de features selecionadas pelo indutor. São descritos também diversos experimentos realizados utilizando três conjuntos de dados do mundo real. O foco desses experimentos não está somente na avaliação da performance dos algoritmos de indução, mas também na avaliação do conhecimento extraído. Durante a extração de conhecimento, os resultados foram apresentados aos especialistas para que fossem feitas sugestões para experimentos futuros. Uma parte do conhecimento extraído desses três estudos de casos foram considerados muito interessantes pelos especialistas. Isso mostra que a interação de diferentes áreas de conhecimento, neste caso específico, áreas médica e computacional, pode produzir resultados interessantes. Assim, para que a aplicação do Aprendizado de Máquina possa gerar frutos é necessário que dois grupos de pesquisadores sejam unidos: aqueles que conhecem os métodos de AM existentes e aqueles com o conhecimento no domínio da aplicação para o fornecimento de dados e a avaliação do conhecimento adquirido. / In supervised Machine Learning - ML - an induction algorithm is typically presented with a set of training instances, where each instance is described by a vector of feature values and a class label. The task of the induction algorithm (inducer) is to induce a classifier that will be useful in classifying new cases. Conventional inductive-learning algorithms rely on existing (user) provided data to build their descriptions. Inadequate representation space or description language as well as errors in training examples can make learning problems be difficult. One of the main problems in ML is the Feature Subset Selection - FSS - problem, i.e. the learning algorithm is faced with the problem of selecting some subset of features upon which to focus its attention, while ignoring the rest. There are a variety of reasons that justify doing FSS. The first reason that can be pointed out is that most of the ML algorithms, that are computationally feasible, do not work well in the presence of a very large number of features. This means that FSS can improve the accuracy of the classifiers generated by these algorithms. Another reason to use FSS is that it can improve comprehensibility, i.e. the human ability of understanding the data and the rules generated by symbolic ML algorithms. A third reason for doing FSS is the high cost in some domains for collecting data. Finally, FSS can reduce the cost of processing huge quantities of data. Basically, there are three approaches in Machine Learning for FSS: embedded, filter and wrapper approaches. On the other hand, if the provided features for describing the training examples are inadequate, the learning algorithms are likely to create excessively complex and inaccurate descriptions. These individually inadequate features can sometimes be combined conveniently, generating new features which can turn out to be highly representative to the description of the concept. The process of constructing new features is called Constructive Induction - CI. Is this work we focus on the filter and wrapper approaches for FSS as well as Knowledge-driven CI. We describe a series of experiments for FSS and CI, performed on four natural datasets using several symbolic ML algorithms. For each dataset, various measures are taken to compare the inducers performance, for example accuracy, time taken to run the inducers and number of selected features by each evaluated induction algorithm. Several experiments using three real world datasets are also described. The focus of these three case studies is not only comparing the induction algorithms performance, but also the evaluation of the extracted knowledge. During the knowledge extraction step results were presented to the specialist, who gave many suggestions for the development of further experiments. Some of the knowledge extracted from these three real world datasets were found very interesting by the specialist. This shows that the interaction between different areas, in this case, medical and computational areas, may produce interesting results. Thus, two groups of researchers need to be put together if the application of ML is to bear fruit: those that are acquainted with the existing ML methods, and those with expertise in the given application domain to provide training data. aprendizado de máquina bases de dados médicos construção de features extração de conhecimentos seleção de features Feature Construction Feature Selection knowledge extraction machine learning medical databases
293	Caracterização e identificação de displasias corticais focais em pacientes com epilepsia refratária através de análise de imagens estruturais de ressonância magnética nuclear / Characterization and identification of focal cortical dysplasia in patients with refractory epilepsy through analysis of structural magnetic resonance images Fabrício Henrique Simozo 11 April 2018 (has links) A displasia cortical focal (DCF) é uma das causas mais frequentes de epilepsia refratária. Na clínica, diferentes informações são usadas para localizar o foco epileptogênico, mas nenhum método é autossuficiente para evidenciar o local original das crises, associado com a presença da DCF. Embora haja relatos na literatura indicando alterações no padrão de distribuição de tons de cinza e morfologia dos voxels decorrentes da DCF, algumas limitações dos métodos desenvolvidos ainda impedem a utilização clínica. Nossa proposta foi investigar a capacidade de identificar DCF através de análises de espessura cortical e padrões de textura em imagens estruturais de Ressonância Magnética (RM), validando os métodos desenvolvidos a partir uma base de imagens retrospectiva, cujo tecido epileptogênico já havia sido ressecado e a DCF confirmada em análise histológica. A caracterização das DCF foi feita a partir da segmentação automática de tecido cortical saudável em conjunto com a segmentação manual da DCF feita por um especialista, e consiste na geração de mapas de característica e extração de valores de distribuições para comparação em análise estatística. Investigamos também a eficácia da detecção de DCF através do uso de algoritmos de aprendizado de máquina para classificação automática. Obtivemos precisão 0,81 e sensitividade 0,87, colocando o método desenvolvido em par com outros métodos presentes na literatura. Entretanto, foi identificada uma grande dependência do desempenho de métodos de pré-processamento, como corregistro e segmentação automática. / Focal Cortical Dysplasia (FCD) is one of the most frequent causes of refractory epilepsy. In clinical procedures, the information gathered from different techniques is used in order to locate the epileptogenic focus, associated with the presence of FCD. However, there is no self sufficient method to evidence the presence and location of such lesions and especially its extension. Although there are reports indicating change in gray scale intensity patterns and voxel morphology in the presence of DCF, limitations in developed methods still prevent their clinical use. Our proposal was to investigate the capability of identifying FCD through cortical thickness and texture patter analysis in structural MRI images, validating developed methods by utilizing a retrospective base of images from patients that were subjected to surgery, with the FCD being confirmed in histological analysis. Characterization of FCD was achieved from automatic segmentation of healthy cortex and manual segmentation of FCD tissue made by an specialist, and consists in the generation of texture or structural feature maps and comparison of distribution values in healthy or FCD tissue with statistical analysis. We also investigate the efficiency of FCD detection with Machine Learning automatic classification, obtaining precision of 0,81 and sensitivity of 0,87, placing our method on par with other methods in the literature. However, there is a major performance dependency of proposed method with pre-processing steps, like registration and automatic segmentation.
294	Diretrizes metodológicas e validação estatística de dados para a construção de data warehouses / Methodological guidelines and statistical data validation for the construction of data warehouses Pedro Losco Takecian 14 August 2014 (has links) Os sistemas de integração de dados que usam a arquitetura de data warehouse (DW) têm se tornado cada vez maiores e mais difíceis de gerenciar devido à crescente heterogeneidade das fontes de dados envolvidas. Apesar dos avanços tecnológicos e científicos, os projetos de DW ainda são muito lentos na geração de resultados pragmáticos. Este trabalho busca responder à seguinte questão: como pode ser reduzida a complexidade do desenvolvimento de sistemas de DW que integram dados provenientes de sistemas transacionais heterogêneos? Para isso, apresenta duas contribuições: 1) A criação de diretrizes metodológicas baseadas em ciclos de modelagem conceitual e análise de dados para guiar a construção de um sistema modular de integração de dados. Essas diretrizes foram fundamentais para reduzir a complexidade do desenvolvimento do projeto internacional Retrovirus Epidemiology Donor Study-II (REDS-II), se mostrando adequadas para serem aplicadas em sistemas reais. 2) O desenvolvimento de um método de validação de lotes de dados candidatos a serem incorporados a um sistema integrador, que toma decisões baseado no perfil estatístico desses lotes, e de um projeto de sistema que viabiliza o uso desse método no contexto de sistemas de DW. / Data integration systems that use data warehouse (DW) architecture are becoming bigger and more difficult to manage due to the growing heterogeneity of data sources. Despite the significant advances in research and technologies, many integration projects are still too slow to generate pragmatic results. This work addresses the following question: how can the complexity of DW development for integration of heterogeneous transactional information systems be reduced? For this purpose, we present two contributions: 1) The establishment of methodological guidelines based on cycles of conceptual modeling and data analysis to drive construction of a modular data integration system. These guidelines were fundamental for reducing the development complexity of the international project Retrovirus Epidemiology Donor Study-II (REDS-II), proving suited to be applied in real systems. 2) The development of a validation method of data batches that are candidates to be incorporated into an integration system, which makes decisions based on the statistical profile of these batches, and a project of a system that enables the use of this method in DW systems context. análise de dados aprendizado de máquina arquitetura modular data warehouse modelagem conceitual validação de dados conceptual modeling data analysis data validation data warehouse machine learning modular architecture
295	Modelos de tópicos na classificação automática de resenhas de usuários. / Topic models in user review automatic classification. Denis Deratani Mauá 14 August 2009 (has links) Existe um grande número de resenhas de usuário na internet contendo valiosas informações sobre serviços, produtos, política e tendências. A compreensão automática dessas opiniões é não somente cientificamente interessante, mas potencialmente lucrativa. A tarefa de classificação de sentimentos visa a extração automática das opiniões expressas em documentos de texto. Diferentemente da tarefa mais tradicional de categorização de textos, na qual documentos são classificados em assuntos como esportes, economia e turismo, a classificação de sentimentos consiste em anotar documentos com os sentimentos expressos no texto. Se comparados aos classificadores tradicionais, os classificadores de sentimentos possuem um desempenho insatisfatório. Uma das possíveis causas do baixo desempenho é a ausência de representações adequadas que permitam a discriminação das opiniões expressas de uma forma concisa e própria para o processamento de máquina. Modelos de tópicos são modelos estatísticos que buscam extrair informações semânticas ocultas na grande quantidade de dados presente em coleções de texto. Eles representam um documento como uma mistura de tópicos, onde cada tópico é uma distribuição de probabilidades sobre palavras. Cada distribuição representa um conceito semântico implícito nos dados. Modelos de tópicos, as palavras são substituídas por tópicos que representam seu significado de forma sucinta. De fato, os modelos de tópicos realizam uma redução de dimensionalidade nos dados que pode levar a um aumento do desempenho das técnicas de categorização de texto e recuperação de informação. Na classificação de sentimentos, eles podem fornecer a representação necessária através da extração de tópicos que representem os sentimentos expressos no texto. Este trabalho dedica-se ao estudo da aplicação de modelos de tópicos na representação e classificação de sentimentos de resenhas de usuário. Em particular, o modelo Latent Dirichlet Allocation (LDA) e quatro extensões (duas delas desenvolvidas pelo autor) são avaliados na tarefa de classificação de sentimentos baseada em múltiplos aspectos. As extensões ao modelo LDA permitem uma investigação dos efeitos da incorporação de informações adicionais como contexto, avaliações de aspecto e avaliações de múltiplos aspectos no modelo original. / There is a large number of user reviews on the internet with valuable information on services, products, politics and trends. There is both scientific and economic interest in the automatic understanding of such data. Sentiment classification is concerned with automatic extraction of opinions expressed in user reviews. Unlike standard text categorization tasks that deal with the classification of documents into subjects such as sports, economics and tourism, sentiment classification attempts to tag documents with respect to the feelings they express. Compared to the accuracy of standard methods, sentiment classifiers have shown poor performance. One possible cause of such a poor performance is the lack of adequate representations that lead to opinion discrimination in a concise and machine-readable form. Topic Models are statistical models concerned with the extraction of semantic information hidden in the large number of data available in text collections. They represent a document as a mixture of topics, probability distributions over words that represent a semantic concept. According to Topic Model representation, words can be substituted by topics able to represent concisely its meaning. Indeed, Topic Models perform a data dimensionality reduction that can improve the performance of text classification and information retrieval techniques. In sentiment classification, they can provide the necessary representation by extracting topics that represent the general feelings expressed in text. This work presents a study of the use of Topic Models for representing and classifying user reviews with respect to their feelings. In particular, the Latent Dirichlet Allocation (LDA) model and four extensions (two of them developed by the author) are evaluated on the task of aspect-based sentiment classification. The extensions to the LDA model enables us to investigate the effects of the incorporation of additional information such as context, aspect rating and multiple aspect rating into the original model. Aprendizado computacional Aprendizado de máquina Categorização de texto Classificação de sentimento Inteligência artificial Processamento de texto Artificial intelligence Computational learning Machine learning Sentiment classification Text categorization Text processing
296	Análise de grandezas cinemáticas e dinâmicas inerentes à hemiparesia através da descoberta de conhecimento em bases de dados / Analysis of kinematic and dynamic data inherent to hemiparesis through knowledge discovery in databases Caio Benatti Moretti 31 March 2016 (has links) Em virtude de uma elevada expectativa de vida mundial, faz-se crescente a probabilidade de ocorrer acidentes naturais e traumas físicos no cotidiano, o que ocasiona um aumento na demanda por reabilitação. A terapia física, sob o paradigma da reabilitação robótica com serious games, oferece maior motivação e engajamento do paciente ao tratamento, cujo emprego foi recomendado pela American Heart Association (AHA), apontando a mais alta avaliação (Level A) para pacientes internados e ambulatoriais. No entanto, o potencial de análise dos dados coletados pelos dispositivos robóticos envolvidos é pouco explorado, deixando de extrair informações que podem ser de grande valia para os tratamentos. O foco deste trabalho consiste na aplicação de técnicas para descoberta de conhecimento, classificando o desempenho de pacientes diagnosticados com hemiparesia crônica. Os pacientes foram inseridos em um ambiente de reabilitação robótica, fazendo uso do InMotion ARM, um dispositivo robótico para reabilitação de membros superiores e coleta dos dados de desempenho. Foi aplicado sobre os dados um roteiro para descoberta de conhecimento em bases de dados, desempenhando pré-processamento, transformação (extração de características) e então a mineração de dados a partir de algoritmos de aprendizado de máquina. A estratégia do presente trabalho culminou em uma classificação de padrões com a capacidade de distinguir lados hemiparéticos sob uma precisão de 94%, havendo oito atributos alimentando a entrada do mecanismo obtido. Interpretando esta coleção de atributos, foi observado que dados de força são mais significativos, os quais abrangem metade da composição de uma amostra. / As a result of a higher life expectancy, the high probability of natural accidents and traumas occurences entails an increasing need for rehabilitation. Physical therapy, under the robotic rehabilitation paradigm with serious games, offers the patient better motivation and engagement to the treatment, being a method recommended by American Heart Association (AHA), pointing the highest assessment (Level A) for inpatients and outpatients. However, the rich potential of the data analysis provided by robotic devices is poorly exploited, discarding the opportunity to aggregate valuable information to treatments. The aim of this work consists of applying knowledge discovery techniques by classifying the performance of patients diagnosed with chronic hemiparesis. The patients, inserted into a robotic rehabilitation environment, exercised with the InMotion ARM, a robotic device for upper-limb rehabilitation which also does the collection of performance data. A Knowledge Discovery roadmap was applied over collected data in order to preprocess, transform and perform data mining through machine learning methods. The strategy of this work culminated in a pattern classification with the abilty to distinguish hemiparetic sides with an accuracy rate of 94%, having eight attributes feeding the input of the obtained mechanism. The interpretation of these attributes has shown that force-related data are more significant, comprising half of the composition of a sample. Aprendizado de máquina KDD Mineração de dados Reabilitação Robótica de reabilitação Data mining KDD Knowledge discovery in databases Machine learning Rehabilitation Rehabilitation robotics
297	Um data warehouse de publicações científicas: indexação automática da dimensão tópicos de pesquisa dos data marts / A Data warehouse for scientific publications: automatic indexing of the research topic dimension for using in data marts Augusto Kanashiro 04 May 2007 (has links) Este trabalho de mestrado insere-se no contexto do projeto de uma Ferramenta Inteligente de Apoio à Pesquisa (FIP), sendo desenvolvida no Laboratório de Inteligência Computacional do ICMC-USP. A ferramenta foi proposta para recuperar, organizar e minerar grandes conjuntos de documentos científicos (na área de computação). Nesse contexto, faz-se necessário um repositório de artigos para a FIP. Ou seja, um Data Warehouse que armazene e integre todas as informações extraídas dos documentos recuperados de diferentes páginas pessoais, institucionais e de repositórios de artigos da Web. Para suportar o processamento analítico on-line (OLAP) das informações e facilitar a ?mineração? desses dados é importante que os dados estejam armazenados apropriadamente. Dessa forma, o trabalho de mestrado teve como objetivo principal projetar um Data Warehouse (DW) para a ferramenta FIP e, adicionalmente, realizar experimentos com técnicas de mineração e Aprendizado de Máquina para automatizar o processo de indexação das informações e documentos armazenados no data warehouse (descoberta de tópicos). Para as consultas multidimensionais foram construídos data marts de forma a permitir aos pesquisadores avaliar tendências e a evolução de tópicos de pesquisa / This dissertation is related to the project of an Intelligent Tool for Research Supporting (FIP), being developed at the Laboratory of Computational Intelligence at ICMC-USP. The tool was proposed to retrieve, organize, and mining large sets of scientific documents in the field of computer science. In this context, a repository of articles becomes necessary, i.e., a Data Warehouse that integrates and stores all extracted information from retrieved documents from different personal and institutional web pages, and from article repositories. Data appropriatelly stored is decisive for supporting online analytical processing (OLAP), and ?data mining? processes. Thus, the main goal of this MSc research was design the FIP Data Warehouse (DW). Additionally, we carried out experiments with Data Mining and Machine Learning techniques in order to automatize the process of indexing of information and documents stored in the data warehouse (Topic Detection). Data marts for multidimensional queries were designed in order to facilitate researchers evaluation of research topics trend and evolution Aprendizado de máquina Data mart Data warehouse Detecção de tópicos de pesquisa Mineração de dados Mineração de textos OLAP Data mart Data mining Data warehouse Machine learning OLAP Research topic detection Text mining
298	Extração de conhecimento simbólico em técnicas de aprendizado de máquina caixa-preta por similaridade de rankings / Symbolic knowledge extraction from black-box machine learning techniques with ranking similarities Rodrigo Elias Bianchi 26 September 2008 (has links) Técnicas de Aprendizado de Máquina não-simbólicas, como Redes Neurais Artificiais, Máquinas de Vetores de Suporte e combinação de classificadores têm mostrado um bom desempenho quando utilizadas para análise de dados. A grande limitação dessas técnicas é a falta de compreensibilidade do conhecimento armazenado em suas estruturas internas. Esta Tese apresenta uma pesquisa realizada sobre métodos de extração de representações compreensíveis do conhecimento armazenado nas estruturas internas dessas técnicas não-simbólicas, aqui chamadas de caixa preta, durante seu processo de aprendizado. A principal contribuição desse trabalho é a proposta de um novo método pedagógico para extração de regras que expliquem o processo de classificação seguido por técnicas não-simbólicas. Esse novo método é baseado na otimização (maximização) da similaridade entre rankings de classificação produzidos por técnicas de Aprendizado de Máquina simbólicas e não simbólicas (de onde o conhecimento interno esta sendo extraído). Experimentos foram realizados com vários conjuntos de dados e os resultados obtidos sugerem um bom potencial para o método proposto / Non-symbolic Machine Learning techniques, like Artificial Neural Networks, Support Vector Machines and Ensembles of classifiers have shown a good performance when they are used in data analysis. The strong limitation regarding the use of these techniques is the lack of comprehensibility of the knowledge stored in their internal structure. This Thesis presents an investigation of methods capable of extracting comprehensible representations of the knowledge acquired by these non-symbolic techniques, here named black box, during their learning process. The main contribution of this work is the proposal of a new pedagogical method for rule extraction that explains the classification process followed by non-symbolic techniques. This new method is based on the optimization (maximization) of the similarity between classification rankings produced by symbolic and non-symbolic (from where the internal knowledge is being extracted) Machine Learning techniques. Experiments were performed for several datasets and the results obtained suggest a good potential of the proposed method Aprendizado de máquina Extração de conhecimento Extração de regras Máquinas de vetores suporte Redes neurais Knowledge extraction Machine learning Neural networks Rule extraction Support vector machines
299	Redes neurais e algoritmos genéticos para problemas de classificação hierárquica multirrótulo / Neural networks and genetic algorithms for hierarchical multi-label classification Ricardo Cerri 05 December 2013 (has links) Em problemas convencionais de classificação, cada exemplo de um conjunto de dados é associado a apenas uma dentre duas ou mais classes. No entanto, existem problemas de classificação mais complexos, nos quais as classes envolvidas no problema são estruturadas hierarquicamente, possuindo subclasses e superclasses. Nesses problemas, exemplos podem ser atribuídos simultaneamente a classes pertencentes a dois ou mais caminhos de uma hierarquia, ou seja, exemplos podem ser classificados em várias classes localizadas em um mesmo nível hierárquico. Tal hierarquia pode ser estruturada como uma árvore ou como um grafo acíclico direcionado. Esses problemas são chamados de problemas de classificação hierárquica multirrótulo, sendo mais difíceis devido à alta complexidade, diversidade de soluções, difícil modelagem e desbalanceamento dos dados. Duas abordagens são utilizadas para tratar esses problemas, chamadas global e local. Na abordagem global, um único classificador é induzido para lidar com todas as classes do problema simultaneamente, e a classificação de novos exemplos é realizada em apenas um passo. Já na abordagem local, um conjunto de classificadores é induzido, sendo cada classificador responsável pela predição de uma classe ou de um conjunto de classes, e a classificação de novos exemplos é realizada em vários passos, considerando as predições dos vários classificadores. Nesta Tese de Doutorado, são propostos e investigados dois métodos para classificação hierárquica multirrótulo. O primeiro deles é baseado na abordagem local, e associa uma rede neural Multi-Layer Perceptron (MLP) a cada nível da hierarquia, sendo cada MLP responsável pelas predições no seu nível associado. O método é chamado Hierarchical Multi- Label Classification with Local Multi-Layer Perceptrons (HMC-LMLP). O segundo método é baseado na abordagem global, e induz regras de classificação hierárquicas multirrótulo utilizando um Algoritmo Genético. O método é chamado Hierarchical Multi-Label Classification with a Genetic Algorithm (HMC-GA). Experimentos utilizando hierarquias estruturadas como árvores mostraram que o método HMC-LMLP obteve desempenhos de classificação superiores ao método estado-da-arte na literatura, e desempenhos superiores ou competitivos quando utilizando hierarquias estruturadas como grafos. O método HMC-GA obteve resultados competitivos com outros métodos da literatura em hierarquias estruturadas como árvores e grafos, sendo capaz de induzir, em muitos casos, regras menores e em menor quantidade / conventional classification problems, each example of a dataset is associated with just one among two or more classes. However, there are more complex classification problems where the classes are hierarchically structured, having subclasses and superclasses. In these problems, examples can be simultaneously assigned to classes belonging to two or more paths of a hierarchy, i.e., examples can be classified in many classes located in the same hierarchical level. Such a hierarchy can be structured as a tree or a directed acyclic graph. These problems are known as hierarchical multi-label classification problems, being more difficult due to the high complexity, diversity of solutions, modeling difficulty and data imbalance. Two main approaches are used to deal with these problems, called global and local. In the global approach, only one classifier is induced to deal with all classes simultaneously, and the classification of new examples is done in just one step. In the local approach, a set of classifiers is induced, where each classifier is responsible for the predictions of one class or a set of classes, and the classification of new examples is done in many steps, considering the predictions of all classifiers. In this Thesis, two methods for hierarchical multi-label classification are proposed and investigated. The first one is based on the local approach, and associates a Multi-Layer Perceptron (MLP) to each hierarchical level, being each MLP responsible for the predictions in its associated level. The method is called Hierarchical Multi-Label Classification with Local Multi-Layer Perceptrons (HMC-LMLP). The second method is based on the global approach, and induces hierarchical multi-label classification rules using a Genetic Algorithm. The method is called Hierarchical Multi-Label Classification with a Genetic Algorithm (HMC-GA). Experiments using hierarchies structured as trees showed that HMC-LMLP obtained classification performances superior to the state-of-the-art method in the literature, and superior or competitive performances when using graph-structured hierarchies. The HMC-GA method obtained competitive results with other methods of the literature in both tree and graph-structured hierarchies, being able of inducing, in many cases, smaller and in less quantity rules Algoritmos genéticos Aprendizado de máquina Bioinformática Redes neurais bioinformatics Genetic algorithms Hierarchical multi-label classification Machine learning Neural networks
300	Estratégias inteligentes aplicadas em robôs móveis autônomos e em coordenação de grupos de robôs / Intelligent strategies applied to autonomous mobile robots and groups of robots Gustavo Pessin 05 April 2013 (has links) O contínuo aumento da complexidade no controle de sistemas robóticos, bem como a aplicação de grupos de robôs auxiliando ou substituindo seres humanos em atividades críticas tem gerado uma importante demanda por soluções mais robustas, flexíveis, e eficientes. O desenvolvimento convencional de algoritmos especializados, constituídos de sistemas baseados em regras e de autômatos usados para coordenar estes conjuntos físicos em um ambiente dinâmico é um desafio extremamente complexo. Diversos modelos de desenvolvimento existem, entretanto, muitos desafios da área da robótica móvel autônoma continuam em aberto. Esta tese se insere no contexto da busca por soluções inteligentes a serem aplicadas em robôs móveis autônomos com o objetivo de permitir a operação destes em ambientes dinâmicos. Buscamos, com a investigação e aplicação de estratégias inteligentes por meio de aprendizado de máquina no funcionamento dos robôs, a proposta de soluções originais que permitam uma nova visão sobre a operação de robôs móveis em três dos desafios da área da robótica móvel autônoma, que são: localização, navegação e operações com grupos de robôs. As pesquisas sobre localização e coordenação de grupos apresentam investigação e propostas originais, buscando estender o estado da arte, onde apresentam resultados inovadores. A parte sobre navegação tem como objetivo principal ser um elo entre os conceitos de localização e coordenação de grupos, sendo o foco o desenvolvimento de um veículo autônomo com maior implicação em avanços técnicos. Relacionado com a coordenação de grupos de robôs, fizemos a escolha de trabalhar sobre uma aplicação modelada como o problema de combate a incêndios florestais. Buscamos desenvolver um ambiente de simulação realístico, onde foram avaliadas quatro técnicas para busca de iii estratégias de formação do grupo: Algoritmos Genéticos, Otimização por Enxame de Partículas, Hill Climbing e (iv) Simulated Annealing. Com base nas diversas avaliações realizadas pudemos mostrar quais das técnicas e conjuntos de parâmetros permitem a obtenção de resultados mais acurados que os demais. Além disso, mostramos como uma heurística baseada em populações anteriores pode auxiliar na tolerância a falhas da operação. Relacionado com a tarefa de navegação, apresentamos o desenvolvimento de um veículo autônomo de grande porte funcional para ambientes externos. Buscamos aperfeiçoar uma arquitetura para navegação autônoma, baseada em visão monocular e com capacidade de seguir pontos esparsos de GPS. Mostramos como a simulação e os usos de robôs de pequeno porte auxiliaram no desenvolvimento do veículo de grande porte e apresentamos como as redes neurais podem ser aplicadas nos modelos de navegação autônoma. Na investigação sobre localização, mostramos um método utilizando informação obtida de redes sem fio para prover informação de localização para robôs móveis. As informações obtidas da rede sem fio são utilizadas para aprendizado da posição de um robô móvel por meio de uma rede neural. Diversas avaliações foram realizadas buscando entender o comportamento do sistema com diferentes números de pontos de acesso, com uso de filtros, com diferentes topologias. Os resultados mostram que o modelo usando redes sem fio pode ser um possível método prático e barato para localização de robôs móveis. Esta tese aborda temas relevantes e propostas originais relacionadas com os objetivos propostos, apresentando métodos que provenham autonomia na coordenação de grupos e nas atividades individuais dos mesmos. A busca por altos graus de eficiência na resolução de tarefas em ambientes dinâmicos ainda é um campo que carece de soluções e de um aprofundamento nas pesquisas. Sendo assim, esta pesquisa buscou agregar diversos avanços científicos na área de pesquisa de robôs móveis autônomos e coordenação de grupos, por meio da aplicação de estratégias inteligentes / The constant increasing of the complexity in the control of robotic systems, as well as the application of groups of robots assisting or replacing human beings in critical activities has generated a significant demand for more robust, flexible and efficient solutions. The conventional development of specialized algorithms consisted of rule-based systems and automatas, used to coordinate these physical sets in a dynamic environment is an extremely complex challenge. Although several models of development of robotic issues are currently in use, many challenges in the area remain open. This thesis is related to the search for intelligent strategies to be applied in autonomous mobile robots in order to allow practical operations in dynamic environments. We seek, with the investigation of intelligent strategies by means of the use of machine learning in the robots, to propose original solutions to allow contributions in three challenges of the robotic research area: localization, navigation and coordination of groups of robots. The investigations about localization and groups of robots show novel and original proposals, where we sought to extend the state of the art. The navigation part has as its major objective to be a link between the subjects of localization and navigation, being its aim to help the deployment of a autonomous vehicle implying in greater technical advances. Related to the robotic group coordination, we have made the choice to work on an application modeled as a wildfire combat operation. We have developed a simulation environment in which we have evaluated four techniques to obtain strategies for the group formation: genetic algorithms, particle swarm optimization, hill climbing and simulated annealing. The v results showed that we can have very different accuracy with different techniques and sets of parameters. Furthermore, we show how a heuristic based on the use of past populations can assist in fault tolerant operation. Related to the autonomous navigation task, we present the development of a large autonomous vehicle capable of operating in outdoor environments. We sought to optimize an architecture for autonomous navigation based on monocular vision and with the ability to follow scattered points of GPS.We show how the use of simulation and small robots could assist in the development of large vehicle. Furthermore, we show how neural networks can be applied as a controller to autonomous navigation systems. In the investigation about localization, we presented a method using wireless networks to provide information about localization to mobile robots. The information gathered by the wireless network is used as input in an artificial neural network which learns the position of the robot. Several evaluations were carried out in order to understand the behavior of the proposed system, as using different topologies, different numbers of access points and the use of filters. Results showed that the proposed system, using wireless networks and neural networks, may be a useful and easy to use solution for localization of mobile robots. This thesis has addressed original and relevant topics related to the proposed objectives, showing methods to allow degrees of autonomy in robotic operations. The search for higher degrees of efficiency in tasks solving in dynamic environments is still a field that lacks solutions. Therefore, this study sought to add several scientific contributions in the autonomous mobile robots research area and coordination of groups, by means of the application of intelligent strategies Aprendizado de máquina Grupos de robôs Localização Navegação autônoma Robôs móveis autônomos Autonomous mobile robots Autonomous navigation Localization Machine learning Multi-robot systems

Search results