Global ETD Search

191	Active learning with applications to the diagnosis of parasites / Aprendizado ativo com aplicações ao diagnóstico de parasitos Saito, Priscila Tiemi Maeda, 1985- 25 August 2018 (has links) Orientadores: Alexandre Xavier Falcão, Pedro Jussieu de Rezende / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-25T09:02:17Z (GMT). No. of bitstreams: 1 Saito_PriscilaTiemiMaeda_D.pdf: 19630078 bytes, checksum: 429701e7f944ad5a4549de98e4279844 (MD5) Previous issue date: 2014 / Resumo: Conjuntos de imagens têm crescido consideravelmente com o rápido avanço de inúmeras tecnologias de imagens, demandando soluções urgentes para o processamento, organização e recuperação da informação. O processamento, neste caso, objetiva anotar uma dada imagem atribuindo-na um rótulo que representa seu conteúdo semântico. A anotação é crucial para a organizaçao e recuperação efetiva da informação relacionada às imagens. No entanto, a anotação manual é inviável em grandes conjuntos de dados. Além disso, a anotação automática bem sucedida por um classificador de padrões depende fortemente da qualidade de um conjunto de treinamento reduzido. Técnicas de aprendizado ativo têm sido propostas para selecionar, a partir de um grande conjunto, amostras de treinamento representativas, com uma sugestão de rótulo que pode ser confirmado ou corrigido pelo especialista. Apesar disso, essas técnicas muitas vezes ignoram a necessidade de tempos de resposta interativos durante o processo de aprendizado ativo. Portanto, esta tese de doutorado apresenta métodos de aprendizado ativo que podem reduzir e/ou organizar um grande conjunto de dados, tal que a fase de seleção não requer reprocessá-lo inteiramente a cada iteração do aprendizado. Além disso, tal seleção pode ser interrompida quando o número de amostras desejadas, a partir do conjunto de dados reduzido e organizado, é identificado. Os métodos propostos mostram um progresso cada vez maior, primeiro apenas com a redução de dados, e em seguida com a subsequente organização do conjunto reduzido. Esta tese também aborda um problema real --- o diagnóstico de parasitos --- em que a existência de uma classe diversa (isto é, uma classe de impureza), com tamanho muito maior e amostras que são similares a alguns tipos de parasitos, torna a redução de dados consideravelmente menos eficaz. Este problema é finalmente contornado com um tipo de organização de dados diferente, que ainda permite tempos de resposta interativos e produz uma abordagem de aprendizado ativo melhor e robusta para o diagnóstico de parasitos. Os métodos desenvolvidos foram extensivamente avaliados com diferentes tipos de classificadores supervisionados e não-supervisionados utilizando conjunto de dados a partir de aplicações distintas e abordagens baselines que baseiam-se em seleção aleatória de amostras e/ou reprocessamento de todo o conjunto de dados a cada iteração do aprendizado. Por fim, esta tese demonstra que outras melhorias são obtidas com o aprendizado semi-supervisionado / Abstract: Image datasets have grown large with the fast advances and varieties of the imaging technologies, demanding urgent solutions for information processing, organization, and retrieval. Processing here aims to annotate the image by assigning to it a label that represents its semantic content. Annotation is crucial for the effective organization and retrieval of the information related to the images. However, manual annotation is unfeasible in large datasets and successful automatic annotation by a pattern classifier strongly depends on the quality of a much smaller training set. Active learning techniques have been proposed to select those representative training samples from the large dataset with a label suggestion, which can be either confirmed or corrected by the expert. Nevertheless, these techniques very often ignore the need for interactive response times during the active learning process. Therefore, this PhD thesis presents active learning methods that can reduce and/or organize the large dataset such that sample selection does not require to reprocess it entirely at every learning iteration. Moreover, it can be interrupted as soon as a desired number of samples from the reduced and organized dataset is identified. These methods show an increasing progress, first with data reduction only, and then with subsequent organization of the reduced dataset. However, the thesis also addresses a real problem --- the diagnosis of parasites --- in which the existence of a diverse class (i.e., the impurity class), with much larger size and samples that are similar to some types of parasites, makes data reduction considerably less effective. The problem is finally circumvented with a different type of data organization, which still allows interactive response times and yields a better and robust active learning approach for the diagnosis of parasites. The methods have been extensively assessed with different types of unsupervised and supervised classifiers using datasets from distinct applications and baseline approaches that rely on random sample selection and/or reprocess the entire dataset at each learning iteration. Finally, the thesis demonstrates that further improvements are obtained with semi-supervised learning / Doutorado / Ciência da Computação / Doutora em Ciência da Computação Aprendizado de máquina Inteligência artificial Reconhecimento de padrões Análise de imagem Machine learning Artificial intelligence Pattern recognition Image analysis Parasites - Diagnosis
192	Semi-supervised learning with graphs methods using signal processing = Métodos de aprendizado semi-supervisionado com grafos usando processamento de sinais / Métodos de aprendizado semi-supervisionado com grafos usando processamento de sinais Chávez Escalante, Diego Alonso, 1988- 25 August 2018 (has links) Orientador: Siome Klein Goldenstein / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-25T19:49:49Z (GMT). No. of bitstreams: 1 ChavezEscalante_DiegoAlonso_M.pdf: 1954210 bytes, checksum: c9a77d2f0545d5517700c34dd6cf3324 (MD5) Previous issue date: 2014 / Resumo: No aprendizado de máquina, os problemas de classificação de padrões eram tradicionalmente abordados por algoritmos de aprendizado supervisionado que utilizam apenas dados rotulados para treinar-se. Entretanto, os dados rotulados são realmente difíceis de coletar em muitos domínios de problemas, enquanto os dados não rotulados são geralmente mais fáceis de recolher. Também em aprendizado de máquina só o aprendizado não supervisionado é capaz de aprender a topologia e propriedades de um conjunto de dados não rotulados. Portanto, a fim de conseguir uma classificação utilizando o conhecimento a partir de dados rotulados e não rotulados, é necessário o uso de conceitos de aprendizado supervisionado tanto como do não supervisionado. Este tipo de aprendizagem é chamado de aprendizado semi-supervisionado, que declara ter construído melhores classificadores que o tradicional aprendizado supervisionado em algumas condições especificas, porque não só aprende dos dados rotulados, mas também das propriedades naturais dos dados não rotulados como por exemplo a distribuição espacial deles. O aprendizado semi-supervisionado apresenta uma ampla coleção de métodos e técnicas para classificação, e um dos mais interessantes e o aprendizado semi-supervisionado baseado em grafos, o qual modela o problema da classificação semi-supervisionada utilizando a teoria dos grafos. Mas um problema que surge a partir dessa técnica é o custo para treinar conjuntos com grandes quantidades de dados, de modo que o desenvolvimento de algoritmos escaláveis e eficientes de aprendizado semi-supervisionado baseado em grafos e um problema muito interessante e prometedor para lidar com ele. Desta pesquisa foram desenvolvidos dois algoritmos, um para a construção do grafo usando redes neurais não supervisionadas e outro para a regularização do grafo usando processamento de sinais em grafos, especificamente usando filtros de resposta finita sobre o grafo. As duas soluções mostraram resultados comparáveis com os da literatura / Abstract: In machine learning, classification problems were traditionally addressed by supervised learning algorithms, which only use labeled data for training. However, labeled data in many problem domains are really hard to collect, while unlabeled data are usually easy to collect. Also, in machine learning, only unsupervised learning is capable to learn the topology and properties of a set of unlabeled data. In order to do a classification using knowledge from labeled and unlabeled data, it is necessary to use concepts from both supervised and unsupervised learning. This type of learning is called semi-supervised learning, which has claimed to build better classifiers than the traditional supervised learning in some specific conditions, because it does not only learn from the labeled data, but also from the natural properties of unlabeled data as for example spatial distribution. Semi-supervised learning presents a broad collection of methods and techniques for classification. Among them there is graph based semi-supervised learning, which model the problem of semi-supervised classification using graph theory. One problem that arises from this technique is the cost for training large data sets, so the development of scalable and efficient algorithms for graph based semi-supervised learning is a interesting and promising problem to deal with. From this research we developed two algorithms, one for graph construction using unsupervised neural networks; and other for graph regularization using graph signal processing theory, more specifically using FIR filters over a graph. Both solutions showed comparable performance to other literature methods in terms of accuracy / Mestrado / Ciência da Computação / Mestre em Ciência da Computação Aprendizado de máquina Processamento de sinais Algoritmos em grafos Redes neurais (Computação) Machine learning Signal processing Graph algorithms Neural networks (Computer science)
193	A unified framework for design, deployment, execution, and recommendation of machine learning experiments = Uma ferramenta unificada para projeto, desenvolvimento, execução e recomendação de experimentos de aprendizado de máquina / Uma ferramenta unificada para projeto, desenvolvimento, execução e recomendação de experimentos de aprendizado de máquina Werneck, Rafael de Oliveira, 1989- 25 August 2018 (has links) Orientadores: Ricardo da Silva Torres, Anderson de Rezende Rocha / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-25T19:48:27Z (GMT). No. of bitstreams: 1 Werneck_RafaeldeOliveira_M.pdf: 2395829 bytes, checksum: 8f190aeb6dbafb841d0c03f7d7099041 (MD5) Previous issue date: 2014 / Resumo: Devido ao grande crescimento do uso de tecnologias para a aquisição de dados, temos que lidar com grandes e complexos conjuntos de dados a fim de extrair conhecimento que possa auxiliar o processo de tomada de decisão em diversos domínios de aplicação. Uma solução típica para abordar esta questão se baseia na utilização de métodos de aprendizado de máquina, que são métodos computacionais que extraem conhecimento útil a partir de experiências para melhorar o desempenho de aplicações-alvo. Existem diversas bibliotecas e arcabouços na literatura que oferecem apoio à execução de experimentos de aprendizado de máquina, no entanto, alguns não são flexíveis o suficiente para poderem ser estendidos com novos métodos, além de não oferecerem mecanismos que permitam o reuso de soluções de sucesso concebidos em experimentos anteriores na ferramenta. Neste trabalho, propomos um arcabouço para automatizar experimentos de aprendizado de máquina, oferecendo um ambiente padronizado baseado em workflow, tornando mais fácil a tarefa de avaliar diferentes descritores de características, classificadores e abordagens de fusão em uma ampla gama de tarefas. Também propomos o uso de medidas de similaridade e métodos de learning-to-rank em um cenário de recomendação, para que usuários possam ter acesso a soluções alternativas envolvendo experimentos de aprendizado de máquina. Nós realizamos experimentos com quatro medidas de similaridade (Jaccard, Sorensen, Jaro-Winkler e baseada em TF-IDF) e um método de learning-to-rank (LRAR) na tarefa de recomendar workflows modelados como uma sequência de atividades. Os resultados dos experimentos mostram que a medida Jaro-Winkler obteve o melhor desempenho, com resultados comparáveis aos observados para o método LRAR. Em ambos os casos, as recomendações realizadas são promissoras, e podem ajudar usuários reais em diferentes tarefas de aprendizado de máquina / Abstract: Due to the large growth of the use of technologies for data acquisition, we have to handle large and complex data sets in order to extract knowledge that can support the decision-making process in several domains. A typical solution for addressing this issue relies on the use of machine learning methods, which are computational methods that extract useful knowledge from experience to improve performance of target applications. There are several libraries and frameworks in the literature that support the execution of machine learning experiments. However, some of them are not flexible enough for being extended with novel methods and they do not support reusing of successful solutions devised in previous experiments made in the framework. In this work, we propose a framework for automating machine learning experiments that provides a workflow-based standardized environment and makes it easy to evaluate different feature descriptors, classifiers, and fusion approaches in a wide range of tasks. We also propose the use of similarity measures and learning-to-rank methods in a recommendation scenario, in which users may have access to alternative machine learning experiments. We performed experiments with four similarity measures (Jaccard, Sorensen, Jaro-Winkler, and a TF-IDF-based measure) and one learning-to-rank method (LRAR) in the task of recommending workflows modeled as a sequence of activities. Experimental results show that Jaro-Winkler yields the highest effectiveness performance with comparable results to those observed for LRAR. In both cases, the recommendations performed are very promising and might help real-world users in different daily machine learning tasks / Mestrado / Ciência da Computação / Mestre em Ciência da Computação Aprendizado de máquina Ciência - Experiências Fluxo de trabalho Machine learning Science - Experiments Workflow
194	Diabetic retinopathy image quality assessment, detection, screening and referral = Análise de qualidade, detecção de lesões de retinopatia diabética, triagem e verificação de necessidade de consulta a partir de imagens de retina / Análise de qualidade, detecção de lesões de retinopatia diabética, triagem e verificação de necessidade de consulta a partir de imagens de retina Pires, Ramon, 1989- 23 August 2018 (has links) Orientador: Anderson de Rezende Rocha / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-23T17:47:21Z (GMT). No. of bitstreams: 1 Pires_Ramon_M.pdf: 4429324 bytes, checksum: 4e4015bc2131a1f1a5e8aa215f24d98f (MD5) Previous issue date: 2013 / Resumo: A Retinopatia Diabética (RD), complicação provocada pela diabetes, se manifesta por meio de diferentes lesões que possuem suas especificidades. Estas especificidades são exploradas na literatura como estratégia para representação, proporcionando uma discriminação satisfatória entre imagens de pacientes normais e doentes. No entanto, por estarem fortemente atrelada _as características visuais de cada anomalia, a detecção de lesões distintas exige abordagens distintas. Neste trabalho, apresentamos um arcabouço geral cujo objetivo é automatizar o procedimento de análise de imagens de fundo de olho. O trabalho é dividido em quatro etapas: avaliação de qualidade, detecção de lesões individuais, triagem e verificação de necessidade de consulta. Na primeira etapa, aplicamos diferentes técnicas de caracterização de imagens para avaliar a qualidade das imagens por meio de dois critérios: definição de campo e detecção de borramentos. Na segunda etapa deste trabalho, propomos a continuação de um trabalho anterior desenvolvido pelo nosso grupo, no qual foi aplicado um método unificado na tentativa de detecção de lesões distintas. No nosso método para detecção de qualquer lesão, exploramos diferentes alternativas de representação em baixo nível (extração densa e esparsa) e médio nível (técnicas de coding/pooling para sacolas de palavras visuais) objetivando o desenvolvimento de um conjunto eficaz de detectores de lesões individuais. As pontuações provenientes de cada detector de lesão, obtidas para cada imagem, representam uma descrição de alto nível, ponto fundamental para a terceira e a quarta etapas. Tendo em mãos um conjunto de dados descritos em alto nível (pontuações dos detectores individuais), propomos, na terceira etapa do trabalho, a aplicação de técnicas de fusão de dados para o desenvolvimento de um método de detecção de múltiplas lesões. A descrição em alto nível também é explorada na quarta etapa para o desenvolvimento de um método eficaz de avaliação de necessidade de encaminhamento a um oftalmologista no intervalo de um ano, visando evitar que o médico seja sobrecarregado, bem como dar prioridade a pacientes em estado urgente / Abstract: Diabetic Retinopathy (DR), a common complication caused by diabetes, manifests through deferent lesions that have their particularities. These particularities are explored in the literature as methods for representation, providing a satisfactory discrimination between healthy/diseased retinas. However, by being strongly linked to the visual characteristics of each anomaly, the detection of distinct lesions requires distinct approaches. In this work, we present a general framework whose objective is to automate the eye-fundus image analysis. The work comprises four steps: image quality assessment, DR-related lesion detection, screening, and referral. In the first step, we apply characterization techniques to assess image quality by two criteria: field definition and blur detection. In the second step of this work, we extend up a previous work of our group which explored a unified method for detecting distinct lesions in eye-fundus images. In our approach for detection of any lesion, we explore several alternatives for low-level (dense and sparse extraction) and mid-level (coding/pooling techniques of bag of visual words) representations, aiming at the development of an effective set of individual DR-related lesion detectors. The scores derived from each individual DR-related lesion, taken for each image, represent a high-level description, fundamental point for the third and fourth steps. Given a dataset described in high-level (scores from the individual detectors), we propose, in the third step of the work, the use of machine learning fusion techniques aiming at the development of a multi-lesion detection method. The high-level description is also explored in the fourth step for the development of an effective method for evaluating the necessity of referral of a patient to an ophthalmologist in the interval of one year, avoiding overloading medical specialist with simple cases as well as give priority to patients in an urgent state / Mestrado / Ciência da Computação / Mestre em Ciência da Computação Retinopatia diabética Aprendizado de máquina Visão por computador Fusão de classificadores Diabetic retinopathy Machine learning Computer vision Classifier fusion
195	Uma arquitetura híbrida aplicada em problemas de aprendizagem por reforço / A hybrid architecture to address reinforcement learning problems Arruda, Rodrigo Lopes Setti de 02 July 2012 (has links) Orientador: Fernando José Von Zuben / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-20T00:09:41Z (GMT). No. of bitstreams: 1 Arruda_RodrigoLopesSettide_M.pdf: 2295891 bytes, checksum: 4f5f4bc8f219b0c3c27239520027d496 (MD5) Previous issue date: 2012 / Resumo: Com o uso de sistemas cognitivos em uma crescente gama de aplicações, criou-se uma grande expectativa e elevada demanda por máquinas cada vez mais autônomas, inteligentes e criativas na solução de problemas reais. Em diversos casos, os desafios demandam capacidade de aprendizado e adaptação. Este trabalho lida com conceitos de aprendizagem por reforço e discorre sobre as principais abordagens de solução e variações de problemas. Em seguida, constrói uma proposta híbrida incorporando outras ideias em aprendizagem de máquina, validando-a com experimentos simulados. Os experimentos permitem apontar as principais vantagens da metodologia proposta, a qual está fundamentada em sua capacidade de lidar com cenários de espaços contínuos e, também, de aprender uma política ótima enquanto segue outra, exploratória. A arquitetura proposta é híbrida, baseada em uma rede neural perceptron multi-camadas acoplada a um aproximador de funções denominado wirefitting. Esta arquitetura é coordenada por um algoritmo adaptativo e dinâmico que une conceitos de programação dinâmica, análise de Monte Carlo, aprendizado por diferença temporal e elegibilidade. O modelo proposto é utilizado para resolver problemas de controle ótimo, por meio de aprendizagem por reforço, em cenários com variáveis contínuas e desenvolvimento não-linear. Duas instâncias diferentes de problemas de controle, reconhecidas na literatura pertinente, são apresentadas e testadas com a mesma arquitetura / Abstract: With the evergrowing use of cognitive systems in various applications, it has been created a high expectation and a large demand for machines more and more autonomous, intelligent and creative in real world problem solving. In several cases, the challenges ask for high adaptive and learning capability. This work deals with the concepts of reinforcement learning, and reasons on the main solution approaches and problem variations. Subsequently, it builds a hybrid proposal incorporating other machine learning ideas, so that the proposal is validated with simulated experiments. The experiments allow to point out the main advantages of the proposed methodology, founded on its capability to handle continuous space environments, and also to learn an optimal policy while following an exploratory policy. The proposed architecture is hybrid in the sense that it is based on a multi-layer perceptron neural network coupled with a function approximator called wire-fitting. The referred architecture is coordinated by a dynamic and adaptive algorithm which merges concepts from dynamic programming, Monte Carlo analysis, temporal difference learning, and eligibility. The proposed model is used to solve optimal control problems, by means of reinforcement learning, in scenarios endowed with continuous variables and nonlinear development. Two different instances of control problems, well discussed in the pertinent literature, are presented and tested with the same architecture / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica Inteligência artificial Aprendizado de máquina Teoria dos autômatos Robótica Robôs móveis Artificial intelligence Machine learning Theory of automata Robotics Mobile robots
196	Revelando as características do nano-ambiente das interfaces entre proteinas / Characteristics of protein interface nano-environment revealed Moraes, Fábio Rogério de, 1984- 20 August 2018 (has links) Orientador: Goran Neshich / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-20T22:35:51Z (GMT). No. of bitstreams: 1 Moraes_FabioRogeriode_D.pdf: 15399723 bytes, checksum: 4f1315f86b2c74d078c5105b299a9750 (MD5) Previous issue date: 2012 / Resumo: Dentro do ambiente celular, há uma variedade de moléculas e a interação entre si regulam praticamente todos os processos necessários e essenciais para a manutenção da vida. Interações entre proteínas estão envolvidas no controle de vários processos intra e intercelulares, como regulação metabólica e da expressão gênica, reconhecimento antígeno-anticorpo etc. que definem as características biológicas do funcionamento da vida entre os diversos organismos. Ao conhecer a interface de interação de uma proteína chave para desenvolvimento de casos patológicos, é possível desenhar drogas com alta especificidade com o sítio de ligação. Para avançar nessa frente, o conhecimento da estrutura proteica é fundamental, porém não suficiente. É necessário conhecermos o sítio de ligação alvo para cada parceiro de interação. Este estudo visa entender as características do nano-ambiente das interfaces proteicas - área através da qual as macromoléculas se comunicam e exercem sua funcionalidade. Propomos utilizar uma abordagem de estudo das características físico-químicas e estruturais dos resíduos formadores de interfaces de complexos conhecidos e com estrutura quaternária resolvida experimentalmente, utilizando um conjunto de dados sem redundância sequencial, extraindo os parâmetros/descritores que descrevem de forma objetiva as diferentes classes de complexos, revelando as características principais sobre interações proteína-proteína. A finalidade deste trabalho é de conhecer os detalhes que definem uma área como interface e aplicá-lo em uma ferramenta preditiva para todas as proteínas com arranjo estrutural conhecido e/ou modelado. Propomos de forma pioneira, o uso de classificadores específicos para cada tipo de aminoácido e independente do uso de descritores sobre conservação de aminoácidos. Resultados obtidos com classificador linear e por ensemble de redes neurais destacam a nossa abordagem, desenhada e aplicada nesta tese, como uma com os melhores indicadores de desempenho na predição precisa dos resíduos de aminoácido na interface entre as abordagens descritas recentemente na literatura. Ainda, enquanto os outros métodos dependem de descritores sobre conservação de aminoácidos, é mostrado aqui que nenhum ganho de desempenho é obtido com a incorporação de tais descritores em nosso modelo classificador. Esse resultado indica que o uso de descritores puramente físico-químicos e estruturais é suficiente para explicar o grau de conservação dos aminoácidos / Abstract: Inside cells, there is a variety of molecules and their interactions regulate virtually all necessary and essential processes to the maintenance of life. Interactions among proteins are involved in the control of several processes within and out of the cell, such as, metabolic and gene expression regulation, anti-body and antigen recognition, etc. that defines biological characteristics of life among many organisms. If the protein interface amino acids of a key protein related to a given pathologic phenomenon are known, it is possible to rationally design drugs with high specificity for a specific binding site. To gain insight in this field, the knowledge of the protein three-dimensional structure is mandatory, but not sufficient. It is also necessary to know the interface between the target protein and its partners. This study focuses in understanding the characteristics of the area through which the macromolecules communicate to each other and exercise their function. Here, it is proposed an approach to study the physicochemical and structural characteristics of the interface forming residues with known quaternary structure (experimentally solved). It was selected a sequence non-redundant dataset and by extracting parameters/descriptors, that objectively describe different complex classes, it was possible to unravel the basic characteristics of protein-protein binding. The goal of this study is to unravel the details that outline a specific area as interface and apply it in a form of a predictive tool for all proteins with known atomic structure. It is proposed by the first time, the use of amino acid specific classifiers regarding amino acid type and free of amino acid conservation attributes. The results obtained here by employing linear and ensemble of neural network classifiers show that, based on purely physicochemical and structural descriptors, it is possible to get precise predictions about interface forming residues in protein-protein assemblies. Comparatively, the method described here retains better performance indicators than the ones recently described in the literature. In addition, we showed that, for our method, adding "conservation" attributes does not induce any performance gain, which is a major difference if compared to other described methods. This result indicates the purely physicochemical and structural descriptors are sufficient to explain how conserved amino acids are / Doutorado / Bioinformatica / Doutor em Genetica e Biologia Molecular Interações proteina-proteina Interface oligomérica Modelos classificadores Aprendizado de máquina Protein-protein interactions Oligomeric interface Classified models Machine learning
197	Evolução, simbiose e hidridismo aplicados a engenharia de sistemas inteligentes modulares : investigações em redes neurais, comites de maquinas e sistemas multiagentes Coelho, Andre Luis Vasconcelos 30 July 2004 (has links) Orientadores : Ivan Luiz Marques Ricarte / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-03T22:22:21Z (GMT). No. of bitstreams: 1 Coelho_AndreLuisVasconcelos_D.pdf: 18304635 bytes, checksum: fac853d8233955f9d02c12608c41455d (MD5) Previous issue date: 2004 / Resumo: Este tratado é de caráter essencialmente empírico e apresenta um estudo sistemático e abrangente em tomo da aplicação de técnicas de Computação Evolutiva para a resolução adaptativa de problemas não-triviais relacionados à disciplina de engenharia de sistemas inteligentes modulares. Os vários experimentos conduzidos e reportados tiveram como motivação maior a avaliação das potencialidades exibidas por algoritmos evolutivos mais rebuscados, inspirados em modelos artificiais de simbiose e hibridismo, tendo como referencial um leque de questões/requisitos pertinentes a sistemas modulares levantados pelo autor. Os domínios-alvo de pesquisa investigados compreendem o desenho customizado de arquiteturas de redes neurais heterogêneas; o projeto automático e hierárquico de ensembles heterogêneas de redes neurais feedforward; a seleção adaptativa de instâncias de máquinas de vetores-suporte para a composição de ensembles de SVMs; a configuração plena de arquiteturas de misturas de especialistas; e a organização emergente de times de agentes autônomos. Outros projetos correlatos ao tema são também brevemente descritos / Abstract: This treaty is of an essentially empirical nature and presents a systematic and encompassing study about the application of Evolutionary Computation techniques towards the adaptive solving of non-trivial problems under the discipline of modular intelligent systems engineering. The series of experiments conducted and reported along the text had as main stimulus the assessment of the potentials behind some advanced evolutionary algorithms, inspired from artificial models of symbiosis and hybridism, with regard to an array of issuesjrequirements pertaining to modular systems raised by the author. The target domains of investigation include the tailored design of heterogeneous neural network architectures; the automatic and hierarchical development of heterogeneous ensembles of feedforward neural networks; the adaptive selection of support vector machine instances for setting up ensembles of SVMs; the entire configuration of mixture of experts architectures; ando the emergent organization of teams made up of autonomous agents. Other correlated projects under the same research umbrella are also succinctly touched upon / Doutorado / Engenharia de Computação / Doutor em Engenharia Elétrica Aprendizado de máquina Agentes inteligentes (Software) Inteligencia artificial distribuida Algoritmos genéticos Redes neurais (Computação) Simbiose Coevolução Hierarquias Cooperação
198	Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina / Data prediction in populational surveys using machine learning techniques Ferreira, Leonardo Zanini 06 February 2018 (has links) Submitted by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-19T14:07:40Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-19T14:45:26Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5) / Made available in DSpace on 2018-04-19T14:45:34Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5) Previous issue date: 2018-02-06 / Sem bolsa / O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável. / Monitoring the development of countries’ health and nutrition indicators rely on accurate and complete data. Low-and middle-income countries depend on populational surveys for decision-making since their information systems are still unreliable. These indicators are health outcomes which point out the status of a maternal and child health intervention, behavior or care. Despite being great sources of information, the populational surveys also lack information which could prevent the creation of these standardized indicators. Machine learning arise as an alternative to fill the gaps found in the surveys based on sociodemographic characteristics and related predictors. This work evaluates the performance of four machine learning techniques (neural networks, decision trees, KNN and XGB) in this task by observing the behavior of two health outcomes in four different samples. The results indicate that a great variation can be found depending on the selected outcome. The availability of those indicators as predictors is also a challenge. The studied machine learning techniques presented a small performance variation between themselves which suggests that the nature of the data is determinant to this kind of application. Still, the first outcomes showed acceptable results for a practical application while the second outcome reached lower estimates compared to those which specialists consider as a reasonable performance. Aprendizado de máquina Desfechos de saúde Inquéritos populacionais de saúde Machine learning Health outcomes Populational health surveys
199	Influência das características mecânicas da entressola e da estrutura do cabedal de calçados esportivos na percepção do conforto e na biomecânica da corrida / Influence of mechanical characteristics of midsale and upper structure af running shaes in the comjort and biamechanics ot running Andrea Naomi Onodera 26 August 2016 (has links) o presente estudo teve por objetivo investigar a influência de duas diferentes resiliências de materiais de amortecimento e de dois tipos de cabedais de calçados esportivos na cinemática e cinética de membro inferior e na percepção do conforto durante a corrida. Também investigamos as possíveis relações entre o conforto percebido e as variáveis biomecânicas capturadas. Para tal, foram avaliados 42 corredores recreacionais adultos, com no mínimo de um ano de experiência em corrida de rua, com mínimo de dois treinos regulares por semana, e com volume de treino semanal superior a 5 km. Foram avaliadas quatro condições de calçados aleatorizadas para cada corredor (material de amortecimento de baixa resiliência e cabedal estruturado, material amortecimento de alta resiliência e cabedal estruturado, material de amortecimento de baixa resiliência e cabedal minimalista, e material amortecimento de alta resiliência e cabedal minimalista). Após avaliação antropométrica e postural do complexo tornozelo/pé, os corredores realizaram corridas em uma pista de 25 metros em laboratório. A avaliação biomecânica foi realizada usando seis câmeras infravermelhas (VICON T-40, Oxford, UK) a 300 Hz, sincronizadas a duas plataformas de força (AMTI BP-600600, Watertown, USA) para aquisição da força reação do solo a 1200 Hz, e palmilhas instrumentas com sensores capacitivos (Pedar X System, Novel, Munique, Alemanha) a 100 Hz. A percepção subjetiva de conforto em cada condição foi avaliada por meio de um questionário de conforto para calçados. As comparações estatísticas entre os calçados foram verificadas por meio de análises de variância (ANOVAs) para medidas repetidas, e correlação de Pearson para verificar as relações entre o conforto e as variáveis biomecânicas (a=O,05). Realizou-se uma análise de Machine Learning para capturar variáveis da série temporal completa das curvas de cinemática e cinética que discriminassem os calçados estudados. Construímos uma matriz de entrada nas dimensões 1080 x 1242 para a análise por Machine learning. Os resultados demonstram que há uma interação entre as condições de cabedal e material de amortecimento que faz com que as comparações de resiliência se comportem de forma distinta para cabedais minimalistas e para cabedais estruturados. Contrariamente ao esperado, para os calçados de cabedal estruturado, as resiliências não foram diferentes entre si, e para o cabedal minimalista, os corredores apresentaram impactos mais altos com o material de baixa resiliência. A estrutura de cabedal influenciou a absorção de impacto, onde o cabedal minimalista apresentou impactos mais altos que o cabedal estruturado. Sobre o conforto, a condição de cabedal minimalista e material de baixa resiliência obteve as piores notas em cinco de nove quesitos do questionário. Em alguns quesitos ele foi o pior avaliado dentre todas as demais condições (como no amortecimento do calcanhar e no conforto geral). O cabedal minimalista recebeu pior avaliação que os cabedais estrutura dos no quesito controle médio-lateral da avaliação de conforto. Observou-se que a correlação entre as variáveis biomecânicas e as variáveis de conforto considerando todos os calçados conjuntamente, apesar de apresentarem valores significativos para algumas associações, foram sempre correlações fracas, abaixo de 30%. Ao se analisar cada condição de calçado isoladamente, em algumas se observou correlação moderada entre as variáveis biomecânicas e o conforto (r >31%, p < O,05), o que não se verificou em outras condições de calçados. Cada calçado gera condições particulares que favorecem ou não a associação entre conforto e repostas biomecânicas. Sobre a análise de Machine Learning, a metodologia foi capaz de diferenciar com sucesso os dois materiais de resiliência diferentes utilizando 200 (16%) variáveis biomecânicas disponíveis com uma precisão de 84,8%, e os dois cabedais com uma precisão de 93,9%. A discriminação da resiliência da entressola resultou em níveis de acurácia mais baixos do que a discriminação dos cabedais de calçados. Em ambos os casos, no entanto, as forças de reação do solo estavam entre as 25 variáveis mais relevantes. As 200 variáveis mais relevantes que discriminaram as duas resiliências estavam distribuídas em curtas janelas de tempo, ao longo de toda série temporal da cinemática e força. Estas janelas corresponderam a padrões individuais de respostas biomecânicas, ou a um grupo de indivíduos que apresentaram as mesmas respostas biomecânicas frente aos diferentes materiais de amortecimento. Como conclusão, destacamos que o cabedal tem maior influência que o material de amortecimento quando se trata da biomecânica da corrida e conforto subjetivo. Nos cabedais estruturados, a resiliência do material da entressola não diferenciou a biomecânica da corrida. A resiliência do material de amortecimento causa efeitos importantes sobre o impacto do calcanhar (menores loading rate, frequência mediana, pico de pressão em retropé) durante a corrida em cabedais com pouca estrutura. Alterações biomecânicas devido à resiliência do material de amortecimento parecem ser dependentes do sujeito, enquanto as relacionadas à estrutura de cabedal parecem ser mais sujeito independente. Sugere-se ter cautela ao afirmar que um calçado mais confortável também gerará respostas positivas biomecânicas, pois as associações entre essas variáveis analisando todos os calçados conjuntamente foram sempre correlações fracas. As correlações moderadas e particulares de cada condição de calçado com determinadas variáveis de conforto nos levam a concluir que os materiais aplicados nos calçado favorecem mais ou menos a percepção de determinada característica de conforto / The aim of this study was to investiga te the influence of two cushioning materiais with different resiliencies and two types of uppers of sportive shoes on kinematics and kinetics of lower limb and on the subjective perception of comfort during running. We also investigated the potential relationship between the perceived comfort and biomechanical variables analyzed. For this purpose, 42 adult recreational runners were evaluated. lhey had at least one year of experience on running, minimum of two regular running workouts per week, and weekly training volume above 5 km. We evaluated four randomized shoes conditions for each athlete (Iow resilience cushioning material and structured upper, high resilience cushioning material and structured upper, low resilience cushioning material and minimalist upper, and high resilience cushioning material and minimalist upper). After anthropometric and postura I assessment of the foot/ankle complex, runners held trials on a 25 meters long indoor track. Biomechanical data were collected by six infrared cameras (VICON l-40, Oxford, UK) at 300 Hz, synchronized with two force platforms (AMll BP-600600, Watertown, USA) at 1200Hz, and in- shoe plantar pressure insoles (Pedar X System, Nove\" Munich, Germany) at 100 Hz. Subjective perception of comfort in each shoe condition was assessed by a questionnaire of footwear comfort. lhe statistical comparisons between the shoes were verified by analysis of variance (ANOVA) for repeated measures and Pearson\'s correlation to verify the relationship between comfort and biomechanical variables (a=0.05). We conducted a Machine Learning analysis to capture variables from the complete kinematics and kinetics time series, which would be able to discriminate the studied footwear. We build an input matrix in the dimensions of 1080 x 1242 for Machine Learning analysis. There was an interaction between the upper structure and the resilience of cushioning material that made comparisons between resiliencies to behave differently for minimal uppers and for structured uppers. Contrary to expectation, for structured uppers, resiliencies were not different from each other, and for the minimal upper, runners had higher impact with the low-resilience material. lhe upper structure influenced the absorption of impact, in which the minimalist upper presented higher impacts than the structured upper. About comfort, minimalist upper condition and low resilience materiais had the worst grades for five of nine questions of the questionnaire. In some questions it was the worst of ali conditions (such as for the comfort in the heel cushioning and overall comfort). lhe minimalist upper received worse assessment than the structured uppers in the question about the mediolateral control. It was observed that the correlation between biomechanical variables and comfort, considering ali shoe conditions together, despite having significant values for some correlations were weak correlations (r <30%, p <0.05). When each shoe condition is analyzed alone, some footwear conditions had moderate correlation between comfort and biomechanical variables (r >31%, p <0.05L although the same behavior was not observed in other shoe conditions. Each shoe represents a specific condition that favor or not the association between comfort and biomechanical responses. On Machine Learning analysis, the method was able to successfully distinguish between the two different resiliencies using 200 (16%) of available biomechanical variables with an accuracy of 84.8%, and between the 2 uppers with an accuracy of 93.9 %. Discrimination of the resiliencies resulted in lower levels of accuracy than the discrimination of shoe uppers. In both cases, however, the ground reaction forces were among the 25 most important features. The 200 most relevant features which discriminate the two resiliencies were distribuited in short time windows along the kinematic and force time series. These windows corresponded to individual biomechanical patterns, or patterns of a group of people with similar behavior. In conclusion, we emphasize that the upper has greater influence than the resilience of cushioning material when it is about biomechanics of running and subjective comfort of the shoes. In structured uppers, the biomechanics did not differenciate the resiliencies of the midsole materiais. The resilience of the cushioning material has important effects on the heel impact (Iower loading rate, median frequency, peak pressure in rearfoot) during running on shoes with little structure on the upper. Biomechanical changes due to the resilience of the cushioning material seems to be dependent on the subject, while related to the upper structure seems to be more independent of the subject. It is suggested to be cautious to affirm that more comfortable footwear will also let to positive biomechanical responses. That is because the correlations between these variables when analyzing ali the footwear together were always weak. Moderate and positive correlations of each shoe condition with some of comfort variables lead us to conclude that the materiais applied on each footwear favors more or less the comfort perception Amortecimento Aprendizado de máquina supervisionada Corrida Fenômenos biomecânicos Percepção Pressão Sapatos Biomechanical phenomena Damping Perception Pressure Running Shoes Supervised machine learning
200	Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento / Active semi-supervised classification based on multiple clustering hierarchies Antônio José de Lima Batista 08 August 2016 (has links) Algoritmos de aprendizado semi-supervisionado ativo podem se configurar como ferramentas úteis em cenários práticos em que os dados são numerosamente obtidos, mas atribuir seus respectivos rótulos de classe se configura como uma tarefa custosa/difícil. A literatura em aprendizado ativo destaca diversos algoritmos, este trabalho partiu do tradicional Hierarchical Sampling estabelecido para operar sobre hierarquias de grupos. As características de tal algoritmo o coloca à frente de outros métodos ativos, entretanto o mesmo ainda apresenta algumas dificuldades. A fim de aprimorá-lo e contornar suas principais dificuldades, incluindo sua sensibilidade na escolha particular de uma hierarquia de grupos como entrada, este trabalho propôs estratégias que possibilitaram melhorar o algoritmo na sua forma original e diante de variantes propostas na literatura. Os experimentos em diferentes bases de dados reais mostraram que o algoritmo proposto neste trabalho é capaz de superar e competir em qualidade dentro do cenário de classificação ativa com outros algoritmos ativos da literatura. / Active semi-supervised learning can play an important role in classification scenarios in which labeled data are laborious and/or expensive to obtain, while unlabeled data are numerous and can be easily acquired. There are many active algorithms in the literature and this work focuses on an active semi-supervised algorithm that can be driven by clustering hierarchy, the well-known Hierarchical Sampling (HS) algorithm. This work takes as a starting point the original Hierarchical Sampling algorithm and perform changes in different aspects of the original algorithm in order to tackle its main drawbacks, including its sensitivity to the choice of a single particular hierarchy. Experimental results over many real datasets show that the proposed algorithm performs superior or competitive when compared to a number of state-of-the-art algorithms for active semi-supervised classification. Aprendizado ativo Aprendizado de máquina Hierarquia de grupos. Active learning Active semi-supervised classification Clustering hierarchies. Machine learning

Search results