Global ETD Search

1	Recolha e tratamento de dados biométricos para a classificação de emoções Teixeira, Jorge Filipe Pinheiro Guerra de Ribeiro January 2008 (has links) Tese de mestrado integrado. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2008 Biometria Classificação de dados Biomonitorização
2	Data classification with neural networks and entropic criteria Santos, Jorge Manuel Fernandes dos January 2007 (has links) Tese de doutoramento. Ciências de Engenharia. 2007. Faculdade de Engenharia. Universidade do Porto, Universidade da Beira Interior Classificação de dados Redes neuronais Entropia
3	Evolutionary ensembles for imbalanced learning / Comitês evolucionários para aprendizado desbalanceado Fernandes, Everlandio Rebouças Queiroz 13 August 2018 (has links) In many real classification problems, the data set used for model induction is significantly imbalanced. This occurs when the number of examples of some classes is much lower than the other classes. Imbalanced datasets can compromise the performance of most classical classification algorithms. The classification models induced by such datasets usually present a strong bias towards the majority classes, tending to classify new instances as belonging to these classes. A commonly adopted strategy for dealing with this problem is to train the classifier on a balanced sample from the original dataset. However, this procedure can discard examples that could be important for a better class discrimination, reducing classifier efficiency. On the other hand, in recent years several studies have shown that in different scenarios the strategy of combining several classifiers into structures known as ensembles has proved to be quite effective. This strategy has led to a stable predictive accuracy and, in particular, to a greater generalization ability than the classifiers that make up the ensemble. This generalization power of classifier ensembles has been the focus of research in the imbalanced learning field in order to reduce the bias toward the majority classes, despite the complexity involved in generating efficient ensembles. Optimization meta-heuristics, such as evolutionary algorithms, have many applications for ensemble learning, although they are little used for this purpose. For example, evolutionary algorithms maintain a set of possible solutions and diversify these solutions, which helps to escape out of the local optimal. In this context, this thesis investigates and develops approaches to deal with imbalanced datasets, using ensemble of classifiers induced by samples taken from the original dataset. More specifically, this theses propose three solutions based on evolutionary ensemble learning and a fourth proposal that uses a pruning mechanism based on dominance ranking, a common concept in multiobjective evolutionary algorithms. Experiments showed the potential of the developed solutions. / Em muitos problemas reais de classificação, o conjunto de dados usado para a indução do modelo é significativamente desbalanceado. Isso ocorre quando a quantidade de exemplos de algumas classes é muito inferior às das outras classes. Conjuntos de dados desbalanceados podem comprometer o desempenho da maioria dos algoritmos clássicos de classificação. Os modelos de classificação induzidos por tais conjuntos de dados geralmente apresentam um forte viés para as classes majoritárias, tendendo classificar novas instâncias como pertencentes a essas classes. Uma estratégia comumente adotada para lidar com esse problema, é treinar o classificador sobre uma amostra balanceada do conjunto de dados original. Entretanto, esse procedimento pode descartar exemplos que poderiam ser importantes para uma melhor discriminação das classes, diminuindo a eficiência do classificador. Por outro lado, nos últimos anos, vários estudos têm mostrado que em diferentes cenários a estratégia de combinar vários classificadores em estruturas conhecidas como comitês tem se mostrado bastante eficaz. Tal estratégia tem levado a uma acurácia preditiva estável e principalmente a apresentar maior habilidade de generalização que os classificadores que compõe o comitê. Esse poder de generalização dos comitês de classificadores tem sido foco de pesquisas no campo de aprendizado desbalanceado, com o objetivo de diminuir o viés em direção as classes majoritárias, apesar da complexidade que envolve gerar comitês de classificadores eficientes. Meta-heurísticas de otimização, como os algoritmos evolutivos, têm muitas aplicações para o aprendizado de comitês, apesar de serem pouco usadas para este fim. Por exemplo, algoritmos evolutivos mantêm um conjunto de soluções possíveis e diversificam essas soluções, o que auxilia na fuga dos ótimos locais. Nesse contexto, esta tese investiga e desenvolve abordagens para lidar com conjuntos de dados desbalanceados, utilizando comitês de classificadores induzidos a partir de amostras do conjunto de dados original por meio de metaheurísticas. Mais especificamente, são propostas três soluções baseadas em aprendizado evolucionário de comitês e uma quarta proposta que utiliza um mecanismo de poda baseado em ranking de dominância, conceito comum em algoritmos evolutivos multiobjetivos. Experimentos realizados mostraram o potencial das soluções desenvolvidas. Algoritmos evolutivos Aprendizado desbalanceado Classificação de dados Comitê de classificadores Data classification Ensemble of classifiers Evolutionary algorithms Imbalanced learning
4	Evolutionary ensembles for imbalanced learning / Comitês evolucionários para aprendizado desbalanceado Everlandio Rebouças Queiroz Fernandes 13 August 2018 (has links) In many real classification problems, the data set used for model induction is significantly imbalanced. This occurs when the number of examples of some classes is much lower than the other classes. Imbalanced datasets can compromise the performance of most classical classification algorithms. The classification models induced by such datasets usually present a strong bias towards the majority classes, tending to classify new instances as belonging to these classes. A commonly adopted strategy for dealing with this problem is to train the classifier on a balanced sample from the original dataset. However, this procedure can discard examples that could be important for a better class discrimination, reducing classifier efficiency. On the other hand, in recent years several studies have shown that in different scenarios the strategy of combining several classifiers into structures known as ensembles has proved to be quite effective. This strategy has led to a stable predictive accuracy and, in particular, to a greater generalization ability than the classifiers that make up the ensemble. This generalization power of classifier ensembles has been the focus of research in the imbalanced learning field in order to reduce the bias toward the majority classes, despite the complexity involved in generating efficient ensembles. Optimization meta-heuristics, such as evolutionary algorithms, have many applications for ensemble learning, although they are little used for this purpose. For example, evolutionary algorithms maintain a set of possible solutions and diversify these solutions, which helps to escape out of the local optimal. In this context, this thesis investigates and develops approaches to deal with imbalanced datasets, using ensemble of classifiers induced by samples taken from the original dataset. More specifically, this theses propose three solutions based on evolutionary ensemble learning and a fourth proposal that uses a pruning mechanism based on dominance ranking, a common concept in multiobjective evolutionary algorithms. Experiments showed the potential of the developed solutions. / Em muitos problemas reais de classificação, o conjunto de dados usado para a indução do modelo é significativamente desbalanceado. Isso ocorre quando a quantidade de exemplos de algumas classes é muito inferior às das outras classes. Conjuntos de dados desbalanceados podem comprometer o desempenho da maioria dos algoritmos clássicos de classificação. Os modelos de classificação induzidos por tais conjuntos de dados geralmente apresentam um forte viés para as classes majoritárias, tendendo classificar novas instâncias como pertencentes a essas classes. Uma estratégia comumente adotada para lidar com esse problema, é treinar o classificador sobre uma amostra balanceada do conjunto de dados original. Entretanto, esse procedimento pode descartar exemplos que poderiam ser importantes para uma melhor discriminação das classes, diminuindo a eficiência do classificador. Por outro lado, nos últimos anos, vários estudos têm mostrado que em diferentes cenários a estratégia de combinar vários classificadores em estruturas conhecidas como comitês tem se mostrado bastante eficaz. Tal estratégia tem levado a uma acurácia preditiva estável e principalmente a apresentar maior habilidade de generalização que os classificadores que compõe o comitê. Esse poder de generalização dos comitês de classificadores tem sido foco de pesquisas no campo de aprendizado desbalanceado, com o objetivo de diminuir o viés em direção as classes majoritárias, apesar da complexidade que envolve gerar comitês de classificadores eficientes. Meta-heurísticas de otimização, como os algoritmos evolutivos, têm muitas aplicações para o aprendizado de comitês, apesar de serem pouco usadas para este fim. Por exemplo, algoritmos evolutivos mantêm um conjunto de soluções possíveis e diversificam essas soluções, o que auxilia na fuga dos ótimos locais. Nesse contexto, esta tese investiga e desenvolve abordagens para lidar com conjuntos de dados desbalanceados, utilizando comitês de classificadores induzidos a partir de amostras do conjunto de dados original por meio de metaheurísticas. Mais especificamente, são propostas três soluções baseadas em aprendizado evolucionário de comitês e uma quarta proposta que utiliza um mecanismo de poda baseado em ranking de dominância, conceito comum em algoritmos evolutivos multiobjetivos. Experimentos realizados mostraram o potencial das soluções desenvolvidas. Algoritmos evolutivos Aprendizado desbalanceado Classificação de dados Comitê de classificadores Data classification Ensemble of classifiers Evolutionary algorithms Imbalanced learning
5	Meta-aprendizagem aplicada à classificação de dados de expressão gênica / Meta-learning applied to gene expression data classification Souza, Bruno Feres de 26 October 2010 (has links) Dentre as aplicações mais comuns envolvendo microarrays, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta da ocorrência de câncer. Essa classificação é realizada com a ajuda de algoritmos de Aprendizagem de Máquina. A escolha do algoritmo mais adequado para um dado problema não é trivial. Nesta tese de doutorado, estudou-se a utilização de meta-aprendizagem como uma solução viável. Os resultados experimentais atestaram o sucesso da aplicação utilizando um arcabouço padrão para caracterização dos dados e para a construção da recomendação. A partir de então, buscou-se realizar melhorias nesses dois aspectos. Inicialmente, foi proposto um novo conjunto de meta-atributos baseado em índices de validação de agrupamentos. Em seguida, estendeu-se o método de construção de rankings kNN para ponderar a influência dos vizinhos mais próximos. No contexto de meta-regressão, introduziu-se o uso de SVMs para estimar o desempenho de algoritmos de classificação. Árvores de decisão também foram empregadas para a construção da recomendação de algoritmos. Ante seu desempenho inferior, empregou-se um esquema de comitês de árvores, que melhorou sobremaneira a qualidade dos resultados / Among the most common applications involving microarray, one can highlight the classification of tissue samples, which is essential for the correct identification of the occurrence of cancer and its type. This classification takes place with the aid of machine learning algorithms. Choosing the best algorithm for a given problem is not trivial. In this thesis, we studied the use of meta-learning as a viable solution. The experimental results confirmed the success of the application using a standard framework for characterizing data and constructing the recommendation. Thereafter, some improvements were made in these two aspects. Initially, a new set of meta-attributes was proposed, which are based on cluster validation indices. Then the kNN method for ranking construction was extended to weight the influence of nearest neighbors. In the context of meta-regression, the use of SVMs was introduced to estimate the performance of ranking algorithms. Decision trees were also employed for recommending algorithms. Due to their low performance, a ensemble of trees was employed, which greatly improved the quality of results Aprendizagem de máquina Gene expression data classification Machine learning Meta-aprendizagem Metalearning
6	Localização de dispositivos móveis usando roteadores com antenas direcionais e classificação de dados Cunha, Atacílio Costa 09 May 2014 (has links) Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-17T14:19:13Z No. of bitstreams: 1 Dissertação - Atacílio Costa Cunha.pdf: 8225097 bytes, checksum: dff40e1008c70b9b5cc749b2a69d8958 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:20:05Z (GMT) No. of bitstreams: 1 Dissertação - Atacílio Costa Cunha.pdf: 8225097 bytes, checksum: dff40e1008c70b9b5cc749b2a69d8958 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:21:34Z (GMT) No. of bitstreams: 1 Dissertação - Atacílio Costa Cunha.pdf: 8225097 bytes, checksum: dff40e1008c70b9b5cc749b2a69d8958 (MD5) / Made available in DSpace on 2015-06-17T20:21:34Z (GMT). No. of bitstreams: 1 Dissertação - Atacílio Costa Cunha.pdf: 8225097 bytes, checksum: dff40e1008c70b9b5cc749b2a69d8958 (MD5) Previous issue date: 2014-05-09 / Não Informada / WiFi Location systems are increasingly present in our days because of the great ease that the devices can provide to users, such as mobility, independence of factors that limit and cause discomfort usability as cables, for example, and also be more convenient for the user to use something easy to handle. Apart from these points, it is known that the WiFi devices are increasingly developed, providing more opportunities for use in the routine of users. WiFi Location Systems perform device or people discovery in a given environment based on power signal measurements obtained by exchanging packets between devices that compose such systems. This paper proposes a Location WiFi method using multiple routers with directional antennas in the location environment. Routers with directional antennas are used in this study due to its ability to limit signal coverage for a given area, unlike systems with omnidirectional antennas. The impact that a packet sent by a device with unknown position generates in directional antennas installed at the location system can provide different RSSI values. Through the system offline stage where the training part is done, a database is created with all RSSI values obtained from each packet received by directional routers and positions from where the packages were sent. This database is used as knowledge for the classification algorithm so that it can estimate from where a package was sent, only based on RSSI values obtained at each directional router. Two classification algorithms were compared in this proposal to analyze the performance characteristics of each one in any location enviroment. They are the algorithms kNN and Naive Bayes, both widely used in the literature. During the the training part of the localization system composed by directional routers, it was also analyzed how to organize the routers to get results with greater location accuracy. Thus, it was possible to analyze the organization of the routers in the location environments, being together and pointing in different directions, and separated and focused to the center of the localization environment. ix Another important point of this proposal is the application of the localization system based on two types of location: Precise Location and Contextual Location. The precise location allows to estimate the exact position of a device in the axes x and y of a particular environment where it is installed. And the contextual location allows to estimate the position of a particular device based on the analysis of the context of the environment where it is inserted. All data collected during the experiments were analyzed and tested, and show that the system proposed in this paper can be used as a WiFi positioning system for indoor environments as an alternative to the system commonly found in the location literature, composed of omnidirectional routers. According to the structure of the location where the system was inserted and the organization of directional routers, it was possible to obtain very similar results compared to the location system composed by omnidirectional routers. This can be seen from the results obtained in a small location environment composed by the ICOMP laboratories where the system with directional routers and data classification from the kNN algorithm, has achieved 84.26% of accuracy in positioning compared with 83.93% achieved with directional routers together using the same classification algorithm. Another interesting point seen in the results of this work is that the use of Naive Bayes algorithm tends to be better when the system uses directional routers rather than omni-directional one. This happens because this algorithm can analyze as the direction of each antenna impacts the characteristics of signal reception in a given environment. This can be seen for example in the results obtained on a larger localization environment composed of ICOMP teachers rooms where the positioning system with scattered directional antennas got 80.16% accuracy in positioning estimation compared with the system composed by omnidirectional antennas that got 71.68%. Thus, we shall show that the tracking systems can be composed of directional routers as an alternative to the WiFi location conventional system. / Os sistemas de Localização WiFi estão cada vez mais presentes no nosso dia-a-dia devido à grande facilidade que os dispositivos utilizados nesta tecnologia podem proporcionar para os usuários, como mobilidade, independência de fatores que limitam e causam desconforto na usabilidade como cabos, por exemplo, e também por ser mais conveniente para o usuário utilizar algo de fácil manuseio. Além destes pontos, sabese que os dispositivos WiFi estão cada vez mais desenvolvidos, proporcionando mais possibilidades de uso no cotidiano dos usuários. Sistemas de Localização WiFi realizam a localização de dispositivos ou pessoas em um determinado ambiente com base em medições de potência de sinal, obtidas através da troca de pacotes entre os dispositivos que compõem tais sistemas. Neste trabalho é proposto um método de Localização WiFi utilizando múltiplos roteadores com antenas direcionais no ambiente de localização. Os roteadores com antenas direcionais são utilizados neste trabalho devido a sua capacidade de limitar a cobertura sinal para uma determinada área, diferente dos sistemas com antenas omnidirecionais. O impacto que um pacote enviado por um dispositivo com posição desconhecida gera nas antenas direcionais do sistema é capaz de proporcionar valores de RSSI diferentes. Através da fase offline do sistema onde é realizado a parte de treinamento, um banco de dados é criado com todos os valores de RSSI obtidos a partir de cada pacote recebido pelos roteadores direcionais e as posições de onde os pacotes foram enviados. Essa base de dados é utilizada como conhecimento para que o algoritmo de classificação possa estimar de onde um pacote foi enviado, somente com base nos valores de RSSI obtidos em cada roteador direcional. Foram comparados dois algoritmos de classifição nesta proposta como forma de analisar as características de comportamento de cada um deles nos ambientes de localização. São eles os algoritmos kNN e Naive Bayes, ambos bastante utilizados na literatura. Durante a experimentação do sistema de localização composto pelos roteadores direcionais, foi analisado também como organizar os roteadores para ser obter resultavii dos com maior precisão de localização. Desta forma, foi possível analisar nos ambientes de localização a organização dos roteadores unidos apontando para direções diferentes, e separados focados para o centro do ambiente de localização. Outro ponto importante desta proposta é a aplicação do sistema de localização com base em dois tipos de localização: Localização Precisa e Localização Contextual. A Localização Precisa permite estimar a posição exata de um dispositivo nos eixos x e y de um determinado ambiente onde ele está instalado. Já a Localização Contextual, permite estimar posição de um determinado dispositivo com base na análise do contexto do ambiente onde ele está inserido. Todos os dados obtidos durante os experimentos foram analisados e testados, e demonstram que o sistema proposto neste trabalho pode ser utilizado como sistema de localização WiFi para ambientes internos como alternativa do sistema comumente de localização encontrado na literatura, composto por roteadores omnidirecionais. Conforme a estrutura do ambiente de localização onde o sistema estava inserido e a organização dos roteadores direcionais foi possível obter resultados bem semelhantes ao do sistema de localização convecional composto por roteadores omnidirecionais. Isto pode ser visto nos resultados obtidos em um ambiente pequeno de localização composto pelos laboratórios do IComp onde, com roteadores direcionais e classifição de dados a partir do algoritmo kNN, foi possível obter 84,26% de precisão na localização comparada com 83,93% conseguida com roteadores direcionais juntos utilizando o mesmo algoritmo de classifição. Outro ponto interessante visto nos resultados deste trabalho é a utilização do algoritmo Naive Bayes tende a ser melhor para o sistema quando o mesmo utiliza roteadores direcionais ao invés de omnidirecionais, já que este algoritmo consegue analisar como o direcionamento de cada antena impacta nas características de recepção de sinal em um determinado ambiente. Isto pode ser visto por exemplo nos resultados obtidos em um ambiente maior de localização composto pelas salas de professores do IComp onde o sistema de localização com antenas direcionais espalhadas obteve 80,16% de precisão na estimativa de localização comparado com o sistema composto por antenas omnidirecionais que obteve 71,68%. Com isto, pretende-se mostrar que os sistemas de localização podem ser compostos por roteadores direcionais como alternativa para o sistema convecional de localização WiFi. Localização WiFi Classificação de dados WiFi Location
7	Meta-aprendizagem aplicada à classificação de dados de expressão gênica / Meta-learning applied to gene expression data classification Bruno Feres de Souza 26 October 2010 (has links) Dentre as aplicações mais comuns envolvendo microarrays, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta da ocorrência de câncer. Essa classificação é realizada com a ajuda de algoritmos de Aprendizagem de Máquina. A escolha do algoritmo mais adequado para um dado problema não é trivial. Nesta tese de doutorado, estudou-se a utilização de meta-aprendizagem como uma solução viável. Os resultados experimentais atestaram o sucesso da aplicação utilizando um arcabouço padrão para caracterização dos dados e para a construção da recomendação. A partir de então, buscou-se realizar melhorias nesses dois aspectos. Inicialmente, foi proposto um novo conjunto de meta-atributos baseado em índices de validação de agrupamentos. Em seguida, estendeu-se o método de construção de rankings kNN para ponderar a influência dos vizinhos mais próximos. No contexto de meta-regressão, introduziu-se o uso de SVMs para estimar o desempenho de algoritmos de classificação. Árvores de decisão também foram empregadas para a construção da recomendação de algoritmos. Ante seu desempenho inferior, empregou-se um esquema de comitês de árvores, que melhorou sobremaneira a qualidade dos resultados / Among the most common applications involving microarray, one can highlight the classification of tissue samples, which is essential for the correct identification of the occurrence of cancer and its type. This classification takes place with the aid of machine learning algorithms. Choosing the best algorithm for a given problem is not trivial. In this thesis, we studied the use of meta-learning as a viable solution. The experimental results confirmed the success of the application using a standard framework for characterizing data and constructing the recommendation. Thereafter, some improvements were made in these two aspects. Initially, a new set of meta-attributes was proposed, which are based on cluster validation indices. Then the kNN method for ranking construction was extended to weight the influence of nearest neighbors. In the context of meta-regression, the use of SVMs was introduced to estimate the performance of ranking algorithms. Decision trees were also employed for recommending algorithms. Due to their low performance, a ensemble of trees was employed, which greatly improved the quality of results Aprendizagem de máquina Meta-aprendizagem Gene expression data classification Machine learning Metalearning
8	Sistema de aprendizado reconfigurável para classificação de dados utilizando processamento paralelo / Reconfigurable learning system for classification of data using parallel processing Moreira, Eduardo Marmo 07 May 2014 (has links) Esta tese apresenta a arquitetura de um sistema de aprendizado, com um escalonador de tarefas que possibilita a utilização de vários métodos de classificação e validação, permitindo a distribuição dessas tarefas entre os módulos do sistema. Esta arquitetura está estruturada de forma que classificações obtidas através de uma técnica sejam reutilizadas em paralelo pelo mesmo algoritmo ou por outras técnicas, produzindo novas classificações através do refinamento dos resultados alcançados e ampliando o uso em bases de dados com características diferentes. O sistema foi estruturado em quatro partes denominadas, respectivamente, Módulo de Inicialização, Módulo de Validação, Módulo de Refinamento e Módulo Especial de Escalonamento. Em cada módulo, podem ser usados vários algoritmos para atender aos seus objetivos. A estrutura deste sistema permite sua configuração, utilizando diversos métodos, inclusive com técnicas de inteligência artificial. Com isso, é possível a obtenção de resultados mais precisos por meio da escolha do melhor método para cada caso. Os resultados apresentados neste trabalho foram obtidos a partir de bases conhecidas na literatura, o que possibilita comparar as implementações dos métodos tradicionais que foram adicionadas ao sistema e, principalmente, verificar a qualidade dos refinamentos produzidos pela integração de técnicas diferentes. Os resultados demonstram que através de um sistema de aprendizado, minimiza-se a complexidade na análise de grandes bases de dados, permitindo verificar bases com estruturas diferentes e aumentar os métodos aplicados na análise de cada estrutura. Isto favorece a comparação entre os métodos e proporciona resultados mais confiáveis. Para uniformizar os dados provenientes de bases distintas, foi elaborada a modelagem de dados do sistema, o que favorece a escalabilidade do sistema de maneira uniforme. / This thesis presents the architecture of a System Learning with a task scheduler, which makes possible the utilization of several classification and validation methods, allowing the distribution of tasks between the module systems. This architecture is structured of such way that the classifications obtained through a specific technique can be reutilized in parallel by the same algorithm or by other techniques, producing new classifications through the refinement of the results achieved and expanding the use in databases with different characteristics. The system was structured in four parts denominated, respectively, Initialization module; Validation module; Refinement module; and Especial scheduling module. In each module, various algorithms can be employed to reach its objectives. The structure of this system allows its configuration, utilizing various methods, including artificial intelligence techniques. Thus, it is possible to obtain more precise results through the choice of the best method to each case. The results presented in this work were obtained from basis that are known in the literature, which allows to compare the implementations of the traditional methods that were added to the system and, especially, to verify the quality of the refinements produced by the integration of different techniques. The results demonstrated that through a learning system, the complexity of the analysis of great databases is minimized, allowing to verify basis with different structures and to increase the methods applied in the analysis of each structure. It favors the comparison between the methodologies and provides more reliable results. To standardize the data originated of distinct bases, the data modelling system was elaborated, which will favor the uniform scalability of the system. Artificial intelligence Banco de dados Classificação de dados Clustering Data partitioning Database Inteligência artificial Machine learning Máquina de aprendizado Particionamento de dados Sistema de aprendizado System learning
9	Desenvolvimento e aplicação de Heurística para calcular pesos e bias iniciais para o “Back-Propagation” treinar Rede Neural Perceptron Multicamadas / Development and application of a Heuristic to initialize weights and bias for the Back-Propagation to train Multilayer Perceptron Network Neural Silva, Aldemário Alves da 18 August 2017 (has links) Submitted by Lara Oliveira (lara@ufersa.edu.br) on 2017-09-08T22:30:39Z No. of bitstreams: 1 AldemárioAS_DISSERT.pdf: 18856416 bytes, checksum: dcd37bbe9d111ef051c4d27c3481a41f (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-09-11T16:27:51Z (GMT) No. of bitstreams: 1 AldemárioAS_DISSERT.pdf: 18856416 bytes, checksum: dcd37bbe9d111ef051c4d27c3481a41f (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-09-11T16:28:25Z (GMT) No. of bitstreams: 1 AldemárioAS_DISSERT.pdf: 18856416 bytes, checksum: dcd37bbe9d111ef051c4d27c3481a41f (MD5) / Made available in DSpace on 2017-09-11T16:29:16Z (GMT). No. of bitstreams: 1 AldemárioAS_DISSERT.pdf: 18856416 bytes, checksum: dcd37bbe9d111ef051c4d27c3481a41f (MD5) Previous issue date: 2017-08-18 / The training of Multilayer Perceptron Neural Network (MLPNN) done by exact algorithm to find the maximum accuracy is NP-hard. Thus, we use the algorithm Back-Propagation who needs a starting point (weights and bias initials) to compute the training of the MLPNN. This research has developed and implemented a heuristic algorithm HeCI - Heuristic to Calculate Weights and Bias Initials - to compute the data to train the MLPNN and return the starting point for the Back-Propagation. HeCI uses Principal Component Analysis, Least Square Method, Probability Density Function of the Normal Gaussian Distribution, two strategic configurations, and partially controls the number of MLPNN training epochs. Experimentally, HeCI was used with Back-Propagation in MLPNN training to recognize patterns and solve data classification problems. Six case studies with datasets between Health, Business and Botany were used in the experiments. The methodology of this research uses Deductive analysis by the Experimental method with Quantitative approach and hypothesis tests: Test of Fridman with post Teste of Tukey HSD Post-hoc and Wilcoxon Test-M W. The results of accuracy have increased significantly improving attested by evaluation of tests of hypotheses, inferringstatistical robustness of the result motivated by HeCI / O treinamento de Rede Neural Perceptron Multicamadas (RNPM) feito por algoritmo exato para encontrar a máxima acurácia é NP-Difícil. Sendo assim, usa-se o algoritmo "Back-Propagation" que necessita de um ponto de partida (pesos e bias iniciais) para computar o treinamento da RNPM. Esta pesquisa desenvolveu e aplicou um algoritmo heurístico HeCI - Heurística para Calcular Pesos e Bias Iniciais - para computar os dados de treinamento da RNPM e retornar o ponto de partida para o "Back-Propagation". A HeCI usa Análise de Componentes Principais, Método dos Mínimos Quadrados, Função de Densidade de Probabilidade da Normal Distribuição Gaussiana, duas configurações estratégicas e controla parcialmente o número de épocas de treinamento da RNPM. Experimentalmente, a RNPM foi treinada usando "Back-Propagation" com HeCI, para reconhecer padrões e resolver problemas de classificação de dados. Seis estudos de caso com "datasets" entre as áreas de Saúde, Negócio e Botânica foram usados nos experimentos. A metodologia desta pesquisa usa análise Dedutiva pelo método Experimental com abordagem Quantitativa e testes de hipóteses: Teste de Fridman com Pós Teste de Tukey HSD Post-hoc e Teste de Wilcoxon-M-W. Os resultados de acurácia incrementaram melhoria significativa atestada pela avaliação dos testes de hipóteses, inferindo estatisticamente robustez de resultado motivado pela HeCI / 2017-09-08 Aprendizado de máquina Rede Neural Perceptron Multicamadas Heurística Reconhecimento de padrões Classificação de dados Machine learning Neural Network Multilayer Perceptron Heuristic Pattern recognition Data classification CNPQ::CIENCIAS EXATAS E DA TERRA
10	Classificação da marcha em parkinsonianos: análise dos algoritmos de aprendizagem supervisionada / Classification of the parkinsonian gait: analysis of supervised learning algorithms Souza, Hugo Araújo 12 April 2017 (has links) Parkinson’s disease is the second most prevalent neurodegenerative disease in the elderly, although its dominance and incidence vary according to age, gender and race/ethnicity. Studies indicate that the prevalence increases with age, with an estimate of 5 to 26 cases per 100,000 people per year, being approximately 1% among individuals aged 65- 69 and ranging from 3% to 14.3% among the elderly over 85 years. The most common clinical signs in the inflammatory process include the presence of resting tremor, muscle stiffness, bradykinesia and postural instability. The diagnosis of the disease is not a simple task, as it is known that there are stages patterns of disease progression in the human organism. However, many patients do not follow this progress because of the heterogeneity of manifestations that may arise. The gait analysis has become an attractive and non-invasive quantitative mechanism that can aid in the detection and monitoring of PD patients. Feature extraction is a very important task for quality of the data to be used by the algorithms, aiming as main objective the reduction in the dimensionality of the data in a classification process. From the reduction of dimensionality it is possible to identify which attributes are important and to facilitate the visualization of the data. For data related to human gait, the purpose is to detect relevant attributes that may help in identifying gait cycle phases, such as support and swing phases, cadence, stride length, velocity, etc. To do this, it is necessary to identify and select which attributes are most relevant, as well as the classification method. This work evaluates the performance of supervised learning algorithms in the classification of human gait characteristics in an open database, also identifies which attributes are most relevant to the performance of the classifiers in aiding the identification of gait characteristics in PD patients. / A Doença de Parkinson é a segunda doença neurodegenerativa mais prevalente em idosos, embora seu domínio e incidência variem de acordo com a idade, sexo e raça/etnia. Estudos apontam que a prevalência aumenta com a idade, tendo estimativa de 5 a 26 casos a cada 100 mil pessoas por ano, sendo de aproximadamente 1% entre os indivíduos de 65 a 69 anos e, variando de 3% a 14,3% entre os idosos acima de 85 anos. Os sinais clínicos mais comuns no processo inflamatório incluem a presença de tremor em repouso, rigidez muscular, bradicinesia e instabilidade postural. O diagnóstico da doença não é uma tarefa simples, pois sabe-se que há padrões de estágios no avanço da doença no organismo humano. Porém, muitos pacientes não seguem esse progresso devido a heterogeneidade de manifestações que podem surgir. A análise da marcha tornou-se um mecanismo quantitativo atrativo e não invasivo que pode auxiliar na detecção e monitoramento de portadores de DP. A extração de características é uma tarefa de suma importância para a qualidade dos dados a serem empregados pelos algoritmos de AM, visando como principal objetivo a redução na dimensionalidade dos dados em um processo de classificação. A partir da redução da dimensionalidade é possível identificar, principalmente, quais atributos são importantes e facilitar a visualização dos dados. Para dados relacionados à marcha humana, o propósito é detectar relevantes atributos que possam ajudar na identificação das fases do ciclo da marcha, como as fases de apoio e swing, cadência, comprimento da passada, velocidade, entre outras. Para tal, é preciso identificar e selecionar quais atributos são mais relevantes, assim como o método de classificação. Este trabalho avalia o desempenho de algoritmos de aprendizagem supervisionada na classificação das características da marcha humana em uma base de dados aberta, também identifica quais atributos são mais relevantes para o desempenho dos classificadores no auxílio à identificação de características da marcha em portadores da DP. Aprendizagem supervisionada - Algoritmos Classificação de dados Seleção de atributos Marcha humana Doença de Parkinson Machine learning Data classification Feature selection Human gait Parkinson disease

Search results