Global ETD Search

11	Desenvolvimento de t?cnicas de classifica??o supervisionada para dados qu?micos multivariados / Development of supervised classification techniques for multivariate chemical data Morais, Camilo de Lelis Medeiros de 29 September 2017 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-11-01T21:32:48Z No. of bitstreams: 1 CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-11-07T23:52:52Z (GMT) No. of bitstreams: 1 CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5) / Made available in DSpace on 2017-11-07T23:52:52Z (GMT). No. of bitstreams: 1 CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5) Previous issue date: 2017-09-29 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Esta disserta??o consiste de um aporte te?rico sobre a constru??o de t?cnicas de classifica??o supervisionada para aplica??es em dados qu?micos multivariados. Para isso, t?cnicas quimiom?tricas baseadas em an?lise discriminante quadr?tica (QDA) e m?quinas de vetores suporte (SVM) foram constru?das em conjunto com an?lise de componentes principais (PCA), algoritmo de proje??es sucessivas (SPA) e algoritmo gen?tico (GA) para classifica??o supervisionada utilizando redu??o de dados e sele??o de vari?veis. Essas t?cnicas foram empregadas na an?lise de dados de primeira ordem, constitu?dos de espectros na regi?o do infravermelho m?dio com transformada de Fourier e reflect?ncia total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia l?quida com um detector por tempo de v?o (LC/TOF); e espectros de massas obtidos por desor??o/ioniza??o por laser de superf?cie acoplado a um detector por tempo de v?o (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do g?nero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar c?ncer de ov?rio e de pr?stata em soro sangu?neo. Al?m disso, novas t?cnicas de an?lise discriminante bidimensionais utilizando an?lise de componentes principais com an?lise discriminante linear (2D-PCA-LDA), an?lise discriminante quadr?tica (2D-PCA-QDA) e m?quinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplica??es em dados qu?micos de segunda ordem compostos por matrizes de excita??o-emiss?o (EEM) por fluoresc?ncia molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as t?cnicas desenvolvidas tiveram alto desempenho classificat?rio tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Al?m disso, as t?cnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os m?todos tradicionais de classifica??o multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplica??es anal?ticas. / This dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications. Quimiometria Classifica??o supervisionada An?lise multivariada
12	Métodos de agrupamentos em dois estágios aplicados a problemas de reconhecimento de padrões SOUZA, Jefferson Rodrigo de 31 January 2010 (has links) Made available in DSpace on 2014-06-12T15:56:12Z (GMT). No. of bitstreams: 2 arquivo2764_1.pdf: 1664422 bytes, checksum: 79eaee65874c2baef2a7f616acbbb579 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco / A proposta desta dissertação é a criação de sistemas de reconhecimento de padrões baseada em abordagens híbridas, com o intuito de reduzir o tempo computacional e melhorar o desempenho quando comparado com outras técnicas de agrupamento. Esta dissertação propõe os métodos de agrupamentos SOMAK, que é a combinação dos Mapas Auto-Organizáveis (SOM) seguido do algoritmo Ant Kmédias (AK), ASCAK, composto pelos os algoritmos ASCA e AK e SOINAK, composto pela Rede Neural Incremental Auto-Organizável (SOINN) e AK. SOM é uma Rede Neural Artificial (RNA) que permite a visualização de dados de alta dimensionalidade e implementa um mapeamento ordenado de uma distribuição de alta dimensão dentro de uma grade regular de baixa dimensão. ASCA e AK são algoritmos de agrupamentos baseados na otimização da colônia de formigas (ACO). ACO é uma abordagem meta-heurística recentemente proposta para resolver problemas de difícil otimização combinatória. SOINN é uma rede neural de representação topológica útil para solucionar problemas de aprendizagem não supervisionada, gerando grupos de dados correlacionados e pode ser capaz de realizar este aprendizado de forma incremental. SOMAK, ASCAK e SOINAK empregam SOM, ASCA e a rede neural SOINN respectivamente como classificadores de características sobre os dados de entrada, ao invés de realizar o agrupamento dos dados diretamente. Primeiro, um conjunto grande de protótipos é formado pela rede neural SOM, o algoritmo ASCA e a rede neural incremental SOINN. Na segunda etapa, os protótipos são interpretados e então combinados para formar os agrupamentos finais ou definitivos. O benefício dos métodos propostos é a redução de ruídos. O algoritmo AK modifica o algoritmo K-médias localizando os objetos em seguida agrupando-os de acordo com probabilidades que são atualizadas pelo feromônio. SOINAK tem apresentado um melhor desempenho quando comparado com algumas outras técnicas híbridas de agrupamento, diferentemente do desempenho alcançado pelos métodos de agrupamentos SOMAK e ASCAK Sistemas Híbridos Inteligentes Aprendizagem Não Supervisionada
13	Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means MACARIO FILHO, Valmir 31 January 2009 (has links) Made available in DSpace on 2014-06-12T15:57:35Z (GMT). No. of bitstreams: 2 arquivo3210_1.pdf: 1552746 bytes, checksum: 98771d23cdfb48745520719f0b3134dd (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam apenas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algumas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semi-supervisionada. A aprendizagem semi-supervisionada utiliza uma grande quantidade de dados não rotulados, juntamente com dados rotulados, com a finalidade de construir classificadores melhores. A abordagem semi-supervisionada obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. O algoritmo semi-supervisionado pode ser uma extensão de um algoritmo não supervisionado. Um algoritmo desse tipo pode se basear em algoritmos de agrupamento não supervisionado, adicionando-se um termo em sua função objetivo que faz uso de informações rotuladas para guiar o processo de aprendizagem do algoritmo. Este trabalho apresenta um estudo da aprendizagem semi-supervisionada e apresenta um novo algoritmo de agrupamento semi-supervisionado baseado no algoritmo Fuzzy C-Means. Também, apresenta uma validação cruzada para o contexto de algoritmos semi-supervisionados. Estudos experimentais são apresentados. Primeiro, o algoritmo semi-supervisionado proposto é avaliado com dados completamente rotulados, comparado com alguns classificadores totalmente supervisionados. Depois, o mesmo algoritmo semi-supervisionado é, então, avaliado e comparado com três algoritmos também de agrupamento semi-supervisionados que otimizam uma função objetivo no contexto da aprendizagem a partir de dados parcialmente rotulados. Além disso, o comportamento do algoritmo é discutido e os resultados examinados através da construção de intervalos de confiança. Derivou deste trabalho, uma ferramenta contendo os algoritmos semi-supervisionados e o ambiente experimental para validação desses algoritmos foi desenvolvida. Desse modo, foi possível certificar que o novo algoritmo de agrupamento semi-supervisionad apresenta desempenho melhor, ou pelo menos do mesmo nível, que algoritmos já consolidados na literatura Aprendizagem Semi-Supervisionada Agupamento Semi-Supervisionado Agrupamento Fuzzy Função Objetivo Classificação de Padrões Validação Cruzada
14	Classificação Supervisionada Usando Dados Simbólicos de Semântica Modal César Donato Silva, Fábio January 2007 (has links) Made available in DSpace on 2014-06-12T16:00:26Z (GMT). No. of bitstreams: 2 arquivo6609_1.pdf: 1572704 bytes, checksum: 1b78e99bab6319081e75d92d5e7f2d0d (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2007 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A Análise de Dados Simbólicos (Symbolic Data Analysis) é um domínio na área de descoberta automática de conhecimento que visa desenvolver métodos para dados descritos por variáveis que podem assumir como valor conjuntos ou listas de categorias, intervalos ou distribuições de probabilidade. Essas variáveis permitem levar em conta a variabilidade e/ou a incerteza presente nos dados. Este trabalho apresenta um classificador simbólico de semântica modal para dados simbólicos de tipo intervalo. O classificador proposto apresenta duas etapas básicas, a aprendizagem e a alocação, onde ambas necessitam de uma etapa precedente de préprocessamento que transforma os dados simbólicos do tipo intervalo em dados simbólicos modal. Cada exemplo do conjunto de aprendizagem é descrito por um vetor de intervalos. Após o pré-processamento, cada exemplo passa a ser descrito por um vetor de distribuições de pesos. Após a etapa de aprendizagem, cada classe é também descrita por um vetor de distribuições de pesos que sintetiza as informações dos exemplos da classe. Cada novo exemplo a ser atribuído a uma classe (etapa de alocação), representado por um vetor de intervalos, após a fase de pré-processamento passa a ser descrito por um vetor de distribuições de pesos. A alocação de um exemplo a uma classe é realizada através de funções de dissimilaridade que comparam pares de vetores de distribuições de pesos. Algumas funções de dissimilaridade desse tipo são consideradas nesse trabalho. A avaliação do desempenho desse classificador é realizada através da aplicação do mesmo a conjuntos de dados sintéticos em uma experiência Monte Carlo e a conjuntos de dados reais usando a técnica de validação cruzada leave-one-out. O desempenho é medido pela taxa (média) de erro de classificação e pelo tempo de execução das etapas de aprendizagem e classificação. Além disso, o desempenho desse classificador foi comparado com o desempenho de um classificador de tipo k-vizinhos mais próximos também de semântica modal. Através desses exemplos, esse trabalho mostra alguns dos interesses desse classificador de semântica modal Analise de dados simbólicos Classificador simbólico modal Classificação supervisionada Dados simbólicos modas Funções de dissimilaridade
15	Classificador simbólico baseado em regiões de tipo casca convexa Tupinambá D'Oliveira Júnior, Simith January 2005 (has links) Made available in DSpace on 2014-06-12T16:01:16Z (GMT). No. of bitstreams: 2 arquivo7286_1.pdf: 1505089 bytes, checksum: dd1714eed2f544fc9d92cd54ceaddbf3 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2005 / Com os progressos recentes nas tecnologias das ciências de informacão, diferentes tecnicas são introduzidas para sintetizar, analisar e extrair conhecimentos das informações armazenadas em enormes bases de dados. A analise de dados simbolicos (SDA) e um dominio na area de descoberta automatica de conhecimentos (KDD), relacionada com analise de dados multivariados, reconhecimento de padrões, inteligência artificial e banco de dados. SDA visa generalizar os metodos da analise exploratoria de dados e as tecnicas estatisticas (analise fatorial, regress~ao, classificac~ao etc.) par dados simbolicos. Esses novos dados são mais complexos do que os dados classicos, pois contêm variação interna e são estruturados. Este trabalho introduz um classificador para dados descritos por vetores de valores quantitativos baseado em regi~oes de tipo casca convexa. A ideia central desta abordagem e construir regiões que descrevem e discriminem classes de exemplos observados. Nos classificadores para dados simbolicos baseados em regi~oes existentes na literatura de SDA, a etapa de aprendizagem fornece a descric~ao de uma classe por uma região (ou conjunto de regiões), definida pelo hiper-cubo formado pelos objetos pertencentes a esta classe. Esta descricão e obtida atraves de um operador simbolico (junção) e um Grafo de Vizinhos Mutuos. Na etapa de alocação, as novas observações são classificadas usando diferentes funções de matching. No classificador proposto neste trabalho, a descrição de cada classe e uma região (ou conjunto de regiões) em Rp definida pela casca convexa formada pelos seus objetos. Esta nova abordagem tem, como proposito, reduzir a sobre generalização que e produzida quando a classe e descrita por uma região (ou conjunto de regiões) definida pelo hipercubo formado pelos objetos da classe e, por isso, melhorar o desempenho do classificador.Na etapa de alocação, cada nova observação e afetada a uma classe ou grupo, de acordo com uma função de dissimilaridade que compara a descric~ao de uma classe (uma região ou um conjunto de regiões) com um ponto em Rp. Diferentes conjuntos de dados reais e artificiais são usados nesta avaliacão. Para os dados simulados, a performance do classificador proposto e avaliada pela taxa de erro de classificação, tempo de execuc~ao e memoria utilizada, em comparac~ao com um classificador para dados simbolicos que usa hiper-cubos para descrever as classes. Esta performance e computada no quadro de uma simulação de tipo Monte Carlo. Para os dados reais, a performance do classificador proposto tambem e avaliada pela taxa de erro de classificação, tempo de execução e memoria utilizada em comparação com os algoritmos Part e J48. A performance, para o caso real, e computada usando o 10-Fold repetido. Os resultados mostraram que, em termos da taxa de erro de classificação, o metodo proposto e superior ao metodo em que as regiões são representadas por hiper-cubos, porem o mesmo não ocorre em relação aos algoritmos Part e J48, pois, em algumas situações, o metodo proposto e superior a esses algoritmos Dados simbolicos Casca convexa Ánalise de dados simbolicos
16	Análise da dinâmica do uso da terra nos municípios de Pelotas, Morro Redondo e Arroio do Padre (RS) Dadalt, Anderson Martins January 2011 (has links) Dissertação(mestrado)-Universidade Federal do Rio Grande, Programa de Pós-Graduação em Geografia, Instituto de Ciências Humanas e da Informação, 2011. / Submitted by Caroline Silva (krol_bilhar@hotmail.com) on 2012-07-25T15:11:29Z No. of bitstreams: 1 dissertao anderson m. dadalt.pdf: 4038874 bytes, checksum: 3f2bbd2d2ee54c20925c01f32c501f66 (MD5) / Approved for entry into archive by Bruna Vieira(bruninha_vieira@ibest.com.br) on 2012-08-03T21:56:24Z (GMT) No. of bitstreams: 1 dissertao anderson m. dadalt.pdf: 4038874 bytes, checksum: 3f2bbd2d2ee54c20925c01f32c501f66 (MD5) / Made available in DSpace on 2012-08-03T21:56:24Z (GMT). No. of bitstreams: 1 dissertao anderson m. dadalt.pdf: 4038874 bytes, checksum: 3f2bbd2d2ee54c20925c01f32c501f66 (MD5) Previous issue date: 2011 / As atividades agrícolas e pastoris, as construções civis, as áreas urbanizadas e outras atividades realizadas pelo homem, com o passar dos anos, desenvolvem-se, mantendo um padrão de evolução e apropriação dos recursos naturais em constante aceleração. Desta forma, os impactos antrópicos acusam profundas transformações no espaço e, tanto natureza primitiva quanto natureza transformada ajustam-se às novas modelagens morfológicas e espaciais propostas pela evolução tecnológica e pelos processos naturais inerentes do meio. Nesta perspectiva, a presente pesquisa teve como objetivo fazer uma análise comparativa da evolução dos padrões do uso da terra nos municípios de Pelotas, Arroio do Padre e Morro Redondo – RS, no período 2000, 2003, 2007 e 2011 com a utilização de técnicas de Geoprocessamento, SIG e Sensoriamento Remoto. Foram definidos para a área estudada os seguintes padrões de ocupação das terras: pastagem natural e cultivada, agricultura, solo exposto ou pousio, água, área urbana, banhado, floresta implantada, floresta natural. Os resultados obtidos pela classificação não-supervisionada do presente estudo foram considerados satisfatórios. A análise dos resultados obtidos demonstrou que a dinâmica do uso da terra na área estudada está condicionada a questões socioeconômicas, tais como nível de mecanização do campo, mudanças nas economias dos municípios e o crescimento desordenado das áreas urbanas, o que resultou em transformações na hidrografia, a partir de intervenções na dinâmica fluvial e drenagens pelo processo de irrigação de culturas; no solo pela ação antropogênica e do conseqüente desequilíbrio dos processos erosivos; e na cobertura vegetal original, por meio de mudanças nos padrões de uso da terra em detrimento da implantação de cultivos não nativos. Dinâmica de uso da terra Geoprocessamento Sensoriamento remoto Análise temporal não-supervisionada Análise de transformações do espaço
17	Avaliação e seleção de modelos em detecção não supervisionada de outliers / On the internal evaluation of unsupervised outlier detection Henrique Oliveira Marques 23 March 2015 (has links) A área de detecção de outliers (ou detecção de anomalias) possui um papel fundamental na descoberta de padrões em dados que podem ser considerados excepcionais sob alguma perspectiva. Uma importante distinção se dá entre as técnicas supervisionadas e não supervisionadas. O presente trabalho enfoca as técnicas de detecção não supervisionadas. Existem dezenas de algoritmos desta categoria na literatura, porém cada um deles utiliza uma intuição própria do que deve ser considerado um outlier ou não, que é naturalmente um conceito subjetivo. Isso dificulta sensivelmente a escolha de um algoritmo em particular e também a escolha de uma configuração adequada para o algoritmo escolhido em uma dada aplicação prática. Isso também torna altamente complexo avaliar a qualidade da solução obtida por um algoritmo/configuração em particular adotados pelo analista, especialmente em função da problemática de se definir uma medida de qualidade que não seja vinculada ao próprio critério utilizado pelo algoritmo. Tais questões estão inter-relacionadas e se referem respectivamente aos problemas de seleção de modelos e avaliação (ou validação) de resultados em aprendizado de máquina não supervisionado. Neste trabalho foi desenvolvido um índice pioneiro para avaliação não supervisionada de detecção de outliers. O índice, chamado IREOS (Internal, Relative Evaluation of Outlier Solutions), avalia e compara diferentes soluções (top-n, i.e., rotulações binárias) candidatas baseando-se apenas nas informações dos dados e nas próprias soluções a serem avaliadas. O índice também é ajustado estatisticamente para aleatoriedade e extensivamente avaliado em vários experimentos envolvendo diferentes coleções de bases de dados sintéticas e reais. / Outlier detection (or anomaly detection) plays an important role in the pattern discovery from data that can be considered exceptional in some sense. An important distinction is that between the supervised and unsupervised techniques. In this work we focus on unsupervised outlier detection techniques. There are dozens of algorithms of this category in literature, however, each of these algorithms uses its own intuition to judge what should be considered an outlier or not, which naturally is a subjective concept. This substantially complicates the selection of a particular algorithm and also the choice of an appropriate configuration of parameters for a given algorithm in a practical application. This also makes it highly complex to evaluate the quality of the solution obtained by an algorithm or configuration adopted by the analyst, especially in light of the problem of defining a measure of quality that is not hooked on the criterion used by the algorithm itself. These issues are interrelated and refer respectively to the problems of model selection and evaluation (or validation) of results in unsupervised learning. Here we developed a pioneer index for unsupervised evaluation of outlier detection results. The index, called IREOS (Internal, Relative Evaluation of Outlier Solutions), can evaluate and compare different candidate (top-n, i.e., binary labelings) solutions based only upon the data information and the solution to be evaluated. The index is also statistically adjusted for chance and extensively evaluated in several experiments involving different collections of synthetic and real data sets. Avaliação não supervisionada Detecção de outliers Seleção de modelos Validação Internal evaluation Models selection Outlier detection Validation
18	Análise de similaridade entre classes e padrões de ativação neuronal. / Analysis of similarity between classes and patterns of neuronal activation. SARAIVA, Eugênio de Carvalho. 04 April 2018 (has links) Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-04-04T21:48:36Z No. of bitstreams: 1 EUGÊNIO DE CARVALHO SARAIVA - DISSERTAÇÃO PPGCC 2014..pdf: 2813039 bytes, checksum: 9b76f48c8df4aee95923a8ce5f0385ce (MD5) / Made available in DSpace on 2018-04-04T21:48:36Z (GMT). No. of bitstreams: 1 EUGÊNIO DE CARVALHO SARAIVA - DISSERTAÇÃO PPGCC 2014..pdf: 2813039 bytes, checksum: 9b76f48c8df4aee95923a8ce5f0385ce (MD5) Previous issue date: 2014-07-30 / Há um número crescente de tecnologias que fazem uso de algoritmos de classificação para a automação de tarefas. Em particular, em Neurociências, algoritmos de classificação foram usados para testar hipóteses sobre o funcionamento do sistema nervoso central. No entanto, a relação entre as classes de padrões de ativação neuronal de áreas específicas do cérebro, como resultado de experiências sensoriais tem recebido pouca atenção. No contexto da Neurociência Computacional, este trabalho apresenta uma análise do nível de similaridade entre classes de padrões de ativação neuronal, com o uso das abordagens de aprendizagem não supervisionada e semi-supervisionada, em áreas específicas do cérebro de ratos em contato com objetos, obtidos durante um experimento envolvendo exploração livre de objetos pelos animais. As classes foram definidas de acordo com determinados tratamentos construídos com níveis específicos de um conjunto de 8 fatores (Animal, Região do Cérebro, Objeto ou Par de Objeto, Algoritmo de Agrupamento, Métrica, Bin, Janela e Intervalo de Contato). No total foram analisados 327.680 tratamentos. Foram definidas hipóteses quanto à relação de cada um dos fatores para com o nível de similaridade existente entre os tratamentos. As hipóteses foram verificadas por meio de testes estatísticos entre as distribuições que representavam cada uma das classes. Foram realizados testes de normalidade (Shapiro-Wilk, QQ-plot), análise de variância e um teste para diferenças entre tendência central (Kruskal-Wallis). Com base nos resultados encontrados nos estudos utilizando abordagem não supervisionada, foi inferido que os processos de aquisição e de definição dos padrões de ativação por um observador foram sujeitos a uma quantidade não significativa de ruídos causados por motivos não controláveis. Pela abordagem semisupervisionada, foi observado que nem todos os graus de similaridade entre pares de classes de objetos são iguais a um dado tratamento, o que indicou que a similaridade entre classes de padrões de ativação neuronal é sensível a todos os fatores analisados e fornece evidências da complexidade na codificação neuronal. / There are a growing number of technologies that make use of classification algorithms for automating tasks. In particular, in Neuroscience, classification algorithms were used to test hypotheses about the functioning of the central nervous system. However, the relationship between the classes of patterns of neuronal activation in specific brain areas as a result of sensorial experience has received little attention. In the context of Computational Neuroscience , this paper presents an analysis of the level of similarity between classes of patterns of neuronal activation with the use of learning approaches unsupervised and semi - supervised in specific areas of rat brain in contact with objects , obtained during an experiment involving free exploration of objects by animals. The classes were defined according to certain treatments constructed with specific levels with set of 8 factors (Animal, Brain Region, Object or Pair of Objects, Clustering Algorithm, Metric, Bin, Window and Interval Contact). In total 327.680 treatments were analyzed. Hypotheses regarding the relationship of each of the factors with the existing level of similarity between treatments were defined. The hypotheses were tested through between statistical distributions representing each class tests. The tests applied where the tests for normality (Shapiro-Wilk, QQ–plot), analysis of variance and a test for differences in central tendency (Kruskal-Wallis) were performed. Based on the results found in studies using an unsupervised approach, it was inferred that the process of acquisition and definition of patterns of activation by an observer was not subject to a significant amount of noise caused by uncontrollable reasons. For the semi-supervised approach, it was observed that not all degrees of similarity between pairs of classes of objects are equal to a given treatment, which indicated that the similarity between classes of patterns of neuronal activation is sensitive to all the factors analyzed and provides evidence about the complexity of neuronal coding. Ciência da computação Neurociência computacional Neurociência computacional Ativação neuronal Algoritmos de classificação Experiências sensoriais Abordagem supervisionada - neurociência Computational Neuroscience Neuronal activation Classification algorithms Sensory Experiences Semi-supervised approach - neuroscience Supervised approach - neuroscience
19	Abordagem semi-supervisionada para detecção de módulos de software defeituosos OLIVEIRA, Paulo César de 31 August 2015 (has links) Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-07-24T12:11:04Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação Mestrado Paulo César de Oliveira.pdf: 2358509 bytes, checksum: 36436ca63e0a8098c05718bbee92d36e (MD5) / Made available in DSpace on 2017-07-24T12:11:04Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação Mestrado Paulo César de Oliveira.pdf: 2358509 bytes, checksum: 36436ca63e0a8098c05718bbee92d36e (MD5) Previous issue date: 2015-08-31 / Com a competitividade cada vez maior do mercado, aplicações de alto nível de qualidade são exigidas para a automação de um serviço. Para garantir qualidade de um software, testá-lo visando encontrar falhas antecipadamente é essencial no ciclo de vida de desenvolvimento. O objetivo do teste de software é encontrar falhas que poderão ser corrigidas e consequentemente, aumentar a qualidade do software em desenvolvimento. À medida que o software cresce, uma quantidade maior de testes é necessária para prevenir ou encontrar defeitos, visando o aumento da qualidade. Porém, quanto mais testes são criados e executados, mais recursos humanos e de infraestrutura são necessários. Além disso, o tempo para realizar as atividades de teste geralmente não é suficiente, fazendo com que os defeitos possam escapar. Cada vez mais as empresas buscam maneiras mais baratas e efetivas para detectar defeitos em software. Muitos pesquisadores têm buscado nos últimos anos, mecanismos para prever automaticamente defeitos em software. Técnicas de aprendizagem de máquina vêm sendo alvo das pesquisas, como uma forma de encontrar defeitos em módulos de software. Tem-se utilizado muitas abordagens supervisionadas para este fim, porém, rotular módulos de software como defeituosos ou não para fins de treinamento de um classificador é uma atividade muito custosa e que pode inviabilizar a utilização de aprendizagem de máquina. Neste contexto, este trabalho propõe analisar e comparar abordagens não supervisionadas e semisupervisionadas para detectar módulos de software defeituosos. Para isto, foram utilizados métodos não supervisionados (de detecção de anomalias) e também métodos semi-supervisionados, tendo como base os classificadores AutoMLP e Naive Bayes. Para avaliar e comparar tais métodos, foram utilizadas bases de dados da NASA disponíveis no PROMISE Software Engineering Repository. / Because the increase of market competition then high level of quality applications are required to provide automate services. In order to achieve software quality testing is essential in the development lifecycle with the purpose of finding defect as earlier as possible. The testing purpose is not only to find failures that can be fixed, but improve software correctness and quality. Once software gets more complex, a greater number of tests will be necessary to prevent or find defects. Therefore, the more tests are designed and exercised, the more human and infrastructure resources are needed. However, time to run the testing activities are not enough, thus, as a result, it causes escape defects. Companies are constantly trying to find cheaper and effective ways to software defect detection in earlier stages. In the past years, many researchers are trying to finding mechanisms to automatically predict these software defects. Machine learning techniques are being a research target, as a way of finding software modules detection. Many supervised approaches are being used with this purpose, but labeling software modules as defective or not defective to be used in training phase is very expensive and it can make difficult machine learning use. Considering that this work aims to analyze and compare unsupervised and semi-supervised approaches to software module defect detection. To do so, unsupervised methods (of anomaly detection) and semi-supervised methods using AutoMLP and Naive Bayes algorithms were used. To evaluate and compare these approaches, NASA datasets were used at PROMISE Software Engineering Repository. Aprendizagem de Máquina Aprendizagem Semi-Supervisionada Aprendizagem Não Supervisionada Teste de Software Detecção de Anomalias Machine Learning Software Defect Detection Semi-Supervised Learning Unsupervised Learning Software Testing Anomaly Detection
20	Estudo e avaliação de métodos de análise de sentimentos baseada em aspectos para textos opinativos em português / Study and evaluation of methods of aspect based sentiment analysis for opinative texts in Portuguese Machado, Mateus Tarcinalli 05 September 2018 (has links) Esta dissertação tem como objeto de estudo a análise de sentimentos baseada em aspectos, aplicação derivada da análise de sentimentos e da área de processamento de linguagem natural. A análise de sentimentos baseada em aspectos é focada em analisar textos avaliativos (textos contendo opiniões) buscando identificar e relacionar sentimentos e aspectos de uma determinada entidade (produtos, serviços entre outros). As principais etapas do desenvolvimento deste trabalho são a identificação de aspectos, que busca identificar as características de determinada entidade no texto e a identificação de sentimentos que procura encontrar o sentimento expresso pelo autor com relação ao aspecto mencionado. O objetivo deste trabalho é implementar, analisar, melhorar e criar métodos não supervisionados de análise de sentimentos baseada em aspectos para textos em português. Essa exploração se dará pela implementação de métodos para identificação de aspectos e sentimentos, criação e combinação de léxicos de sentimentos. Para alcançar esse objetivo realizamos experimentos com conjunto de dados anotado, ou seja, já com os aspectos e sentimentos relacionados marcados em seu texto. Para o processamento, além de técnicas de processamento de língua natural, como a análise gramatical, foram utilizados métodos de análise estatística dos textos e resultados. / This dissertation has as object of study the aspect based sentiment analysis, application derived from sentiment analysis and the area of natural language processing. The aspect based sentiment analysis focuses on analyzing evaluative texts (texts containing opinions) seeking to identify and relate feelings and aspects of a particular entity (products, services among others). The main stages of the development of this work are the identification of aspects, which seeks to identify the characteristics of a certain entity in texts, and sentiment identification that aims to identify the feelings expressed by the author concerned about the mentioned aspects. The purpose of this work is to implement, analyze, improve and create unsupervised methods of aspect based sentiment analysis applying them in portuguese language texts. This exploration will be through the implementation of methods for identifying aspects and sentiments, creation and combination of sentiment lexicons. To achieve this goal we performed experiments with annotated data set, that is, texts with the related aspects and sentiments already marked. For processing, in addition to natural language processing techniques, such as grammatical analysis, methods of statistical analysis of texts and results were used.

Search results