• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 96
  • 21
  • 20
  • 20
  • 20
  • 17
  • 8
  • 3
  • 3
  • 3
  • 3
  • Tagged with
  • 106
  • 106
  • 51
  • 35
  • 35
  • 33
  • 24
  • 24
  • 23
  • 23
  • 22
  • 22
  • 22
  • 21
  • 21
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Segmentação interativa de imagens utilizando competição e cooperação entre partículas /

Silva, Bárbara Ribeiro da. January 2015 (has links)
Orientador: Fabricio Aparecido Breve / Banca: Denis Henrique Pinheiro Salvadeo / Banca: Marcos Gonçalves Quiles / Resumo: Para estudar e classificar imagens é necessário entender as subdivisões que elas apresentam. Para esta finalidade existem técnicas de segmentação de imagens, uma das tarefas de visão computacional, a qual consiste na repartição de uma imagem digital em múltiplos segmentos, regiões ou objetos, com o intuito de facilitar a análise e compreensão. Métodos de segmentação de imagens são frequentemente utilizados para localizar objetos e bordas em imagens. Para tal tarefa, frequentemente são empregados algoritmos de aprendizado de máquina; disciplina científica que trata do projeto e desenvolvimento de algoritmos que melhoram automaticamente com a experiência, imitando o comportamento de aprendizado humano. O processo de aprendizado de máquina pode ser utilizado de diferentes formas, no entanto a categoria de aprendizado semi-supervisionado foi a que melhor se adaptou à proposta deste projeto. Esta categoria representa uma mescla entre o aprendizado supervisionado e o aprendizado não-supervisionado e trabalha com ambos os dados rotulados e não rotulados em sua fase de treinamento, proporcionando o uso de características individuais e/ou por conjunto. Diante da necessidade de combinação do aprendizado semi-supervisionado com a segmentação de imagem, foram estudadas formas de se utilizar informação provenientes de imagens para alimentar o aprendizado de máquina semi-supervisionado. Como resultado deste estudo, o algoritmo de aprendizado semi-supervisionado conhecido como competição e cooperação entre partículas foi estendido para a aplicações na tarefa de segmentação interativa de imagens. Na imagem de entrada, alguns pixels são classificados pelo usuário e servem como pixels de partida para o algoritmo. Estes pontos pré-rotulados são utilizados para criar as partículas no modelo utilizado. Também foram alterados alguns parâmetros de execução e partes estruturais do algoritmo de forma a otimizar a... / Abstract: To study and classify images it is necessary to understand the subdivisions they present. For this purpose there are image segmentation techniques, one of the computer vision tasks, which consists in the distribution of a digital image into multiple segments, regions or objects, in order to facilitate analysis and understanding. Image segmentation methods are often used for locating objects in images and borders. For this task, machine learning algorithms are often employed; scientific discipline that deals with the design and development of algorithms that automatically improve with experience, imitating the human learning behavior. The machine learning process can be used in different ways, however the category that best adapted to the project proposal, which represents a blend of supervised learning and unsupervised learning, called semi-supervised learning. Such category of algorithms works with both labelled and unlabelled data in their training phase, allowing the use of individual characteristics and or per set. Given the necessity of combining semi-supervised learning with image segmentation, some means of using information delivered from image to feed the semi-supervised learning machine were studied. As a result of this study, the semi-supervised learning algorithm known as competition and cooperation among particles was extended to be applied in the interactive image segmentation task. In the input image, some pixels are classified by the user and serve as a starting pixels to the algorithm. These pre-labeled points are used to create particles in the proposed model. Also, some parameters and algorithm structures were changed to optimize the classification and means of expressing the results in order to make it more suitable for the image segmentation task / Mestre
52

Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina /

Reis, Esther Camilo dos. January 2015 (has links)
Orientador: Ney Lemke / Coorientador: Marcio Luis Acencio / Banca Sandra Regina Costa Maruyama / Banca: Marcelo Mendes Brandão / Banca: Claudia Pio / Banca: Angelo Jose Magro / Resumo: Uma importante questão levantada logo após o primeiro sequenciamento completo do genoma de um organismo foi: quantos genes são essenciais para a vida celular? Experimentos de deleção individual realizados com a bactéria Escherichia coli revelaram que menos de 10% dos seus genes apresentam essa condição, ou seja, a inativação de cada um deles leva a total inviabilidade da bactéria. A teoria de redes fornece uma representação abstrata de um sistema biológico, onde o conjunto de nodos são os componentes biológicos (proteínas, genes, metabólitos, etc) e o conjunto de arestas são as interações de natureza biológica (interação física entre proteínas, interações metabólicas, interações de regulação transcricional, etc) que conectam cada dois componentes biológicos. A posição dos componentes biológicos em uma rede indica sua importância para a manutenção do sistema biológico. De forma geral, componentes localizados em posições centrais em uma rede biológica são aqueles componentes chaves para a integridade do sistema. Neste trabalho, decidimos investigar a posição dos restantes 90% dos genes considerados não-essenciais na rede integrada de interações gênicas (RIG) de E. coli. Especificamente, investigamos os genes condicionalmente essenciais, isto é, genes que são essenciais somente em determinadas condições de estresse. Além disso, investigamos também a posição na rede de pares de genes que constituem interações genéticas agravantes, isto é, pares de genes que quando deletados conjuntamente agravam a viabilidade do organismo. Utilizando uma abordagem puramente computacional baseada em aprendizado de máquina e propriedades topológicas da RIG, nós criamos modelos preditivos de árvores de decisão para definirmos como esses genes condicionalmente essenciais e as interações genéticas agravantes estão distribuídas na RIG. Ainda, uma lista com as probabilidades de classificação de cada... / Abstract: An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ... / Doutor
53

Algoritmos de aprendizado semi-supervisionado baseados em grafos aplicados na bioinformática /

Negretto, Diego Henrique. January 2016 (has links)
Orientador: Fabrício Aparecido Breve / Banca: Moacir Antonelli Ponti / Banca: Daniel Carlos Guimarães Pedronette / Resumo: As pesquisas realizadas para o Sequenciamento de Genomas, Proteômica, Sistemas Biológicos, Diagnósticos Médicos, entre outros, geram uma grande quantidade de dados, fazendo necessário o apoio de soluções computacionais para a análise e interpretação desses dados. A utilização de técnicas de Aprendizado de Máquina, para a extração de conhecimentos úteis dessas grandes quantidades de dados, tem sido amplamente discutida entre pesquisadores da Biologia e da Computação. O processo para se rotular todos os dados gerados pelas pesquisas biológicas, assim como em outras áreas, é difícil, caro e/ou demorado. Assim, buscar maneiras de se atingir uma grande acurácia com poucos dados rotulados torna-se uma tarefa importante e desafiadora. Nesse sentido, o Aprendizado SemiSupervisionado mostra-se como uma opção importante uma vez que utiliza dados rotulados e não rotulados para o treinamento, sendo uma categoria intermediária entre o Aprendizado Supervisionado e o Não Supervisionado. Diversas abordagens para algoritmos de Aprendizado Semi-Supervisionado são encontradas na literatura. Dentre elas, destacam-se os métodos baseados em grafos, que representam os dados de entrada como nós de um grafo cuja estrutura é utilizada para propagar informações de rótulos dos nós rotulados para os demais nós. Destaca-se ainda que a abordagem baseada em grafos possui uma grande fundamentação matemática e computacional. Nesse contexto, este trabalho apresenta uma análise comparativa de alguns algoritmos semi-supervisionados, baseados em grafos, quando aplicados a dados biológicos relacionados aos campos de estudos da Proteômica e Transcriptômica. Adicionalmente, o trabalho propõe um novo dataset com dados reais oriundos de pesquisas biológicas com o transcriptoma de formigas da espécie Mycocepurus goeldii. Alguns experimentos realizados com os algoritmos semi-supervisionados são apresentados, levando em consideração sua... / Abstract: Research conducted for the sequencing of genomes, Proteomics, Systems Biology, Medical Diagnostics, among others, generate a lot of data, making it necessary the support of computing solutions for the analysis and interpretation of such data. The possibility of using machine learning techniques to extract useful knowledge of these large amounts of data has been widely discussed among researchers of Biology and Computer Science. The process of labeling all data generated by biological research, as well as in other areas, is difficult, costly and / or time consuming. Thus, searching ways to achieve a high accuracy with few labeled data is an important and challenging task. Accordingly, the Semi-Supervised Learning shows up as an important option since it uses both labeled and unlabeled data for training, being an intermediate category between the Supervised and Unsupervised Learning. Several approaches to semi-supervised learning algorithms are found in the literature. Among them, the highlights are the graph-based methods, which represent the input data as nodes in a graph, which structure is used to propagate label information from labeled nodes to the other nodes. It is also noteworthy that the graph-based approach has a great mathematical and computational validity. In this context, this paper presents a comparative analysis of some semi-supervised algorithms based on graphs, when applied to biological data analysis related to the field of proteomics and transcriptomics studies. In addition, the paper proposes a new dataset with actual data from biological research with the transcriptome of the Mycocepurus goeldii species of ants. Some experiments performed with semi-supervised algorithms are presented, considering its efficacy when compared with a few supervised methods / Mestre
54

Classificação de padrões de mastigação de ruminantes utilizando aprendizagem de máquina

Pegorini, Vinicius 20 August 2015 (has links)
Este trabalho apresenta um estudo sobre a aplicação de técnicas de aprendizagem de máquina na análise do processo ingestivo de ruminantes, contemplando as etapas de preparação e classificação dos dados. O estudo desenvolvido resultou no desenvolvimento de um sistema utilizado para classificar de maneira automatizada diferentes eventos realizados por ruminantes durante a ingestão de alimentos e também alimentos consumidos pelos animais. Classificar padrões no comportamento ingestivo de ruminantes serve como base para estudos relacionados à nutrição animal bem como a identificação de dados relacionados a saúde animal. Neste trabalho, o conhecimento é obtido por meio da classificação de padrões usando redes neurais artificiais e árvores de decisão. Os dados foram coletados usando sensores a fibra ótica baseados em redes de Bragg (FBG), fixados na mandíbula do animal sob estudo. Foram realizados ensaios in vitro, com base em uma mandíbula cadavérica de um caprino, bem como ensaios in vivo para análise do processo mastigatório de um bovino da espécie Bos taurus. Diferentes tipos de materiais e plantas forrageiras foram usados para medir forças biomecânicas envolvidas no processo de mastigação do alimento. Os dados obtidos nos ensaios são pré-processados e utilizados para o treinamento dos algoritmos de aprendizagem de máquina. Resultados experimentais mostram que é possível classificar diferentes forrageiras e eventos envolvidos no processo ingestivo de ruminantes, contribuindo para melhoria da eficiência da atual metodologia de avaliação de consumo animal. / In this work, a system to automate the classification of chewing patterns of ruminants is developed. Pattern classification of ingestive behavior in grazing animals has extreme importance in studies related to animal nutrition, growing and health. The proposal is based on data collected by optical fiber Bragg grating sensors (FBG). The collected data are processed by machine learning techniques. The FBG sensors measure the biomechanical strain during jaw movements. In vitro tests were performed based on a cadaveric mandible of a goat and in vivo tests were performed by monitoring the food intake process of a steer. For the pattern classification a classic model of decision tree and artificial neural network were used. Experimental results show that the proposed approaches for pattern classification have been capable to differentiate the materials and events involved in the chewing process. Experimental results show that it is possible to classify different forage and events involved in the ingestive behaviour of ruminants, that contributes to improving the current methodology for monitoring the animal consumption efficiency.
55

Classificação de padrões de mastigação de ruminantes utilizando aprendizagem de máquina

Pegorini, Vinicius 20 August 2015 (has links)
Este trabalho apresenta um estudo sobre a aplicação de técnicas de aprendizagem de máquina na análise do processo ingestivo de ruminantes, contemplando as etapas de preparação e classificação dos dados. O estudo desenvolvido resultou no desenvolvimento de um sistema utilizado para classificar de maneira automatizada diferentes eventos realizados por ruminantes durante a ingestão de alimentos e também alimentos consumidos pelos animais. Classificar padrões no comportamento ingestivo de ruminantes serve como base para estudos relacionados à nutrição animal bem como a identificação de dados relacionados a saúde animal. Neste trabalho, o conhecimento é obtido por meio da classificação de padrões usando redes neurais artificiais e árvores de decisão. Os dados foram coletados usando sensores a fibra ótica baseados em redes de Bragg (FBG), fixados na mandíbula do animal sob estudo. Foram realizados ensaios in vitro, com base em uma mandíbula cadavérica de um caprino, bem como ensaios in vivo para análise do processo mastigatório de um bovino da espécie Bos taurus. Diferentes tipos de materiais e plantas forrageiras foram usados para medir forças biomecânicas envolvidas no processo de mastigação do alimento. Os dados obtidos nos ensaios são pré-processados e utilizados para o treinamento dos algoritmos de aprendizagem de máquina. Resultados experimentais mostram que é possível classificar diferentes forrageiras e eventos envolvidos no processo ingestivo de ruminantes, contribuindo para melhoria da eficiência da atual metodologia de avaliação de consumo animal. / In this work, a system to automate the classification of chewing patterns of ruminants is developed. Pattern classification of ingestive behavior in grazing animals has extreme importance in studies related to animal nutrition, growing and health. The proposal is based on data collected by optical fiber Bragg grating sensors (FBG). The collected data are processed by machine learning techniques. The FBG sensors measure the biomechanical strain during jaw movements. In vitro tests were performed based on a cadaveric mandible of a goat and in vivo tests were performed by monitoring the food intake process of a steer. For the pattern classification a classic model of decision tree and artificial neural network were used. Experimental results show that the proposed approaches for pattern classification have been capable to differentiate the materials and events involved in the chewing process. Experimental results show that it is possible to classify different forage and events involved in the ingestive behaviour of ruminants, that contributes to improving the current methodology for monitoring the animal consumption efficiency.
56

Identificação e localização dos limites da região trafegável para a navegação de um veículo autônomo

Azevedo, Vitor Barbirato 10 December 2012 (has links)
Made available in DSpace on 2016-12-23T14:33:48Z (GMT). No. of bitstreams: 1 Dissertacao - Vitor Barbirato Azevedo-V8.pdf: 2614205 bytes, checksum: 2cd8e9de813b7e5bd2a43d09df2b2d48 (MD5) Previous issue date: 2012-12-10 / This work presents a computer vision system for real-time mapping of the traversable region ahead of an autonomous vehicle that relies mostly on a stereo camera. For each new image pair captured by the stereo camera, the system first determines the camera position with re-spect to the ground plane using stereo vision algorithms and probabilistic methods, and then projects the camera raw image to the world coordinate system using inverse perspective map-ping. After that, the system classifies the pixels of the inverse perspective map as traversable or not traversable, generating an instantaneous occupancy map. Next, the instantaneous occu-pancy map is integrated to a probabilistic occupancy map, using the Bayes filter to estimate the occupancy probability of each map location. Finally, the probabilistic occupancy map is used to localize the lateral limits of the traversable region. The performance of the system for mapping the traversable region was evaluated in compari-son to manually classified images. The experimental results show that the system is able to correctly map up to 92.22 % of the traversable locations between 20 and 35 m ahead of an autonomous vehicle with a False Acceptance Rate not superior to 3.57 % when mapping par-allelepiped pavements / Neste trabalho é apresentado um sistema para mapeamento da região trafegável em tempo real que se baseia principalmente em uma câmera estéreo. Para cada novo par de imagens recebido da câmera estéreo, o sistema primeiro determina a posição da câmera com respeito ao plano da região trafegável usando algoritmos de visão estéreo e métodos probabilísticos, e então projeta a imagem de referência para o sistema de coordenadas do mundo através de mapea-mento inverso de perspectiva. Depois disso, o sistema classifica os pixels da imagem projeta-da como trafegáveis ou não trafegáveis, gerando um mapa de ocupação instantâneo. Em se-guida, o mapa de ocupação instantâneo é integrado em um mapa de ocupação probabilístico usando o filtro de Bayes, que estima a probabilidade de ocupação de cada localização do ma-pa. Finalmente, o mapa de ocupação probabilístico é utilizado para localizar os limites laterais da região trafegável. O desempenho do sistema para mapeamento da região trafegável foi avaliado em comparação com imagens classificadas manualmente. Os resultados experimentais mostram que o sistema é capaz de identificar corretamente até 92,22% das localizações trafegáveis entre 20 e 35 m à frente do veículo com uma Taxa de Falsa Aceitação não superior a 3,57% no mapeamento do pavimento de paralelepípedos
57

Predição genômica da resistência à ferrugem alaranjada em café arábica via algoritmos de aprendizagem de máquina / Genomic prediction of leaf rust resistance to arabica coffee using machine learning algorithms

Sousa, Ithalo Coelho de 26 February 2018 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2018-07-11T12:09:39Z No. of bitstreams: 1 textocompleto.pdf: 925551 bytes, checksum: 6e6a52bb70c4e45081687d495922f845 (MD5) / Made available in DSpace on 2018-07-11T12:09:39Z (GMT). No. of bitstreams: 1 textocompleto.pdf: 925551 bytes, checksum: 6e6a52bb70c4e45081687d495922f845 (MD5) Previous issue date: 2018-02-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A seleção genômica (SG) foi proposta como uma forma de aumentar a eficiência e acelerar o melhoramento genético. A SG enfatiza a predição simultânea dos efeitos genéticos de milhares de marcadores dispersos em todo o genoma de um organismo. Algumas metodologias estatísticas têm sido utilizadas em SG para a predição do mérito genético, como por exemplo a Ridge Regression Best Linear Unbiased Prediction (RR- BLUP), Bayesian Lasso (BLASSO). Porém tais metodologias exigem algumas pressuposições a respeito dos dados tais como normalidade da distribuição dos valores fenotípicos. Além disto, a presença de fatores complicadores tais como epistasia e dominância atrapalham a utilização destes modelos, uma vez que exigem que tais efeitos sejam estabelecidos à priori pelo pesquisador. Visando contornar a não normalidade dos valores fenotípicos a literatura sugere o uso dos modelos lineares generalizados sob o enfoque bayesiano (BGLR). Outra alternativa são os modelos baseados em aprendizagem de máquina (AM), representados por metodologias tais como Redes Neurais (RNA), Árvores de Decisão (AD) e seus possíveis refinamentos (Bagging, Random Forest e Boosting) as quais podem incorporar a epistasia e a dominância no modelo além de não exigirem pressuposições quanto ao modelo e a distribuição dos valores fenotípicos. Diante disso, o objetivo deste trabalho foi utilizar AD e seus refinamentos Bagging, Random Forest e Boosting para predição da resistência a ferrugem alaranjada no café arábica. Além disso, AD e seus refinamentos foram utilizadas para identificar a importância dos marcadores relacionados a característica de interesse. Os resultados foram comparados com aqueles provenientes do GBLASSO (Lasso Bayesiano Generalizado) e RNA. Foram utilizados dados da resistência a ferrugem do café de 245 plantas derivadas do cruzamento do Híbrido de Timor e do Catuaí Amarelo, genotipados para 137 marcadores. A AD e seus refinamentos obtiveram resultados satisfatórios, visto que apresentaram valores iguais ou inferiores de Taxa de Erro Aparente comparados com aqueles obtidos pelo GBLASSO e RNA. Ademais, os refinamentos da AD demonstraram ser capazes de identificar marcadores importantes para característica de interesse, visto que dentre os 10 marcadores mais importantes analisados em cada metodologia, 3-4 marcadores estavam próximos a QTL’s relacionados a resistência a doença listados na literatura. Por fim, a AD e seus refinamentos mostraram um melhor desempenho em relação ao GBLASSO e a RNA quanto ao custo computacional. / Genomic selection (GS) has been proposed as a way to increase efficiency and accelerate genetic improvement. GS emphasizes the simultaneous prediction of the genetic effects of thousands of scattered markers throughout an organism's genome. Some statistical methodologies have been used in GS for the prediction of genetic merit, such as Ridge Regression Best Linear Unbiased Prediction (RR-BLUP), Bayesian Lasso (BLASSO). However such methodologies require some assumptions about the data such as normality of the distribution of phenotypic values. In addition, the presence of complicating factors such as epistasis and dominance hinder the use of these models, since they require that such effects be established a priori by the researcher. In order to avoid the non-normality of phenotypic values, the literature suggests the use of Bayesian Generalized Linear Regression (BGLR). Another alternative is the models based on machine learning, represented by methodologies such as Artificial Neural Networks (ANN), Decision Trees (DT) and their possible refinements such as Bagging, Random Forest and Boosting, which can incorporate epistasis and dominance in the model, besides not requiring assumptions about the model and the distribution of phenotypic values. The aim of this work was to use DT and its refinements Bagging, Random Forest and Boosting for prediction of resistance to orange rust in arabica coffee. In addition, DT and its refinements were used to identify the importance of markers related to the characteristic of interest. The results were compared with those from GBLASSO (Generalized Bayesian Lasso) and ANN. Data from the coffee rust resistance of 245 plants derived from the hybrid of the Timor Hybrid and the Yellow Catuaí, genotyped for 137 markers were used. The DT and its refinements obtained satisfactory results, since they presented equal or inferior values of Apparent Error Rate compared to those obtained by GBLASSO and RNA. In addition, DT refinements seem to be able to identify important markers for characteristic of interest, since among the 10 most important markers analyzed in each methodology, 3-4 markers were close to QTLs related to resistance to disease listed in the literature. Finally, the Decision Tree and its refinements showed a better performance in relation to the GBLASSO and RNA regarding computational cost.
58

Aprendizagem de máquina para análise de indicadores em processos de software /

Bodo, Leandro. January 2015 (has links)
Orientador: Hilda Carvalho de Oliveira / Coorientador: Fabricio Aparecido Breve / Banca: João Paulo Papa / Banca: Fabiano Cutigi Ferrari / Resumo: As organizações produtoras de software vêm enfrentando problemas e desafios em relação à qualidade do software há muitas décadas. O gerenciamento da qualidade envolve três processos básicos: planejamento da qualidade, garantia da qualidade e controle da qualidade. O processo de controle da qualidade provê informações para avaliação do desempenho e mudanças nos projetos, processos ou produtos. Para isso, indicadores de desempenho devem ser definidos e analisados para apoiar as tomadas de decisão. Durante o monitoramento dos processos da produção de software, dados dos indicadores de desempenho são coletados e armazenados em bases históricas para serem analisados pelos administradores dos processos. Técnicas de controle estatístico da qualidade auxiliam a avaliação dos dados coletados. Contudo, alguns aspectos dificultam a análise adequada para as tomadas de decisão em tempo hábil. O controle da qualidade pode requerer análise de grupos de indicadores, compostos por indicadores de vários processos e de diferentes granularidades, tipos e frequencias de coleta. Além disso, à medida que o volume de dados dos indicadores aumenta, a complexidade das análises também tende a aumentar. Nesse contexto, este trabalho apresenta uma sistemática para análise dos indicadores de desempenho, utilizando técnicas de aprendizado de máquina semi-supervisionado. Essa sistemática é composta por etapas que abrangem a seleção dos indicadores, o processo de rotulagem e a análise dos dados coletados no monitoramento. Adicionalmente, o trabalho apresenta um modelo de referência para apoiar a seleção dos indicadores, baseado nos processos dos níveis G e F do modelo de qualidade MPS-SW. Outro modelo de referência desenvolvido é baseado nas perspectivas do modelo Balanced Scorecard, com a finalidade de apoiar a definição de grupos de indicadores. Os processos de rotulagem e análise dos dados são feitos em um único passo... / Abstract: Software development companies have been facing problems and challenges in relation to software quality for decades. Quality management involves three basic processes: quality planning, quality assurance and quality control. The quality control process provides information to evaluate the performance and changes in projects, processes or products. For this, performance indicators should be defined and analyzed in order to help decision-making. During the monitoring of the software production processes, data of the performance indicators is collected and stored in historical bases in order to be analyzed by the managers of the processes. Statistical quality control techniques aid the evaluation of the collected data. However, some aspects complicate the appropriate analysis to timely decision-making. The quality control may require analyzing groups of indicators, composed of indicators of various processes and with different granularity, types and collect frequency. Furthermore, as the volume of indicator data increases, the complexity of analysis also tends to increase. In this context, this work presents a systematic for analysis of performance indicators, using semi-supervised machine learning techniques.This systematic consists of steps that cover the selection of indicators, the process of labeling and the analysis of data collected in monitoring. In addition, the work presents a reference model to support the selection of indicators, considering the processes of the levels G and F of the MPS model for software (MPS-SW). The other developed reference model is based on the perspectives of the Balanced Scorecard model, in order to support the definition of groups of indicators. The labeling process and the data analysis process are done in a single step. Information visualization techniques are used to support the labeling process. The work presents a case study on the systematic presented, using real data from a software development ... / Mestre
59

Seleção de características utilizando algoritmos evolucionistas e suas aplicações em reconhecimento de padrões

Rodrigues, Douglas [UNESP] 24 February 2014 (has links) (PDF)
Made available in DSpace on 2015-03-03T11:52:41Z (GMT). No. of bitstreams: 0 Previous issue date: 2014-02-24Bitstream added on 2015-03-03T12:06:08Z : No. of bitstreams: 1 000804349.pdf: 687208 bytes, checksum: 513575bcf70cbc15996bc5c0fdb99657 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Técnicas para seleção de características tem sido amplamente estudadas pela comunidade científica de reconhecimento de padrões e areas afins, dado que o problema de encontrar o subconjunto das características que maximiza a taxa de acerto de uma técnica de classificação de padrões pode ser modelado como um problema de otimização. Metodologias baseadas em inteligência evolucionista, tais como aquelas que simulam dinâmicas sociais e de interação entre morcegos, algumas espécies de aves e outros insetos, tem sido recentemente aplicadas nesse contexto. Assim sendo, o presente trabalho visou o estudo e desenvolvimento de técnicas de seleção de características utilizando abordagens de otimização evolucionistas, sendo elas: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experimentos realizados em seis bases de dados utilizando as técnicas propostas em conjunto com outras cinco técnicas (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) mostraram a eficácia das técnicas evolucionistas propostas quando utilizadas em conjunto com o classificador OPF. O BSSO - Binary Social-Spider Optimization apresentou a melhor acurácia em 3 bases, chegando a aumentar a taxa de acerto do classificador OPF em até 19%, bem como, selecionou o menor número de características em cinco das seis bases. Em relação ao tempo de execuçãao, o BKH - Binary Krill Herd obteve o segundo melhor tempo em cinco bases, ficando atrás somente do BHS - Binary Harmony Search / Techniques for feature selection have been widely studied by the pattern recognition scientific community and related fields, as the problem of finding the subset of features that maximizes the classifier rate can be modeled as a optimization problem. Methodologies based on evolutionary intelligence, such as those that simulate social dynamics and interaction between bats, some species of birds and other insects, have recently been applied in this context. Therefore, this work aimed to the study and development of feature selection techniques using evolutionary optimization approaches: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experiments conducted in six databases using the proposed techniques together with ve other techniques (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) have shown the efiectiveness of proposed evolutionary techniques when used with the OPF classifier. The BSSO - Binary Social-Spider Optimization showed the best accuracy on 3 datasets coming to increase the OPF classification rate in up to 19%. Also, SSO has selected the smallest number features in ve of the six datasets. Regarding the runtime, BKH - Binary Krill Herd was the second fastest technique in ve datasets, being only slower then BHS - Binary Harmony Search technique
60

Aprendizado de máquina baseado em tensores e suas aplicacções para floresta de caminhos ótimos /

Lopes, Ricardo Ricci. January 2015 (has links)
Orientador: João Paulo Papa / Banca: Alexandre Levada / Banca: Antônio Carlos Sementille / Resumo: Técnicas de aprendizado de máquina, usualmente, objetivam aprender alguma superfície que separe amostras de classes diferentes por meio de sua representação vetorial. Entretanto, existem muitas aplicações que podem, eventualmente, perder informações essenciais e inerentes da estrutura dos dados em tal representação e, com o crescimento de base de dados com alta dimensionalidade, essas informações se tornam cada vez mais importantes. Os espaços de representação de dados com curvatura, baseados em trabalhos na area da Matemática e Física, têm despertado interesse por parte da comunidade de aprendizado de máquina com o intuito de resolver tal situação. Esses espaços de representação são baseados em tensores, os quais mantém a estrutura original dos dados, bem como permitem a utilização de variedades em superfícies com curvatura não nula. Esta dissertação de mestrado apresenta uma revisão bibliográfica sobre abordagens de aprendizado de máquina baseadas em tensores, bem como um referencial teórico sobre algebra multilinear. Também e apresentado um estudo da aplicabilidade do classificador Floresta de Caminhos Otimos, do inglês Optimum-Path Forest - OPF, em espaços tensoriais através da técnica Análise de Componentes Principais Multilineares, bem como a comparação dos resultados obtidos com outras técnicas conhecidas na literatura em contexto de reconhecimento em fotos e vídeos. Também foi demonstrado que o OPF pode obter maior acurácia em algumas situações quando se trabalha com características no espaço tensorial / Abstract: Machine learning techniques usually learn some decision surface that separates samples from di erent classes by means of their vectorial representation. However, there exist many applications that might lose important information that are strongly related to the data itself. Additionally, such information has gained importance with the popularity of high-dimensional datasets. As such, works based on Mathematics and Physics, where curvature-based space representations have been used in several application, have gained attention by the machine learning community. Such representations are based on tensors, which keep the original structure of the data, as well as they allow us to use manifolds in curvature-based spaces. This master's dissertation presents a review of the literature with respect to tensor-based machine learning techniques, as well as a brief review about multilinear algebra. We also evaluate the performance of the Optimum-Path Forest classi er (OPF) in tensor-oriented spaces by means of the Multilinear Principal Component Analysis, as well as its comparison against with other related techniques is also performed. It is shown OPF can bene t from such feature space representation in some situations / Mestre

Page generated in 0.1131 seconds