• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 69
  • 3
  • 1
  • Tagged with
  • 73
  • 73
  • 65
  • 63
  • 29
  • 27
  • 18
  • 16
  • 15
  • 14
  • 14
  • 12
  • 12
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Métodos adaptativos de segmentação aplicados à recuperação de imagens por conteúdo / Adaptative segmentation methods applied to Content-Based Image Retrieval

Balan, André Guilherme Ribeiro 14 May 2007 (has links)
A possibilidade de armazenamento de imagens no formato digital favoreceu a evolução de diversos ramos de atividades, especialmente as áreas de pesquisa e clínica médica. Ao mesmo tempo, o volume crescente de imagens armazenadas deu origem a um problema de relevância e complexidade consideráveis: a Recuperação de Imagens Baseada em Conteúdo, que, em outras palavras, diz respeito à capacidade de um sistema de armazenamento processar operações de consulta de imagens a partir de características visuais, extraídas automaticamente por meio de métodos computacionais. Das principais questões que constituem este problema, amplamente conhecido pelo termo CBIR - Content-Based Image Retrieval, fazem parte as seguintes: Como interpretar ou representar matematicamente o conteúdo de uma imagem? Quais medidas que podem caracterizar adequadamente este conteúdo? Como recuperar imagens de um grande repositório utilizando o conteúdo extraído? Como estabelecer um critério matemático de similaridade entre estas imagens? O trabalho desenvolvido e apresentado nesta tese busca, exatamente, responder perguntas deste tipo, especialmente para os domínios de imagens médicas e da biologia genética, onde a demanda por sistemas computacionais que incorporam técnicas CBIR é consideravelmente alta por diversos motivos. Motivos que vão desde a necessidade de se buscar informação visual que estava até então inacessível pela falta de anotações textuais, até o interesse em poder contar com auxílio computacional confiável para a importante tarefa de diagnóstico clínico. Neste trabalho são propostos métodos e soluções inovadoras para o problema de segmentação e extração de características de imagens médicas e imagens de padrões espaciais de expressão genética. A segmentação é o processo de delimitação automático de regiões de interesse da imagem que possibilita uma caracterização bem mais coerente do conteúdo visual, comparado com as tradicionais técnicas de caracterização global e direta da imagem. Partindo desta idéia, as técnicas de extração de características desenvolvidas neste trabalho empregam métodos adaptativos de segmentação de imagens e alcançam resultados excelentes na tarefa de recuperação baseada em conteúdo / Storing images in digital format has supported the evolution of several branches of activities, specially the research area and medical clinic. At the same time, the increasing volume of stored images has originated a topic of considerable relevance and complexity: the Content- Based Imagem Retrieval, which, in other works, is related to the ability of a computational system in processing image queries based on visual features automatically extracted by computational methods. Among the main questions that constitute this issue, widely known as CBIR, are these: How to mathematically express image content? What measures can suitably characterize this content? How to retrieve images from a large dataset employing the extracted content? How to establish a mathematical criterion of similarity among the imagens? The work developed and presented in this thesis aims at answering questions like those, especially for the medical images domain and genetical biology, where the demand for computational systems that embody CBIR techniques is considerably high for several reasons. Reasons that range from the need for retrieving visual information that was until then inaccessible due to the lack of textual annotations, until the interest in having liable computational support for the important task of clinical diagnosis. In this work are proposed innovative methods and solutions for the problem of image segmentation and feature extraction of medical images and images of gene expression patterns. Segmentation is the process that enables a more coherent representation of image?s visual content than that provided by traditional methods of global and direct representation. Grounded in such idea, the feature extraction techniques developed in this work employ adaptive image segmentation methods, and achieve excellent results on the task of Content-Based Image Retrieval
32

IDENTIFICAÇÃO DE ESPÉCIES DE PLANTAS UTILIZANDO COMBINAÇÃO DE CLASSIFICADORES

Araújo, Voncarlos Marcelo de 04 March 2016 (has links)
Made available in DSpace on 2017-07-21T14:19:27Z (GMT). No. of bitstreams: 1 Voncarlos Marcelo Araujo.pdf: 3791024 bytes, checksum: c5d2b6c030643b2e46f5ae7004f73ca8 (MD5) Previous issue date: 2016-03-04 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The biodiversity of plant species plays a key role in the Earth's ecology, providing food, shelter and maintaining a healthy breathable atmosphere for all living beings. The plants also have medicinal properties and are used for alternative energy sources, such as biofuel. However, the number of plants endangered has gradually increased and the difficulties in the plants manual recognition process, does become a complex and slow task. A viable method for the identification of plants, or to provide a categorization of the plant, is the plant image acquisition and use pattern recognition techniques. In this way, the use of computers, despite having little contribution in the area, can provide important information on the taxonomy of plants, and can serve as a basis for systems that perform tasks such as the selection of certain plants or to guide the specialist for possible decision-making. This paper proposes a method for classification of plants based on collaborative images of the world experts. This method is able to deal with some complexities imposed during the capture of images, as the presence of noise (lighting, shadows and undesirable objects) and plants position variations. To accomplish this task are used texture descriptors based on SIFT, SURF and HOG, which have shown excellent results in several works. To enable testing of the proposed method, we used an image provided by the global task basis for recognition of plants in 2011, ImageCLEF, containing about 2,586 plant samples composed by 41 species divided into two distinct categories: the first one with 13 species and images with presence of noise, and with the second species and 28 sheets of images plotted on a white background. The results of the experiments show that the classifiers trained with texture descriptors are able to achieve good hit rates close to 70%, given the complexity of the problem. Classifiers combination methods have also been used and have been shown capable to improve the performance of classifiers, especially in the test with images that has the presence of noises. / A biodiversidade das espécies de plantas desempenha um papel fundamental na ecologia da Terra, fornecendo alimento, abrigo e mantendo uma atmosfera respirável saudável para todos os seres vivos. As plantas também têm propriedades medicinais e são utilizadas para fontes alternativas de energia, como o biocombustível. No entanto, o número de plantas em risco de extinção tem aumentado gradativamente e as dificuldades presentes no processo manual de reconhecimento de plantas, torna esta tarefa muito complexa e morosa. Uma metodologia viável para a identificação das plantas, ou para fornecer uma categorização de plantas, é a aquisição da imagem da planta e o uso técnicas de reconhecimento de padrões. Dessa forma, o uso da computação, apesar de ainda ter pequena contribuição na área, pode prover informações importantes sobre a taxonomia das plantas, além de poder servir como base para sistemas que executem tarefas como a de seleção de determinado tipo de plantas ou que guiem o especialista para possíveis tomadas de decisões. Neste trabalho é proposto um método para classificação de plantas baseado em imagens colaborativas de especialistas do mundo inteiro. Esse método é capaz de lidar com algumas complexidades impostas durante a captura das imagens, como a presença de ruídos (luminosidade, sombras e objetos indesejáveis) e variações de posições das plantas. Para cumprir essa tarefa são utilizados descritores de textura baseados em SIFT, SURF e HOG, que têm mostrado excelentes resultados em diversos trabalhos. Para possibilitar os testes do método proposto, foi empregada uma base de imagens disponibilizada pela tarefa mundial de reconhecimento de plantas em 2011, ImageCLEF, que contém cerca de 2.586 amostras de plantas composta por 41 espécies divididas em duas categorias distintas: a primeira com 13 espécies e imagens com presença de ruídos, e a segunda com 28 espécies e imagens de folhas plotadas em um fundo branco. Os resultados dos experimentos mostram que os classificadores treinados com descritores de textura são capazes de atingir boas taxas de acertos, próximas a 70%, dada a complexidade do problema. Métodos de combinação de classificadores também foram utilizados e se mostraram capazes de melhorar o desempenho dos classificadores, principalmente nos testes com imagens que tem a presença de ruídos.
33

A computer-assisted approach to supporting taxonomical classification of freshwater green microalga images / Uma abordagem computacional para apoiar a classificação taxonômica de imagens de microalgas verdes de água doce

Borges, Vinicius Ruela Pereira 18 November 2016 (has links)
The taxonomical identification of freshwater green microalgae is highly relevant problem in Phycology. In particular, the taxonomical identification of samples from the Selenastraceae family of algae is considered particularly problematic with many known inconsistencies. Biologists manually inspect and analyze microscope images of alga strains, and typically carry out several complex and time-consuming procedures that demand considerable expert knowledge. Such practical limitations motivated this investigation on the applicability of image processing, pattern recognition and visual data mining techniques to support the biologists in tasks of species identification. This thesis describes methodologies for the classification of green alga images, considering both traditional automated classification processes and also a user-assisted incremental classification process supported by Neighbor Joining tree visualizations. In this process, users can interact with the visualizations to introduce their knowledge into the classification process, e.g. by selecting suitable training sets and evaluate the results, thus steering the classification process. In order for visualization and classification to be feasible, accurate features must be obtained from the images capable of distinguishing between the different species of algae. As morphological shape properties are a fundamental property in identifying species, suitable segmentation and shape feature extraction strategies have been developed. This was particularly challenging, as different alga species share common morphological characteristics. Two segmentation methodologies are introduced, in which one relies on the level set method and the other is based on the region growing principle. Although the contour-based approach is capable of handling the uneven conditions of green alga images, its computation is time-consuming and not suitable for real time applications. A specialized formulation of the region-based methodology is proposed that considers the specific characteristics of the green alga images handled. This second formulation was shown to be more efficient than the level set approach and generates highly accurate segmentations. Once accurate alga segmentation is achieved, two descriptors are proposed that capture alga shape properties, and also an effective general shape descriptor that computes quantitative measures from two signatures associated to the shape properties. Experimental results are described that indicate that the proposed solutions can be useful to biologists conducting alga identification tasks once it reduces their effort and attains satisfactory discrimination among species. / A identificação taxonômica de algas verdes de água doce é um problema de extrema relevância na Ficologia. Identificar espécies de algas da família Selenastraceae é uma tarefa complexa devido às inconsistências existentes em sua taxonomia, reconhecida como problemática. Os biólogos analisam manualmente imagens de microscópio de cepas de algas e realizam diversos procedimentos demorados que necessitamde conhecimento sólido. Tais limitaçõesmotivaramo estudo da aplicabilidade de técnicas de processamento de imagens, reconhecimento de padrões e mineração visual de dados para apoiar os biólogos em tarefas de identificação de espécies de algas. Esta tese descreve metodologias computacionais para a classificação de imagens de algas verdes, nas abordagens tradicional e baseada em classificação visual incremental com participação do usuário. Nesta última, os usuários interagem com visualizações baseadas em árvores filogenéticas para utilizar seu conhecimento no processo de classificação, como por exemplo, na seleção de instâncias relevantes para o conjunto de treinamento de um classificador, como também na avaliação dos resultados. De forma a viabilizar o uso de classificadores e técnicas de visualização, vetores de características devem ser obtidos das imagens de algas verdes. Neste trabalho, utiliza-se extração de características de forma, uma vez que a taxonomia da família Selenastraceae considera primordialmente as características morfológicas na identificação das espécies. No entanto, a obtenção de características representativas requer que as algas sejam precisamente segmentadas das imagens. Esta é, de fato, uma tarefa altamente desafiadora considerando a baixa qualidade das imagens e a maneira pelas quais as algas se organizam nas imagens. Duas metodologias de segmentação foram introduzidas: uma baseada no método Level Set e outra baseada no algoritmo de crescimento de regiões. A primeira se mostrou robusta e consegue identificar com alta precisão as algas nas imagens, mas seu tempo de execução é alto. A outra apresenta maior precisão e é mais rápida, uma vez que as técnicas de pré-processamento são especializadas para as imagens de algas verdes. Uma vez segmentadas as algas, dois descritores para caracterizar as imagens foram propostos: um baseado em características geométricas básicas e outro que utiliza medidas quantitativas calculadas a partir das assinaturas de forma. Resultados experimentais indicaram que as soluções propostas têm um bom potencial para serem utilizadas em tarefas de identificação taxonômica de algas verdes, uma vez que reduz o esforço nos procedimentos manuais e obtém-se classificações satisfatórias.
34

Métodos de apoio ao diagnóstico médico por imagens usando regras de associação e redes complexas / Methods for image-aided medical diagnosis using association rule mining and complex networks

Watanabe, Carolina Yukari Veludo 28 March 2013 (has links)
Com o desenvolvimento e barateamento dos equipamentos de aquisição de imagens, principalmente na área médica, tem sido geradas muitas imagens, as quais devem ser analisadas pelos especialistas. Esta tarefa pode ser muitas vezes cansativa e demorada, levando a possíveis erros no diagnóstico, pois a leitura das imagens depende da experiência e do estado físico e emocional do médico. Assim, sistemas de auxílio ao diagnóstico por computador (Computer-aided diagnosis - CAD) têm se tornado grandes aliados no processo de diagnóstico, realizando uma segunda leitura da imagem, servindo como uma segunda opinião ao especialista. Por isso, é necessário o desenvolvimento de técnicas de mineração de imagens para o aumento da precisão e da velocidade da análise das imagens. Assim, o objetivo deste trabalho foi desenvolver métodos de representação de imagens e de classificação associativa para aumentar a precisão da classificação de sistemas de auxílio ao diagnóstico médico por imagens. Para a representação de imagens foram desenvolvidas técnicas para reduzir a lacuna que há entre a representação numérica das imagens e seu significado semântico, a qual é chamada de `gap semântico\'. Para isso, foi usada a teoria das redes complexas para modelar as imagens em redes livres de escala, e os descritores das imagens foram compostos pelas medidas topológicas extraídas rede modelada. Os vetores de características gerados foram bem compactos, o que possibilitou também evitar o problema da `maldição da alta dimensionalidade\'. Para a classificação, foi desenvolvido o classificador associativo SACMiner, por meio do uso de regras de associação estatísticas, o qual evita a fase de discretização de dados, lidando diretamente com dados contínuos. Este foi um passo importante, já que a discretização pode causar a perda de informações e gerar inconsistência na base de dados. Além do SACMiner, foi desenvolvido o classificador MinSAR, o qual, além de não demandar a fase de discretização, também evita que o usuário tenha que fornecer parâmetros de entrada ao algoritmo responsável por gerar as regras. As técnicas até aqui listadas foram aplicadas em um sistema de auxílio ao diagnóstico de mama e comparadas com técnicas descritas na literatura, e os resultados mostram que as técnicas aqui propostas sobrepujaram as atuais da literatura. E por fim, foram sugeridas novas medidas para caracterizar imagens de pacientes com epilepsia no lobo temporal mesial, por meio do uso de medidas de espessura cortical, as quais melhoraram a precisão do sistema para este tipo de diagnóstico / The complexity of medical images and the high volume of exams per radiologist in a screening program can lead to a scenario prone to mistakes. Hence, it is important to inforce double reading and effective analysis, but those are costly measures. The computer-aided diagnosis (CAD) technology offers an alternative to double reading, because it can provide a computer output as a `second opinion\' to assist radiologists in interpreting images. Using this technology, the accuracy and consistency of radiological diagnoses can be improved, and also the image reading time can be reduced. Therefore, the need of classification and image representation methods and to speed-up and to assist the radiologists in the image analysis task has been increased. These methods must be more accurate and demand low computational cost, in order to provide a timely answer to the physician. The aim of this thesis was to developed image representation and associative classifiers methods to improve the classification of computer-aided diagnosis systems. Considering the image representation, in this work, we present some approaches to reduce the gap between the numeric representation of the images and their semantic, which is called `semantic gap\'. For this, we used the complex network theory to produce an image model based on scale-free networks. The image descriptors were composed of topological measures of the modeled network. The feature vectors produced were quite compact, which also allowed to avoid the problem called as `curse of dimensionality\'. Considering the classification task, we proposed the SACMiner classifier, which uses statistical association rules in order to avoid the discretization step when working with continuous attributes. It is important because the discretization step can disturb the dataset and cause lost of information. We also proposed de MinSAR classifier, which mines the rules not requiring a discretization step neither input thresholds, as most of the other association rules methods do. These approaches were applied in a breast cancer computer-aided diagnosis system. And finally, we developed an automatic technique which can aid in distinguishing between controls and patients with mesial temporal lobe epilepsy, based on cortical thickness, and potentially identifying abnormalities in tissue integrity in cases where atrophy cannot be visualized
35

Redes neurais auto-organizáveis na caracterização de lesões intersticiais de pulmão em radiografia de tórax / Self-organizing neural networks in the characterization of interstitial lung diseases in chest radiographs.

Ambrosio, Paulo Eduardo 01 June 2007 (has links)
O desenvolvimento tecnológico proporciona uma melhoria na qualidade de vida devido à facilidade, rapidez e flexibilidade no acesso à informação. Na área biomédica, a tecnologia é reconhecidamente uma importante aliada, permitindo o rápido desenvolvimento de métodos e técnicas que auxiliam o profissional na atenção à saúde. Recentes avanços na análise computadorizada de imagens médicas contribuem para o diagnóstico precoce de uma série de doenças. Nesse trabalho é apresentada uma metodologia para o desenvolvimento de um sistema computacional para caracterização de padrões em imagens pulmonares, baseado em técnicas de redes neurais artificiais. No estudo, buscou-se verificar a utilização de redes neurais auto-organizáveis como ferramenta de extração de atributos e redução de dimensionalidade de imagens radiográficas de tórax, objetivando a caracterização de lesões intersticiais de pulmão. Para a redução de dimensionalidade e extração de atributos, implementou-se um algoritmo baseado nos mapas auto-organizáveis (SOM), com algumas variações, obtendo-se uma redução dos cerca de 3 milhões de pixels que compõe uma imagem, para 240 elementos. Para a classificação dos padrões, utilizou-se uma rede Perceptron multi-camadas (MLP), validada com a metodologia leave-one-out. Com uma base contendo 79 exemplos de padrão linear, 37 exemplos de padrão nodular, 30 exemplos de padrão misto, e 72 exemplos de padrão normal, o classificador obteve a média de 89,5% de acerto, sendo 100% de classificação correta para o padrão linear, 67,5% para o padrão nodular, 63,3% para o padrão misto, e 100% para o padrão normal. Os resultados obtidos comprovam a validade da metodologia. / The technological development provides an improvement in the quality of life due to easiness, speed and flexibility in the access to the information. In the biomedical area, the technology is admitted as an important allied, allowing the fast development of methods and techniques that assist the professional in the health care. Recent advances in the computerized analysis of medical images contribute for the precocious diagnosis of a series of diseases. In this work a methodology for the development of a computational system for characterization of patterns in pulmonary images, based in techniques of artificial neural networks is presented. In the study, has searched for the verification the use of self-organizing neural networks as a feature extraction and dimensionality reduction tool of chest radiographs, willing to characterize interstitial lung disease. For the dimensionality reduction and feature extraction, an algorithm based on Self-Organizing Maps (SOM) was implemented, with some variations, getting a reduction of about 3 million pixels that it composes an image, for 240 elements. For the pattern classification, a Multilayer Perceptron (MLP) was used, validated with the leave-one-out methodology. With a database containing 79 samples of linear pattern, 37 samples of nodular pattern, 30 samples of mixed pattern, and 72 samples of normal pattern, the classifier provided an average result of 89.5% of right classification, with 100% of right classification for linear pattern, 67.5% for nodular pattern, 63.3% for mixed pattern, and 100% for normal pattern. The results prove the validity of the methodology.
36

Análise e reconhecimento digital de formas biológicas para o diagnóstico automático de parasitas do gênero Eimeria / Biological shape analysis and digital recognition for the automatic diagnosis of parasites of the genus Eimeria

Castañon, Cesar Armando Beltran 16 January 2007 (has links)
O gênero Eimeria compreende um grupo de protozoários da classe Coccidia que infecta uma grande variedade de hospedeiros. Um total de sete espécies distintas Eimeria podem infectar a galinha doméstica causando enterites com graves prejuízos econômicos. A identificação das espécies pode ser feita através da análise microscópica das diferentes características morfológicas dos oocistos, um dos estágios de desenvolvimento do parasita. Alternativamente, ensaios moleculares baseados na amplificação de alvos específicos de DNA também podem ser utilizados. Em ambos os casos, requer-se um laboratório especializado e, principalmente, pessoal altamente treinado. Neste trabalho é relatada uma abordagem computacional para a extração automática de características para a representação da forma das distintas espécies de Eimeria. Foram utilizadas imagens digitais do protozoário nas quais aplicou-se técnicas de processamento de imagens e visão computacional para sua representação morfológica, formando três grupos de características: medidas geométricas, caracterização da curvatura, e quantificação da estrutura interna. A morfologia dos protozoários foi representada por um vetor de características constituído por 14 dimensões, o qual constituiu o padrão de entrada para o processo de classificação. Para o reconhecimento dos padrões, foram usados dois classificadores Bayesianos, utilizando-se como funções de verossimilhança a Gaussiana e a de Dirichlet, respectivamente. O primeiro classificador apresentou as melhores taxas de acerto, enquanto o segundo demonstrou melhor desempenho segundo a análise por curvas ROC. Como prova de princípio de que o sistema poderia ser utilizado por usuários leigos para o diagnóstico à distância de parasitas, foi implementado o COCCIMORPH, um sistema de diagnóstico de Eimeria em tempo real. O sistema permite o envio de imagens via web, assim como o seu pré-processamento e classificação remotos, obtendo-se o resultado do diagnóstico em tempo real. Essa abordagem totalmente integrada e implementada é inédita para o diagnóstico de parasitas. Entre suas vantagens principais está o fato de que o diagnóstico pode ser obtido sem a necessidade do transporte físico de amostras biológicas para um laboratório de referência, evitando assim riscos de contaminação do ambiente. Para o treinamento do sistema, foram obtidas centenas de micrografias de cada uma das sete espécies de Eimeria que infectam a galinha doméstica. Essas imagens também foram usadas para a construção de um banco de acesso público de imagens (The Eimeria Image Database). Além disso, a metodologia de diagnóstico foi também aplicada e testada com onze espécies Eimeria de coelho doméstico. Com isso, foram gerados dados inéditos de morfometria, micrografias adicionais para o banco de imagens, e um sistema de classificação para esse conjunto adicional de parasitas. Finalmente, foram determinadas as distâncias entre as diferentes espécies de Eimeria, calculadas a partir dos dados morfométricos. As árvores de distância revelaram uma topologia muito similar com árvores obtidas a partir da inferência filogenética usando-se marcadores moleculares como o gene 18S de rRNA ou genomas mitocondriais. / The Eimeria genus comprises a group of protozoan parasites that infect a wide range of hosts. A total of seven different Eimeria species infect the domestic fowl, causing enteritis with severe economical losses. Species identification can be performed through microscopic analysis of the distinct morphological characteristics of the oocysts, a developmental stage of the parasite. Alternatively, molecular assays based on the amplification of specific DNA targets can also be used. In both cases, a well equipped laboratory and, especially, highly qualified personnel are required. In this work, we report a computational approach for the automatic feature extraction for shape representation of the different Eimeria species. Digital images of the parasites were used in order to apply image processing and computational vision techniques for shape characterization. Three groups of morphological features were constituted: geometric measures, curvature characterization, and internal structure quantification. The protozoan morphology was represented by a 14-dimension feature vector, which was used as the input pattern for the classification process. Two Bayesian classifiers were used for pattern recognition, using as a likelihood function the normal and the Dirichlet, respectively. The former classifier presented the best correct classification rates, whereas the latter showed a better performance in ROC curve analyses. As a proof of principle that this system could be utilized by end-users for a long-distance parasite diagnosis, we implemented COCCIMORPH, an integrated system for the real-time diagnosis of Eimeria spp. The system presents an interface for image uploading. Image preprocessing and diagnosis are performed remotely and the results displayed in real-time. This fully integrated and implemented system constitutes a novel approach for parasite diagnosis. Among the several advantages of the system, it is noteworthy that no biological sample transportation is required between the farm and the reference laboratory, thus avoiding potential environment contamination risks. To train the system, we used hundreds of micrographs of each one of the seven Eimeria species of domestic fowl. These images were used to compose a public image repository (The Eimeria Image Database). In addition, our diagnosis methodology was extended to the eleven Eimeria species that infect the domestic rabbit. With this integrated approach, a totally novel set of images and morphometric data of rabbit Eimeria were incorporated to the image database and, also to the remote diagnosis system. Finally, distance trees of the distinct Eimeria species of domestic fowl were computed from the morphometric data. The trees revealed a very similar topology with trees obtained with molecular phylogenetic markers such as the 18S rRNA gene and mitochondrial genomes.
37

A computer-assisted approach to supporting taxonomical classification of freshwater green microalga images / Uma abordagem computacional para apoiar a classificação taxonômica de imagens de microalgas verdes de água doce

Vinicius Ruela Pereira Borges 18 November 2016 (has links)
The taxonomical identification of freshwater green microalgae is highly relevant problem in Phycology. In particular, the taxonomical identification of samples from the Selenastraceae family of algae is considered particularly problematic with many known inconsistencies. Biologists manually inspect and analyze microscope images of alga strains, and typically carry out several complex and time-consuming procedures that demand considerable expert knowledge. Such practical limitations motivated this investigation on the applicability of image processing, pattern recognition and visual data mining techniques to support the biologists in tasks of species identification. This thesis describes methodologies for the classification of green alga images, considering both traditional automated classification processes and also a user-assisted incremental classification process supported by Neighbor Joining tree visualizations. In this process, users can interact with the visualizations to introduce their knowledge into the classification process, e.g. by selecting suitable training sets and evaluate the results, thus steering the classification process. In order for visualization and classification to be feasible, accurate features must be obtained from the images capable of distinguishing between the different species of algae. As morphological shape properties are a fundamental property in identifying species, suitable segmentation and shape feature extraction strategies have been developed. This was particularly challenging, as different alga species share common morphological characteristics. Two segmentation methodologies are introduced, in which one relies on the level set method and the other is based on the region growing principle. Although the contour-based approach is capable of handling the uneven conditions of green alga images, its computation is time-consuming and not suitable for real time applications. A specialized formulation of the region-based methodology is proposed that considers the specific characteristics of the green alga images handled. This second formulation was shown to be more efficient than the level set approach and generates highly accurate segmentations. Once accurate alga segmentation is achieved, two descriptors are proposed that capture alga shape properties, and also an effective general shape descriptor that computes quantitative measures from two signatures associated to the shape properties. Experimental results are described that indicate that the proposed solutions can be useful to biologists conducting alga identification tasks once it reduces their effort and attains satisfactory discrimination among species. / A identificação taxonômica de algas verdes de água doce é um problema de extrema relevância na Ficologia. Identificar espécies de algas da família Selenastraceae é uma tarefa complexa devido às inconsistências existentes em sua taxonomia, reconhecida como problemática. Os biólogos analisam manualmente imagens de microscópio de cepas de algas e realizam diversos procedimentos demorados que necessitamde conhecimento sólido. Tais limitaçõesmotivaramo estudo da aplicabilidade de técnicas de processamento de imagens, reconhecimento de padrões e mineração visual de dados para apoiar os biólogos em tarefas de identificação de espécies de algas. Esta tese descreve metodologias computacionais para a classificação de imagens de algas verdes, nas abordagens tradicional e baseada em classificação visual incremental com participação do usuário. Nesta última, os usuários interagem com visualizações baseadas em árvores filogenéticas para utilizar seu conhecimento no processo de classificação, como por exemplo, na seleção de instâncias relevantes para o conjunto de treinamento de um classificador, como também na avaliação dos resultados. De forma a viabilizar o uso de classificadores e técnicas de visualização, vetores de características devem ser obtidos das imagens de algas verdes. Neste trabalho, utiliza-se extração de características de forma, uma vez que a taxonomia da família Selenastraceae considera primordialmente as características morfológicas na identificação das espécies. No entanto, a obtenção de características representativas requer que as algas sejam precisamente segmentadas das imagens. Esta é, de fato, uma tarefa altamente desafiadora considerando a baixa qualidade das imagens e a maneira pelas quais as algas se organizam nas imagens. Duas metodologias de segmentação foram introduzidas: uma baseada no método Level Set e outra baseada no algoritmo de crescimento de regiões. A primeira se mostrou robusta e consegue identificar com alta precisão as algas nas imagens, mas seu tempo de execução é alto. A outra apresenta maior precisão e é mais rápida, uma vez que as técnicas de pré-processamento são especializadas para as imagens de algas verdes. Uma vez segmentadas as algas, dois descritores para caracterizar as imagens foram propostos: um baseado em características geométricas básicas e outro que utiliza medidas quantitativas calculadas a partir das assinaturas de forma. Resultados experimentais indicaram que as soluções propostas têm um bom potencial para serem utilizadas em tarefas de identificação taxonômica de algas verdes, uma vez que reduz o esforço nos procedimentos manuais e obtém-se classificações satisfatórias.
38

Two-dimensional extensions of semi-supervised dimensionality reduction methods

Moraes, Lailson Bandeira de 19 August 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-11T18:17:21Z No. of bitstreams: 2 Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:02:06Z (GMT) No. of bitstreams: 2 Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:02:06Z (GMT). No. of bitstreams: 2 Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-19 / An important pre-processing step in machine learning systems is dimensionality reduction, which aims to produce compact representations of high-dimensional patterns. In computer vision applications, these patterns are typically images, that are represented by two-dimensional matrices. However, traditional dimensionality reduction techniques were designed to work only with vectors, what makes them a suboptimal choice for processing two-dimensional data. Another problem with traditional approaches for dimensionality reduction is that they operate either on a fully unsupervised or fully supervised way, what limits their efficiency in scenarios where supervised information is available only for a subset of the data. These situations are increasingly common because in many modern applications it is easy to produce raw data, but it is usually difficult to label it. In this study, we propose three dimensionality reduction methods that can overcome these limitations: Two-dimensional Semi-supervised Dimensionality Reduction (2D-SSDR), Two-dimensional Discriminant Principal Component Analysis (2D-DPCA), and Two-dimensional Semi-supervised Local Fisher Discriminant Analysis (2D-SELF). They work directly with two-dimensional data and can also take advantage of supervised information even if it is available only for a small part of the dataset. In addition, a fully supervised method, the Two-dimensional Local Fisher Discriminant Analysis (2D-LFDA), is proposed too. The methods are defined in terms of a two-dimensional framework, which was created in this study as well. The framework is capable of generally describing scatter-based methods for dimensionality reduction and can be used for deriving other two-dimensional methods in the future. Experimental results showed that, as expected, the novel methods are faster and more stable than the existing ones. Furthermore, 2D-SSDR, 2D-SELF, and 2D-LFDA achieved competitive classification accuracies most of the time when compared to the traditional methods. Therefore, these three techniques can be seen as viable alternatives to existing dimensionality reduction methods. / Um estágio importante de pré-processamento em sistemas de aprendizagem de máquina é a redução de dimensionalidade, que tem como objetivo produzir representações compactas de padrões de alta dimensionalidade. Em aplicações de visão computacional, estes padrões são tipicamente imagens, que são representadas por matrizes bi-dimensionais. Entretanto, técnicas tradicionais para redução de dimensionalidade foram projetadas para lidar apenas com vetores, o que as torna opções inadequadas para processar dados bi-dimensionais. Outro problema com as abordagens tradicionais para redução de dimensionalidade é que elas operam apenas de forma totalmente não-supervisionada ou totalmente supervisionada, o que limita sua eficiência em cenários onde dados supervisionados estão disponíveis apenas para um subconjunto das amostras. Estas situações são cada vez mais comuns por que em várias aplicações modernas é fácil produzir dados brutos, mas é geralmente difícil rotulá-los. Neste estudo, propomos três métodos para redução de dimensionalidade capazes de contornar estas limitações: Two-dimensional Semi-supervised Dimensionality Reduction (2DSSDR), Two-dimensional Discriminant Principal Component Analysis (2D-DPCA), e Twodimensional Semi-supervised Local Fisher Discriminant Analysis (2D-SELF). Eles operam diretamente com dados bi-dimensionais e também podem explorar informação supervisionada, mesmo que ela esteja disponível apenas para uma pequena parte das amostras. Adicionalmente, um método completamente supervisionado, o Two-dimensional Local Fisher Discriminant Analysis (2D-LFDA) é proposto também. Os métodos são definidos nos termos de um framework bi-dimensional, que foi igualmente criado neste estudo. O framework é capaz de descrever métodos para redução de dimensionalidade baseados em dispersão de forma geral e pode ser usado para derivar outras técnicas bi-dimensionais no futuro. Resultados experimentais mostraram que, como esperado, os novos métodos são mais rápidos e estáveis que as técnicas existentes. Além disto, 2D-SSDR, 2D-SELF, e 2D-LFDA obtiveram taxas de erro competitivas na maior parte das vezes quando comparadas aos métodos tradicionais. Desta forma, estas três técnicas podem ser vistas como alternativas viáveis aos métodos existentes para redução de dimensionalidade.
39

Diagnóstico de falhas em transformadores de potência utilizando sensores de gás semicondutores

Silva, Lucas Tenório de Souza 30 August 2012 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This dissertation introduces the study of the use of tin dioxide gas sensor array applied to fault detection in power transformers, through dissolved gas-in-oil. The aim of this research is to analyze the data obtained from gas sensors array, using pattern recognition techniques, and thus to determine if the use of gas sensor array allows the identification of faults. In order to facilitate the understanding of this research, the document was organized covering the following topics: power transformers, mineral insulating oil, analysis and interpretation of dissolved gás-in-oil, tin dioxide sensors and data acquisition instrument, techniques of pattern recognition and methodology for generating faults. In the end of this dissertation, the data from the sensor array are analyzed, in order to achieve the objective of verifying its application in the identification of faults. / Esta dissertação introduz o estudo do uso de uma matriz de sensores de gases de dióxido de estanho na detecção de falhas em transformadores de potência, através dos gases dissolvidos no óleo. O objetivo desta pesquisa é analisar os dados obtidos pelos sensores de gás, utilizando algumas técnicas de reconhecimento de padrão, e desta forma, verificar se o uso da matriz de sensores possibilita a identificação das falhas. Com o intuito de facilitar o entendimento da pesquisa, o presente documento foi organizado abordando os seguintes tópicos: transformadores de potência; óleo mineral isolante; análise e interpretação dos gases dissolvidos em óleo; sensores de dióxido de estanho e instrumento de aquisição de dados; técnicas de reconhecimento de padrões; e metodologia de geração de falhas. Ao final desta dissertação, os dados da matriz de sensores são analisados, a fim de atingir o objetivo de verificar sua aplicação na identificação das falhas.
40

Levantamento, representação e análise computacional de hipóteses sobre combinações de frases percussivas

DIAS, Luca Bezerra 31 August 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-12T11:59:57Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Luca Bezerra Dias - Dissertação de Mestrado (versão final) - Capas Oficiais e Normas ABNT [Digital].pdf: 5112956 bytes, checksum: 8c627192221d904c973b582471a171dc (MD5) / Made available in DSpace on 2016-07-12T11:59:57Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Luca Bezerra Dias - Dissertação de Mestrado (versão final) - Capas Oficiais e Normas ABNT [Digital].pdf: 5112956 bytes, checksum: 8c627192221d904c973b582471a171dc (MD5) Previous issue date: 2015-08-31 / FACEPE / Os avanços na área de computação musical ao longo dos anos trouxeram no-vas possibilidades e também novas perguntas. A área de geração automática de con-teúdo musical ganhou bastante interesse (BILES, 1994); (SAMPAIO, TEDESCO e RAMALHO, 2005); (GIFFORD, 2013), e com ela, surgiram questões mais profundas sobre o conteúdo gerado por estes sistemas. Qual a aplicabilidade de tais sistemas? Como trabalhar com conceitos como melodia e harmonia? É possível gerar música que não seja apenas um combinado aleatório de notas ou excertos musicais? Reduzindo o escopo da discussão para sistemas geradores de composições percussivas, um elemento essencial fica em evidência: o ritmo. Qual o impacto de um ritmo destoante dentro de uma música? É possível gerar ritmos neutros, que se en-caixem em qualquer composição? Como gerar automaticamente um bom ritmo? Para responder a essas questões, é necessário antes chegar à resposta de uma pergunta mais fundamental: como saber se um ritmo A combina com um ritmo B? A literatura (inclusive musical) sobre esse assunto é escassa e, na sua maioria, subjetiva, pessoal e sem bases empíricas. Em geral, o caminho tomado pelos traba-lhos costuma se basear no que pode ser feito algoritmicamente, para depois encaixar os resultados dentro do conceito de ritmo, tornando os resultados questionáveis. Diante disso, resolvemos seguir o caminho inverso, partindo de teorias e con-ceitos para só depois chegarmos ao algoritmo. Para tal, pedimos que músicos e estu-diosos apresentassem definições de ritmo e suas características fundamentais, a par-tir das quais construímos hipóteses para responder à pergunta deste trabalho. Isto demandou buscar junto aos músicos possíveis hipóteses, encontrar uma forma de representá-las computacionalmente, levantar exemplos concretos (dados) musicais e decidir como representa-los computacionalmente, planejar experimentos que pudes-sem confrontar hipóteses e dados, para, enfim, tirar conclusões com respeito à per-gunta de pesquisa. Neste trabalho, que se insere na linha do uso de computadores como ferramenta de auxílio ao musicólogo, narramos este processo de investigação, elencando as dificuldades, justificando as escolhas, apresentando os resultados obti-dos e discutindo as lições aprendidas. / The advances in the computer music field throughout the years have brought new possibilities, and also new questions. The automatic generation of music content field has aroused a lot of interest (BILES, 1994); (SAMPAIO, TEDESCO e RAMALHO, 2005); (GIFFORD, 2013), and, with it, many deeper questions about the content gen-erated by these systems were brought into attention. What is the point of such sys-tems? How some concepts such as melody and harmony can be dealt with? Is it pos-sible to generate music that is not just a random sequence of notes or musical ex-cerpts? Narrowing the scope to percussive compositions generative systems, an essen-tial element stands out: the rhythm. What is the impact of a dissonant rhythm within a song? Is it possible to generate neutral rhythms, which could fit into any composition? How to generate a good rhythm? To answer these questions, first of all it is necessary to find the answer to a more fundamental question: how to tell if rhythm A matches rhythm B? The academic literature (including the musical one) on this subject is scarce, and mostly subjective, relying on personal opinions and without empirical basis. In general, the path chosen on the studies is based on what can be done algorithmically, to only then fit the results within the concept of rhythm, making the results unreliable. Therefore, we have decided to take the opposite way, starting from theories and concepts, to only then think about the algorithm. In order to do so, we have asked musicians and researchers to provide us with definitions for rhythm and its most fun-damental characteristics, from which we have built the hypotheses to answer this re-search’s main question. To achieve this, we had to ask musicians for possible hypoth-esis, find a way of representing them computationally, find concrete musical examples (data) and decide how to represent this data computationally, plan experiments that could compare hypothesis against data to, finally, get to conclusions about this re-search’s main question. In this work, which is highly linked with using computers as an auxiliary tool for the musicologist, we describe this investigation process, revealing the difficulties, justifying the choices made, presenting the results obtained and discussing the lessons learned.

Page generated in 0.1194 seconds