• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 138
  • 18
  • 12
  • 12
  • 12
  • 9
  • 8
  • 8
  • 8
  • 6
  • 3
  • 1
  • Tagged with
  • 160
  • 160
  • 160
  • 92
  • 89
  • 68
  • 62
  • 40
  • 39
  • 35
  • 34
  • 33
  • 31
  • 28
  • 28
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Visão estéreo para auxílio à navegação autônoma em ambientes agrícolas /

Trentini, Vinicius Bergoli January 2015 (has links)
Orientador: Mario Luiz Tronco / Coorientador: Aparecido Nilceu Marana / Banca: Emerson Carlos Pedrino / Banca: Maurilio Boaventura / Resumo: Com o objetivo de atingir a maior produtividade possível, a agricultura de precisão tenta utilizar as melhores técnicas da agricultura tradicional combinadas com equipamentos muito eficientes em suas funções específicas. No contexto da visão computacional, o desenvolvimento de um sistema autônomo de navegação voltado para ambientes agrícolas rurais e externos, possui, além das dificuldades encontradas em ambientes fechados e controlados, adversidades características, tais como terrenos irregulares e problemas com a iluminação não controlada. Com a utilização de visão estéreo para navegação em um ambiente externo agrícola é possível, por meio da geração do mapa de disparidades e da matriz de disparidade "V", verificar através de qual profundidade uma área é navegável com apenas uma cena, e ainda mapear anteparos e deformações durante o trajeto. Com base nesse mapeamento dos objetos, pode-se então desenvolver uma navegação livre de possíveis obstáculos. O objetivo desse trabalho foi, considerando-se um ambiente externo agrícola, mapear os objetos da cena de acordo com a sua profundidade, de forma que possa ser identificado um caminho livre para a navegação. Experimentos foram realizados utilizando-se uma base de dados própria, contendo 5.379 imagens capturadas em forma de sequências de vídeo, todas representando o ambiente selecionado para testes. A metodologia desenvolvida apresentou uma taxa de acerto de aproximadamente 92%, com resultados calculados em tempo real, provando-se portanto, ser uma técnica eficiente para a navegação autônoma em ambientes agrícolas e externos / Abstract: efficient equipments on its specific functions. Considering the context of computer vision, the development of an autonomous navigation system aimed to external rural farming environments, considers, besides the difficulties faced on closed and controlled environments, which can be targeted as irregular lands and problems with not controlled lighting. By using the stereo vision to perform the navigation in an external farming environment is possible, through the creation of the disparity map, and the v-disparity matrix, verify through what depth an area is possible to be navigated with just one scene and still map the obstacles and deflections along the way. Therefore, calculating the disparity map of the observed scene, it is possible, using the v-disparity matrix, map the objects in the scene according to their depth. Based on the mapping of the objects it is possible to perform a obstructions free navigation along all the way. The aim of this study is, considering an external agricultural environment, map the objects in the scene according to their depth making it possible to identify an obstruction free navigation path. Experiments were performed using an own database, composed of 5.379 pictures in video sequence form, all representing the test's environment. The developed methodology showed an accuracy rate of approximately 92%, with results calculated in real time, proving itself, as an efficient technique for autonomous navigation in agricultural and external areas / Mestre
72

Proposta de bag-of-visual-words por meio de redes complexas / A bag-of-visual-words approach through complex networks

Lima, Geovana Veloso Loureiro de 01 August 2017 (has links)
O uso de sementes vigorosas é primordial para o sucesso da lavoura. Dentre as técnicas de análise de sementes que objetivam identificar o vigor do lote das sementes, o teste tetrazólio se destaca pelo número de informações fornecidas. Porém, o teste tetrazólio tem o resultado fortemente atrelado ao empirismo dos analistas de sementes. O presente trabalho objetiva o desenvolvimento de uma metodologia de avaliação automática por meio de imagens do vigor da sementes de soja submetidas ao teste tetrazólio, que sirva de contraprova para o analista de sementes, a fim de aumentar a confiabilidade e acelerar os resultados. Foi utilizado o método Bag-of-Visual-Words e realizado experimentos com diferentes detectores e descritores da literatura a fim de encontrar o pipeline que apresentasse o melhor custo-benefício na categorização do vigor de sementes, sendo obtido 78.95% de acurárica média como melhor resultado. Neste trabalho também foi proposto a utilização de Redes Complexas na etapa de descrição do método Bag-of-Visual-Words. A metodologia proposta utilizando apenas um limiar na etapa de análise de subgrafos apresentou resultados melhores que utilizando todos os limiares, além de apresentar maior custo-benefício do que alguns métodos de descrição em Bag-of-Visual-Words populares na literatura. Tais resultados identificam o conjunto de detectores e descritores do método Bag-of-Visual-Words que apresentam maior acurácia e melhor custo-benefício para a análise do vigor das sementes submetidas ao teste tetrazólio, além da proposta da fusão dos métodos Bag-of-Visual-Words e Redes Complexas e da utilização de apenas um limiar na descrição de imagens utilizando Redes Complexas. / The use of vigorous seeds is paramount to the success of the crop. Among the techniques of seed analysis that aim to identify seed batch vigor, the tetrazolium test stands out for the number of information provided. However, the tetrazolium test has the result strongly tied to the empiricism of the seed analysts. The present work aims to develop a methodology of automatic evaluation by means of images of the vigor of the soybean seeds submitted to the tetrazolium test, which serves as a check for the seed analyst, in order to increase the reliability and accelerate the results. It was used the Bag-of-Visual-Words method and conducted experiments with different detectors and descriptors of the literature in order to find the pipeline that presented the best cost-benefit in the categorization of seed vigor, obtaining 78.95% of average accuracy as the best result. In the present work it was also proposed the use of Complex Networks in the description stage of the Bag-of-Visual-Words method. The methodology proposed using only one threshold in the subgraph analysis step presented better results than all the thresholds, in addition to being more cost-effective than some methods of description in Bag-of-Visual- Words popular in the literature. These results identify the set of detectors and descriptors of the Bag-of-Visual-Words method that are more accurate and cost-effective for the vigor analysis of the seeds submitted to the tetrazolium test, besides the proposed merger of the Bag-of- Visual-Words and Complex Network.
73

Mineraçao de imagens

Vieira, Everton Vidal, Bellon, Olga Regina Pereira, 1962- 10 February 2011 (has links)
Resumo: A crescente facilidade de obtenção, geração e armazenamento de imagens abre a possibilidade para que novas aplicações sejam criadas, envolvendo principalmente a consulta, recuperação, análise e descoberta de conhecimento em grandes bases de imagens. Para extrair conhecimento dessa base, são necessários sistemas e algoritmos que possam ser aplicados a um grande volume de dados e ao mesmo tempo possam classificar, encontrar padrões e relacionamentos de maneira eficiente. Nesse contexto, uma nova tecnologia emerge, Mineração de Imagens, combinando técnicas de diversas áreas ou domínios. Esse trabalho tem dois objetivos principais: (1) apresentar os conceitos de Mineração de Imagens e seu relacionamento com outras disciplinas, e; (2) modelar e implementar uma ferramenta de Mineração de Imagens para ser aplicada a uma base de imagens de profundidade. Para atingir o primeiro objetivo, será apresentada uma revisão de algumas definições de Mineração de Dados e Visão Computacional, bem como as fases que compõem o processo de Mineração. Para alcançar o segundo objetivo, foi desenvolvida uma aplicação em Java que utiliza algoritmos de mineração como auxílio a um Sistema de Recuperação de Imagens por Conteúdo (SRIC), incorporando o conhecimento gerado no cálculo da similaridade entre imagens.
74

Composição de dicionários visuais utilizando agrupamento de dados por Florestas de Caminhos Ótimos

Afonso, Luis Claudio Sugi [UNESP] 08 February 2012 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:29:40Z (GMT). No. of bitstreams: 0 Previous issue date: 2012-02-08Bitstream added on 2014-06-13T20:39:07Z : No. of bitstreams: 1 afonso_lcs_me_sjrp.pdf: 1900274 bytes, checksum: c783872b797e29ec8b252cabf0ffa664 (MD5) / Categorização de imagens utilizando Dicionário de Palavras Visuais tem recebido grande atenção pelas comunidades de visão computacional e processamento de imagens. Nesta abordagem, cada imagem é representada por um conjuntode pontos invariantes, os quais são mapeados no espaço de Hilbert, o qual é uma extensão do plano Euclideano e espaço 3D tendo qual quer número finito ou infinito de dimensões, representando um dicionário visual composto das características mais representativas de um conjunto de imagens. Contudo, o principal problema de tal abordagem é encontrar um dicionário que seja compacto e, ao mesmo tempo, representativo. Encontrar tal dicionário de maneira automática, sem auxílio de um usuário, é uma tarefa ainda mais difícil. Neste trabalho, é proposto um método para encontrar o dicionário de maneira automática empregando um algoritmo baseado em grafos denominado Floresta de Caminhos Ótimos, o qual não necessita da dimensão do dicionário para encontrá-lo. Os experimentos envolveram o uso de 3 bases de imagens de objetos variados e realizando-se umacomparação entre a técnica apresentada e as técnicas K-médias e Seleção Aleatória. A comparação avaliou o tempo necessário para que cada técnica compute os dicionários e a taxa de acerto proporcionada pelos dicionários. Os resultados experimentais monstraram que o algoritmo Floresta de Caminhos Ótimos é uma alternativa a ser empregada na técnica Dicionário de Palavras Visuais, uma vez que as taxas de acerto são similares as demais técnicas, possui vantagem quando dicionários de alta dimensão devem ser calculadose, principalmente, não necessita que a dimensão do dicionário visual seja definido a priori / Image categorization by means of bag of visual words has received increasing attention by the image processing and vision communities in the last years. In these approaches, each image is represented by invariant points of interest which are mapped to a Hilbert Space, which is an extension of traditionals Euclidean plane and 3D space having any finite or infinite number of dimensions, representing a visual dictionary which aims at comprising the most discriminative features in a set of images. Notwithstanding, the main problem of such approaches is to find a compact and representative dictionary. Finding such representative dictionary automatically with no user intervention is an even more difficult task. In this work, we propose a method to automatically find such dictionary by employing a recent developed graph-based n˜ao-supervisionado algorithm called Optimum-Path Forest, which does not make any assumption about the visual dictionary’s size. Experiments were performed on 3 different databases of different objects in order to compare OPF n˜ao-supervisionado, K-means and Random Selection. The comparison assessed the time for each technique to compute the visual dictionaries and the accuracy rate when such visual dictionaries are used. The experimental results showed that OPF n˜ao-supervisionado is an alternate algorithm for the visual dictionary generation, since accuracy rates are similar, presents a time advantage when high-dimension dictionaries have to be computed and does not require visual dictionary dimension prior its computing
75

Proposta de uma ferramenta de visualização e realidade virtual para o monitoramento de tráfego de redes de computadores

Rosante, Júnior César [UNESP] 01 July 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:29:40Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-07-01Bitstream added on 2014-06-13T19:59:32Z : No. of bitstreams: 1 rosante_jc_me_sjrp.pdf: 1765226 bytes, checksum: bfc3f77e8d33f9654175566f55540d84 (MD5) / O crescimento das redes de computadores e telecomunicações assim como do número de dispositivos conectados a essas provoca um aumento expressivo da quantidade de tráfego de dados gerando maior dificuldade no seu gerenciamento e demandas crescentes da necessidade de prover segurança dos dados e continuidade dos serviços de rede prestados pelas instituições. Existem ferramentas para auxiliar no trabalho de monitoramento de redes como o Tcpdump e o Snort. Este auxilia no trabalho de detecção e bloqueio de tráfegos maliciosos como portscans e ataques de denial of services (DoS) através da análise de tráfego por verificação de assinaturas e padrões. Ainda que sejam de suma importância, ferramentas deste tipo descartam a capacidade cognitiva do ser humano de aprendizado e reconhecimento de padrões. Para contornar essa carência e aproveitar a capacidade de cognição visual humana, este trabalho propõe o uso de conceitos de Realidade Virtual aliados a Visualização de Informação na implementação de uma ferramenta de visualização de informações. Esta deve apresentar os dados brutos do tráfego da rede através de novas perspectivas e metáforas visuais utilizando as técnicas de Realidade Virtual com suas características de imersão, interação e envolvimento em um espaço sintético tridimensional. A representação do tráfego de rede através de metáforas visuais pela ferramenta desperta o senso cognitivo do administrador de redes possibilitando a identificação de tráfego anômalo e de comportamentos estranhos. A ferramenta deve fornecer possibilidades de configurações para exibir diferentes aspectos do tráfego servindo tanto para auxílio administrativo de comportamentos dos usuários quanto para análise e detecção de acessos maliciosos / The growth of computer networks and telecommunications as well as the number of devices connected to these causes a significant increase in the amount of data traffic generating greater difficulty in its management and growing demands on the need to provide data security and continuity of network services provided institutions. There are tools to assist in the work of monitoring networks such as Tcpdump and Snort. This helps in detecting and blocking malicious traffic and attacks such as portscans and denial of service (DoS) attacks by analyzing traffic for verification of signatures and patterns. Though they are very important, tool of this type discard the cognitive capacity of human learning and pattern recognition. To address this need and the ability to take advantage of human visual cognition, this work proposes the use of concepts of Virtual Reality to Information Visualization in the implementation of an information visualization tool. This should provide the raw data of network traffic through new perspectives and visual metaphors using Virtual Reality techniques to their characteristics of immersion, interaction and involvement in a synthetic three-dimensional space. The representation of network traffic through visual metaphors for the cognitive tool awakens the sense of enabling network administrators to identify anomalous traffic and strange behavior. The tool should give you plenty of settings to display different aspects of traffic serving both to assist administrators and users' behavior for analysis and detection of malicious access
76

Posicionamento de múltiplos objetos a partir de visão estéreo

Vasquez, Ximena Mariel Zeballos January 2015 (has links)
Made available in DSpace on 2015-11-14T01:06:09Z (GMT). No. of bitstreams: 1 000476062-Texto+Completo-0.pdf: 11312926 bytes, checksum: 32b5c8685befd12b44da93360c230661 (MD5) Previous issue date: 2015 / The following study is about the estimation of three-dimensional position of multiple objects captured in images in a stereo vision setting. The mathematical formalism begins with the representation of motion in Euclidean space. After that, the projection of the images is performed in an ideal camera perspective using homogeneous coordinates. This results in the intrinsic and extrinsic parameters, which are part of the camera calibration. From that, stereo vision is used to obtain three-dimensional position of objects that are captured in the images from two cameras. Thus, depths of various objects are obtained to reconstruct their positions. The validation of the proposed algorithms are made through an experiment built for this purpose. This experiment uses two cameras with semi-parallel views to the center. In the center of the environment there is a gimbal platform, which performs a uniform motion. Above, there is a plan with three white dots, simulating the objects position. This motion captures two images, which are processed by the proposed algorithm. The validation consists in making a comparison between the orientation planes of the gimbal servomotors and reconstruction objects. / Este trabalho trata da estimação da posição tridimensional de múltiplos objetos a partir de imagens capturadas em um ambiente de visão estéreo. O formalismo matemático utilizado no projeto do sistema de visão estéreo inicia-se com a representação de cenário, levando todo o ambiente para um espaço euclidiano, também chamado de representação em três dimensões. Depois de representar o espaço euclidiano no sistema de visão estéreo, leva-se esse formalismo às projeções das imagens numa perspectiva da câmera ideal em coordenadas homogêneas, das quais se obtém a câmera com parâmetros intrínsecos e extrínsecos. A partir disso, utilizam-se os conceitos de visão estéreo e triangularização entre as câmeras para calcular a profundidade dos diversos objetos presentes no cenário. Assim, a reconstrução tridimensional da imagem é obtida. A validação dos algoritmos propostos é feita através de um experimento construído especialmente para o sistema de visão estéreo, em que foram colocadas duas câmeras com vistas semiparalelas em um ambiente, sendo também adicionada uma plataforma do tipo gimbal movimentando-se em três dimensões. Acima dessa, é colocado um plano com três pontos (marcadores), os quais simulam o movimento de três objetos. A partir daí, são capturadas duas imagens a serem processadas mediante os algoritmos propostos, resultando na reconstrução dos pontos no espaço tridimensional. O processo de validação se dá através da comparação entre as orientações dos planos fornecidos pelo algoritmo proposto e pelos comandos dos servomotores do gimbal.
77

Análise multiescala de formas planas baseada em estatísticas da transformada de Hough /

Ramos, Lucas Alexandre. January 2016 (has links)
Orientador: Aparecido Nilceu Marana / Banca: Jurandy Gomes de Almeida Junior / Banca: João Paulo Papa / Resumo:Atualmente, dada a difusão dos computadores, a tarefa de se reconhecer padrões visuais está sendo cada vez mais automatizada, em especial para tratar a vasta e crescente quantidade de imagens digitais existentes. Aplicações de diversas áreas como biometria, recuperação de imagens baseada em conteúdo e diagnóstico médico, se valem do processamento de imagens, bem como de técnicas de extração e análise de características das mesmas, a fim de identificar pessoas, objetos, gestos, textos, etc. As características básicas que são utilizadas para a análise de imagens são: cor, textura e forma. Recentemente, foi proposto um novo descritor de formas denominado HTS (Hough Transform Statistics), o qual se baseia no espaço de Hough para representar e reconhecer objetos em imagens por suas formas. Os resultados obtidos pelo HTS sobre bases de imagens públicas têm mostrado que este novo descritor, além de apresentar altas taxas de acurácia, melhores do que muitos descritores tradicionais propostos na literatura, é rápido, pois tem um algoritmo de complexidade linear. O objetivo deste trabalho foi explorar as possibilidades de representação multiescala do HTS e, assim, propor novos descritores de formas. Escala é um parâmetro essencial em Visão Computacional e a teoria de espaço-escala refere-se ao espaço formado quando se observa, simultaneamente, os aspectos espaciais de uma imagem em várias escalas, sendo a escala a terceira dimensão. Os novos métodos multiescala propostos foram avaliados sobre várias bases de dados e seus desempenhos foram comparados com o desempenho do HTS e com os principais descritores de formas encontrados na literatura. Resultados experimentais mostraram que os novos descritores propostos neste trabalho são mais rápidos e em alguns casos também mais precisos / Abstract: Currently, given the widespread of computers through society, the task of recognizing visual patterns is being more and more automated, in particular to treat the large and growing amount of digital images available. Applications in many areas, such as biometrics, content-based image retrieval, and medical diagnostic, make use of image processing, as well as techniques for the extraction and analysis of their characteristics, in order to identify persons, objects, gestures, texts, etc. The basic features that are used for image analysis are: color, texture and shape. Recently, it was proposed a new shape descriptor called HTS (Hough Transform Statistics), which is based on the Hough space to represent and recognize objects in images by their shapes. The results obtained by HTS on public image databases have shown that this new shape descriptor, besides showing high accuracy levels, better than many traditional shape descriptors proposed in the literature, is fast, since it has an algorithm of linear complexity. In this dissertation we explored the possibilities of a multiscale and scale-space representation of this new shape descriptor. Scale is a key parameter in Computer Vision and the theory of scale-space refers to the space formed when observing, simultaneously, special aspects of an image at several scales, being the scale the third dimension. The multiscale HTS methods were evaluated on the same databases and their performances were compared with the main shape descriptors found in the literature and with the monoscale HTS. Experimental results showed that these new descriptors are faster and can also be more accurate in some cases / Mestre
78

Composição de dicionários visuais utilizando agrupamento de dados por Florestas de Caminhos Ótimos /

Afonso, Luis Claudio Sugi. January 2013 (has links)
Orientador: João Paulo Papa / Coorientador: Aparecido Nilceu Marana / Banca: Ricardo da Silva Torres / Banca: Ivan Rizzo Guilherme / Resumo: Categorização de imagens utilizando Dicionário de Palavras Visuais tem recebido grande atenção pelas comunidades de visão computacional e processamento de imagens. Nesta abordagem, cada imagem é representada por um conjuntode pontos invariantes, os quais são mapeados no espaço de Hilbert, o qual é uma extensão do plano Euclideano e espaço 3D tendo qual quer número finito ou infinito de dimensões, representando um dicionário visual composto das características mais representativas de um conjunto de imagens. Contudo, o principal problema de tal abordagem é encontrar um dicionário que seja compacto e, ao mesmo tempo, representativo. Encontrar tal dicionário de maneira automática, sem auxílio de um usuário, é uma tarefa ainda mais difícil. Neste trabalho, é proposto um método para encontrar o dicionário de maneira automática empregando um algoritmo baseado em grafos denominado Floresta de Caminhos Ótimos, o qual não necessita da dimensão do dicionário para encontrá-lo. Os experimentos envolveram o uso de 3 bases de imagens de objetos variados e realizando-se umacomparação entre a técnica apresentada e as técnicas K-médias e Seleção Aleatória. A comparação avaliou o tempo necessário para que cada técnica compute os dicionários e a taxa de acerto proporcionada pelos dicionários. Os resultados experimentais monstraram que o algoritmo Floresta de Caminhos Ótimos é uma alternativa a ser empregada na técnica Dicionário de Palavras Visuais, uma vez que as taxas de acerto são similares as demais técnicas, possui vantagem quando dicionários de alta dimensão devem ser calculadose, principalmente, não necessita que a dimensão do dicionário visual seja definido a priori / Abstract: Image categorization by means of bag of visual words has received increasing attention by the image processing and vision communities in the last years. In these approaches, each image is represented by invariant points of interest which are mapped to a Hilbert Space, which is an extension of traditionals Euclidean plane and 3D space having any finite or infinite number of dimensions, representing a visual dictionary which aims at comprising the most discriminative features in a set of images. Notwithstanding, the main problem of such approaches is to find a compact and representative dictionary. Finding such representative dictionary automatically with no user intervention is an even more difficult task. In this work, we propose a method to automatically find such dictionary by employing a recent developed graph-based n˜ao-supervisionado algorithm called Optimum-Path Forest, which does not make any assumption about the visual dictionary's size. Experiments were performed on 3 different databases of different objects in order to compare OPF n˜ao-supervisionado, K-means and Random Selection. The comparison assessed the time for each technique to compute the visual dictionaries and the accuracy rate when such visual dictionaries are used. The experimental results showed that OPF n˜ao-supervisionado is an alternate algorithm for the visual dictionary generation, since accuracy rates are similar, presents a time advantage when high-dimension dictionaries have to be computed and does not require visual dictionary dimension prior its computing / Mestre
79

Processamento de fotomicrografias por meio da transformada wavelet starlet /

Siqueira, Alexandre Fioravante de. January 2015 (has links)
Orientador: Aldo Eloizo Job / Co-orientador: Aylton Pagamisse / Banca: Eniuce Manezes de Souza / Banca: Deuber Lincon da Silva Agostini / Banca: Eduardo Augusto Campos Curvo / Banca: Messias Meneguette Junior / O Programa de Pós Graduação em Ciência e Tecnologia de Materiais, PosMat, tem caráter institucional e integra as atividades de pesquisa em materiais de diversos campi / Resumo: Microscopias têm sido utilizadas para avaliação da morfologia de diferentes estruturas de materiais. Entretanto, seus resultados podem ser afetados por vários fatores externos. Técnicas de processamento de imagens podem ser empregadas para atenuar esses fatores, aprimorando os resultados. Neste estudo é proposto um método de segmentação de fotomicrografias em vários níveis, denominado Segmentação Starlet Multinível (MLSS), fundamentado na transformada walvelet starlet, uma walvelet não-decimada. A escolha de um nível ótimo de segmentação se dá pela técnica de nome Segmentação Starlet Ótima Multinível (MLSOS), que se baseia nos resultados da MLSS e no coeficiente de correlação de Matthews (MCC) faz a comparação entre as segmentações obtidas e imagens ground truth, elegendo a melhor segmentação para a imagem de entrada. Os métodos são avaliados pelos valores de precisão, sensibilidade e exatidão. MLSS e MLSOS deram origem ao software livre Jansen-MIDAS, voltando ao uso dessas técnicas pelo usuário final. O programa foi utilizado na separação de elementos em imagens de diferentes materiais, a saber: nanoportículas de ouro em amostras de borracha natural traços de fissão em cristais de epídoto. Nessas aplicações, o método proposto apresentou exatidão maior que 87% para as imagens de teste / Abstract: Microscopies have been used for morphology evaluation of different materials structures. However, their results can be affected by several external factors. Image processing techniques can be used to attenuate these factors, improving the results. In this study we propose a method for segmentation of photomicrographs, denominated Multi-Level Startelet Segmentation (MLSS), based on the starlet wavelet transform. The choise of an optimal segmentation level is given by Multi-Level Optimal Segmentation (MLSOS), that uses MLSS results and the Matthews correlation coefficient (MCC). MCC compares the obtained segmentations and ground truth images, choosing the best segmentation for the input image. MLSS and MLSOS are evaluated using precision, recall and accuracy. Jansen-MIDAS, an open-source software from these methods, allows using MLSS and MLSOS by the end user. This software was employed in the separation of elements in images of different materials, namely gold nanoparticles in natural rubber samples and fission tracks in epidote crystals. In these applications, the proposed method presented accuracy higher than 87% for all test images / Doutor
80

Desenvolvimento de um método semiautomático para geração de ground truths de vídeos /

Gaspari, Tiago De. January 2015 (has links)
Orientador: Antonio Carlos Sementille / Coorientador: Silvio Ricardo Rodrigues Sanches / Banca: João Paulo Papa / Banca: Valdinei Freire da Silva / Resumo: Vários algoritmos de segmentação de vídeo em duas camadas, para a extração de elementos de interesse em primeiro plano (normalmente pessoas) em ambientes não controlados, vem sendo propostos, para diversas aplicações como sistemas de Realidade Aumentada, video chats, ou para a compressão de vídeos. Para analisar a qualidade dos vídeos gerados pelos algoritmos de segmentação, diversos métodos os comparam com seus respectivos ground truths, que consistem em referências da melhor segmentação possível de um vídeo. Muitas vezes esse ground truth é obtido de forma manual, ou seja, o usuário pode ter que segmentar cada quadro (frame) do vídeo. Naturalmente este processo é trabalhoso, demorado e muitas vezes não é realizado para todos os quadros que constituem o vídeo. Devido a isto, também, muitas vezes o ground truth possui baixa resolução e curta duração. Estes aspectos podem constituir um problema quanto à eficácia da utilização do próprio ground truth no processo de avaliação da qualidade da segmentação. Neste contexto, o presente projeto teve como principal enfoque o desenvolvimento de um método semiautomático para a geração de ground truths de vídeos, utilizando informações de profundidade, visando a minimização da interação do usuário, o processo de implementação deste método na forma de uma ferramenta que combina etapas automáticas e interativas, assim como os resultados obtidos são comparados a outros trabalhos presentes na literatura / Abstract: Several bilayer video segmentation algorithms, for the extraction of elements of interest in the foreground (usually people) in uncontrolled environments, have been proposed for various applications such as Augmented Reality systems, video chats or for video compression. To analyze the quality of the videos generated by the segmentation algorithms, different methods compare them with their ground truths, which consist of references of the best possible segmentation of a video. Usually this ground truth is obtained manually, so the user may have to segment each frame of the video. Of course this process is laborious, time consuming and frequently not performed for all frames of the video. Because of this, the ground truth, usually, has low resolution and short duration. These aspects can be an issue to the effectiveness of using these ground truths in the segmentation quality evaluation process. In this context, this project had as its main focus the development of a semi-automatic method for the generation of ground truths of videos, using depth information, in order to minimize the user interaction, the implementation process of this method as a tool that combines automatic and interactive steps, and the results, that are compared to other studies in literature / Mestre

Page generated in 0.0904 seconds