Spelling suggestions: "subject:"segmentação dde imagens"" "subject:"segmentação dee imagens""
1 |
Consenso de segmentações de imagens usando classificação de padrõesOLIVEIRA, Wendeson da Silva 22 February 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-14T18:05:13Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-16T20:09:40Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5) / Made available in DSpace on 2018-08-16T20:09:40Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5)
Previous issue date: 2017-02-22 / FACEPE / O processamento e a análise de imagens caracterizam-se em 5 fases: aquisição, préprocessamento, segmentação, representação/descrição, e reconhecimento de imagens. Este trabalho situa-se na área de segmentação de imagens médicas 2D. O principal objetivo da segmentação consiste em dividir uma imagem em regiões ou objetos que a compõem. A segmentação de imagens é alvo de vários estudos e pesquisas para o desenvolvimento de métodos mais abrangentes e computacionalmente mais eficientes, principalmente em imagens médicas. Uma etapa crucial para a extração de informações automatizadas em imagens médicas, geralmente envolve a segmentação das regiões da imagem a fim de quantificar volumes e áreas de interesse de tecidos biológicos para posterior diagnóstico e localização de patologias. Um desafio importante que deve ser levado em consideração no desenvolvimento de algoritmos de segmentação de imagens médicas é como avaliar o desempenho do método. Este tipo de avaliação de desempenho geralmente é feito através da comparação dos resultados de algoritmos automáticos versus uma segmentação de referência, denominada de ground-truth. Em particular, a estimativa de ground-truth em imagens médicas pode ser obtida através do contorno manual ou ainda através de métodos interativos de segmentação. No entanto, essas abordagens podem ser extremamente trabalhosas e sujeitas a variabilidades inter e intra usuários. Uma alternativa para diminuir essa variabilidade é a segmentação utilizando o consenso da resposta de vários usuários para uma mesma imagem. Um método de consenso de segmentações tem a finalidade de combinar várias segmentações de uma mesma imagem. Este trabalho tem como principal objetivo propor uma abordagem para estimar o ground-truth em imagens médicas. A abordagem consiste nas duas principais contribuições deste trabalho. Na primeira, um novo sistema colaborativo COSE (Collaborative Segmentation) foi desenvolvido para obter várias segmentações de uma mesma imagem com o intuito de estimar o ground-truth. Já a segunda, propõe um novo método para o consenso de segmentações de imagens médicas, denominado ISECO (Intelligent SEgmentation COnsensus). Os principais métodos de consenso de segmentações utilizam apenas informações binárias. No entanto, o ISECO apresenta como principal diferencial o fato de utilizar informações extraídas da imagem em nível de cinza para auxiliar na classificação dos pixels em foreground ou background utilizando um modelo de aprendizagem. A extração de características é baseada em três extratores de textura: filtros de Gabor, Local Binary Pattern (LBP) e Local Directional Pattern (LDP). Outra abordagem para o consenso de segmentações, denominada Distance Transform Merge (DTM) também é proposta neste trabalho tendo como objetivo ser um método simples e rápido. Os métodos de consenso propostos são avaliados e comparados com outras abordagens disponíveis na literatura utilizando 4 bases de imagens. A avaliação das abordagens mostra que o ISECO apresenta resultado tão bom ou melhor que os principais métodos da literatura. / Image processing is characterized by five steps: acquisition, pre-processing, segmentation, representation/description and image recognition. In this thesis, we work with the problem the 2D medical image segmentation. The main purpose of image segmentation is to divide an image into regions. Image segmentation has been a subject of several studies and research for the development of more comprehensive and computationally more efficient methods, especially in medical imaging. A challenge that must be taken into account in the development of medical image segmentation algorithms is how to evaluate the performance of the method. This type of performance evaluation is usually done by comparing the results of automatic algorithms versus a reference segmentation, called the ground-truth. In particular, the estimation of ground-truth in medical images can be obtained through manual segmentation or interactive segmentation methods. However, these approaches can be extremely subjective and subject to both intra and inter user variability. An alternative to reduce this variability is image segmentation using the consensus of multiple segmentations of a single image. A segmentation consensus method has the purpose of combining multiple segmentations of the same image. This work proposes an approach to estimate the ground-truth in medical images. The approach consists of two parts. At first, we development a collaborative system called COSE (Collaborative SEgmentation) to obtain various segmentations of the same image in order to estimate the ground-truth. The second proposals is a new method for the consensus of medical image segmentations, called ISECO (Intelligent SEgmentation CCnsensus). The main consensus segmentation methods in the state-of-the-art uses only binary information. However, the ISECO proposes to use gray-scale image information to classify pixels in foreground or background. However, ISECO has as main differential the use of information extracted from the image in gray-scale to assist in the classification of pixels in foreground or background using a learning model. The features extraction is based on three texture extractors: Gabor filters, Local Binary Pattern (LBP) and Local Directional Pattern (LDP). Another approach to segmentation consensus, called Distance Transform Merge (DTM), is also proposed in this work, aiming to be a simple and fast method. The proposed consensus methods are evaluated and compared with other approaches available in the literature using 4 image database. Evaluation of the approaches shows that the ISECO presents better results than the main methods of the literature.
|
2 |
Representação de Imagens Através de Grafos Utilizando o Algoritmo Split And Merge Combinado Com Descritores de Cor e TexturaVENTURA, V. A. 27 August 2009 (has links)
Made available in DSpace on 2016-08-29T15:33:09Z (GMT). No. of bitstreams: 1
tese_2815_.pdf: 3059796 bytes, checksum: a6d79c5c2a1e17afae9982552dffcc95 (MD5)
Previous issue date: 2009-08-27 / Desde os tempos mais remotos, o homem procura e desenvolve ferramentas para facilitar sua vida. O ser humano busca maneiras de serem mais produtivos, eliminando, se possível, as limitações que encontram em seu caminho. Uma das maiores limitações é a ausência de recursos para automatizar tarefas que sem alguma ferramenta significam muito trabalho braçal e muito risco agregado. Limites de orçamento, prazos e recursos também se fazem presentes no cotidiano de pessoas que acabam sendo nem tão eficientes quanto podem, nem tão eficazes quanto querem. Não obstante, automação de determinadas tarefas representa um aumento substancial de produtividade e diminuição de riscos. Ter ferramentas para auxiliar neste trabalho é ter um recurso que permite a várias áreas se comunicar de maneira linear e multi-direcional.
Não é diferente na área de reconhecimento de cenas, uma das linhas de pesquisa mais importantes da área de processamento de imagens. Como o sistema de inspeção visual adotado por algumas empresas é manual, realizado a olho nu, e totalmente dependente do fator humano utilizado no processo, o mesmo não pode garantir totalmente a correspondência entra uma imagem e outra, além de ser uma tarefa trabalhosa, cara e demorada. Muitos algoritmos que tratam do problema de reconhecimento de cenas utilizam a representação da imagem através de grafos em seus trabalhos. Nessas representações, vértices representam objetos e arestas representam as relações espaciais entre os objetos, e informações relevantes ao processo de reconhecimento podem ser extraídos da cena e representadas como atributos do grafo.
O reconhecimento de uma imagem através da comparação com um modelo, quando ambas são representadas por grafos, caracteriza um problema de correspondência de grafos, onde o critério para a correspondência é medido a partir de um valor que mede a similaridade entre vértices (resp. arestas) do modelo e a imagem a ser reconhecida, comumente armazenados em uma matriz de similaridade entre vértices (resp. arestas).
Por vezes, a representação das imagens e a criação das matrizes de similaridades entre vértices (resp. arestas) eram feitos manualmente. Para suprir essa carência, uma interface para a manipulação das imagens e o desenho dos grafos correspondentes, denominada ImGraph, foi construída. A ferramenta permite a criação de grafos de atributos que representem imagens fornecidas como entrada. Dentre suas funcionalidades, destaca-se a geração de grafos para representação de imagens usadas como modelos e imagens a serem reconhecidas a partir dos modelos. Para isso, a ferramenta permite a segmentação manual (no caso do modelo) e automática (no caso da imagem a ser reconhecida) das imagens, além de utilizar funções que combinem os atributos em valores de similaridade.
Portanto, esta dissertação consiste em uma extensão dessa interface. Como aperfeiçoamento da ferramenta, foi sugerida uma nova abordagem para a segmentação automática de imagens, incluindo uma análise mais detalhada da fase de pré-processamento, que consiste na segmentação e extração de características da imagem, ao qual a mesma é submetida antes de ser convertida em um grafo.
Uma combinação de características de cor e textura para segmentação automática de imagens é investigada com o objetivo de aperfeiçoar sua representação através de grafos de atributos. Quanto melhor a segmentação da imagem, melhor será sua representação através de grafos. A análise de informações de cor nem sempre provê informações suficientemente acuradas para segmentação. Daí, características adicionais podem ser consideradas para aprimorar sua representação. A abordagem de segmentação split-and-merge é usada, dividindo a imagem recursivamente em regiões homogêneas cada vez menores, e então unindo-as de acordo com alguma medida de similaridade, computadas nesta dissertação através de medidas de distâncias probabilísticas. Também foi analisada a combinação com o descritor de textura denominado Local Binary Pattern (LBP) com o descritor de cor, partindo da premissa que algumas regiões da imagem avaliada podem ser melhor descritas não apenas por um descritor específico, mas por uma combinação dos mesmos.
Também foi analisada a utilização do PCA (Principal Components Analysis - Análise de Componentes Principais), em que o espaço de cor RGB foi reduzido de três dimensões para uma dimensão através do método.
Segmentada a imagem, a mesma será representada através de grafos de atributos que serão utilizados para a criação das Matrizes de Similaridade, que deverão conter informações acerca da similaridade entre vértices (resp. arestas) entre dois grafos de entrada: o grafo modelo e o grafo que se pretende reconhecer neste modelo. Para a construção das matrizes, foram estudadas duas funções para se verificar a similaridade entre vértices e de arestas
Experimentos foram realizados utilizando-se uma imagem aérea de alta-resolução espacial do Rio Jucu, estado do Espírito Santo. Ao final, todas as novas contribuições foram acrescentadas ao ambiente.
|
3 |
Segmentação de imagens coloridas baseada na mistura de cores e redes neurais / Segmentation of color images based on color mixture and neural networksDiego Rafael Moraes 26 March 2018 (has links)
O Color Mixture é uma técnica para segmentação de imagens coloridas, que cria uma \"Retina Artificial\" baseada na mistura de cores, e faz a quantização da imagem projetando todas as cores em 256 planos no cubo RGB. Em seguida, atravessa todos esses planos com um classificador Gaussiano, visando à segmentação da imagem. Porém, a abordagem atual possui algumas limitações. O classificador atual resolve exclusivamente problemas binários. Inspirado nesta \"Retina Artificial\" do Color Mixture, esta tese define uma nova \"Retina Artificial\", propondo a substituição do classificador atual por uma rede neural artificial para cada um dos 256 planos, com o objetivo de melhorar o desempenho atual e estender sua aplicação para problemas multiclasse e multiescala. Para esta nova abordagem é dado o nome de Neural Color Mixture. Para a validação da proposta foram realizadas análises estatísticas em duas áreas de aplicação. Primeiramente para a segmentação de pele humana, tendo sido comparado seus resultados com oito métodos conhecidos, utilizando quatro conjuntos de dados de tamanhos diferentes. A acurácia de segmentação da abordagem proposta nesta tese superou a de todos os métodos comparados. A segunda avaliação prática do modelo proposto foi realizada com imagens de satélite devido à vasta aplicabilidade em áreas urbanas e rurais. Para isto, foi criado e disponibilizado um banco de imagens, extraídas do Google Earth, de dez regiões diferentes do planeta, com quatro escalas de zoom (500 m, 1000 m, 1500 m e 2000 m), e que continham pelo menos quatro classes de interesse: árvore, solo, rua e água. Foram executados quatro experimentos, sendo comparados com dois métodos, e novamente a proposta foi superior. Conclui-se que a nova proposta pode ser utilizada para problemas de segmentação de imagens coloridas multiclasse e multiescala. E que possivelmente permite estender o seu uso para qualquer aplicação, pois envolve uma fase de treinamento, em que se adapta ao problema. / The Color Mixture is a technique for color images segmentation, which creates an \"Artificial Retina\" based on the color mixture, and quantizes the image by projecting all the colors in 256 plans into the RGB cube. Then, it traverses all those plans with a Gaussian classifier, aiming to reach the image segmentation. However, the current approach has some limitations. The current classifier solves exclusively binary problems. Inspired by this \"Artificial Retina\" of the Color Mixture, we defined a new \"Artificial Retina\", as well as we proposed the replacement of the current classifier by an artificial neural network for each of the 256 plans, with the goal of improving current performance and extending your application to multiclass and multiscale issues. We called this new approach \"Neural Color Mixture\". To validate the proposal, we analyzed it statistically in two areas of application. Firstly for the human skin segmentation, its results were compared with eight known methods using four datasets of different sizes. The segmentation accuracy of the our proposal in this thesis surpassed all the methods compared. The second practical evaluation of the our proposal was carried out with satellite images due to the wide applicability in urban and rural areas. In order to do this, we created and made available a database of satellite images, extracted from Google Earth, from ten different regions of the planet, with four zoom scales (500 m, 1000 m, 1500 m and 2000 m), which contained at least four classes of interest: tree, soil, street and water. We compared our proposal with a neural network of the multilayer type (ANN-MLP) and an Support Vector Machine (SVM). Four experiments were performed, compared to two methods, and again the proposal was superior. We concluded that our proposal can be used for multiclass and multiscale color image segmentation problems, and that it possibly allows to extend its use to any application, as it involves a training phase, in which our methodology adapts itself to any kind of problem.
|
4 |
Segmentação de imagens coloridas baseada na mistura de cores e redes neurais / Segmentation of color images based on color mixture and neural networksMoraes, Diego Rafael 26 March 2018 (has links)
O Color Mixture é uma técnica para segmentação de imagens coloridas, que cria uma \"Retina Artificial\" baseada na mistura de cores, e faz a quantização da imagem projetando todas as cores em 256 planos no cubo RGB. Em seguida, atravessa todos esses planos com um classificador Gaussiano, visando à segmentação da imagem. Porém, a abordagem atual possui algumas limitações. O classificador atual resolve exclusivamente problemas binários. Inspirado nesta \"Retina Artificial\" do Color Mixture, esta tese define uma nova \"Retina Artificial\", propondo a substituição do classificador atual por uma rede neural artificial para cada um dos 256 planos, com o objetivo de melhorar o desempenho atual e estender sua aplicação para problemas multiclasse e multiescala. Para esta nova abordagem é dado o nome de Neural Color Mixture. Para a validação da proposta foram realizadas análises estatísticas em duas áreas de aplicação. Primeiramente para a segmentação de pele humana, tendo sido comparado seus resultados com oito métodos conhecidos, utilizando quatro conjuntos de dados de tamanhos diferentes. A acurácia de segmentação da abordagem proposta nesta tese superou a de todos os métodos comparados. A segunda avaliação prática do modelo proposto foi realizada com imagens de satélite devido à vasta aplicabilidade em áreas urbanas e rurais. Para isto, foi criado e disponibilizado um banco de imagens, extraídas do Google Earth, de dez regiões diferentes do planeta, com quatro escalas de zoom (500 m, 1000 m, 1500 m e 2000 m), e que continham pelo menos quatro classes de interesse: árvore, solo, rua e água. Foram executados quatro experimentos, sendo comparados com dois métodos, e novamente a proposta foi superior. Conclui-se que a nova proposta pode ser utilizada para problemas de segmentação de imagens coloridas multiclasse e multiescala. E que possivelmente permite estender o seu uso para qualquer aplicação, pois envolve uma fase de treinamento, em que se adapta ao problema. / The Color Mixture is a technique for color images segmentation, which creates an \"Artificial Retina\" based on the color mixture, and quantizes the image by projecting all the colors in 256 plans into the RGB cube. Then, it traverses all those plans with a Gaussian classifier, aiming to reach the image segmentation. However, the current approach has some limitations. The current classifier solves exclusively binary problems. Inspired by this \"Artificial Retina\" of the Color Mixture, we defined a new \"Artificial Retina\", as well as we proposed the replacement of the current classifier by an artificial neural network for each of the 256 plans, with the goal of improving current performance and extending your application to multiclass and multiscale issues. We called this new approach \"Neural Color Mixture\". To validate the proposal, we analyzed it statistically in two areas of application. Firstly for the human skin segmentation, its results were compared with eight known methods using four datasets of different sizes. The segmentation accuracy of the our proposal in this thesis surpassed all the methods compared. The second practical evaluation of the our proposal was carried out with satellite images due to the wide applicability in urban and rural areas. In order to do this, we created and made available a database of satellite images, extracted from Google Earth, from ten different regions of the planet, with four zoom scales (500 m, 1000 m, 1500 m and 2000 m), which contained at least four classes of interest: tree, soil, street and water. We compared our proposal with a neural network of the multilayer type (ANN-MLP) and an Support Vector Machine (SVM). Four experiments were performed, compared to two methods, and again the proposal was superior. We concluded that our proposal can be used for multiclass and multiscale color image segmentation problems, and that it possibly allows to extend its use to any application, as it involves a training phase, in which our methodology adapts itself to any kind of problem.
|
5 |
Segmentação de imagens e reconstrução de modelos aplicada a estruturas ósseasMarques, Adriano de Souza [UNESP] 31 October 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:28:33Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-10-31Bitstream added on 2014-06-13T18:34:48Z : No. of bitstreams: 1
marques_as_me_bauru.pdf: 767913 bytes, checksum: e42f98bb723da42894a9fd678bbebcab (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Na biomecânica, a computação tem se tornado uma forte aliada no estudo utilizando-se imagens, pois avanços significativos têm sido verificados devido à evolução das técnicas de aquisição de imagens médicas. Em estruturas ósseas, devido à complexidade das formas geométricas, a obtenção de modelos precisos torna-se um processo difícil, exigindo métodos computacionais igualmente complexos. Por outro lado, a computação gráfica oferece técnicas que possibilitam a adequada manipulação destas imagnes. Entre os diversos métodos existentes, o modelo de contornos ativos, também conhecido como snakes, vem sendo amplamente difundido no processo dd segmentação para extração de estruturas de interesse no contexto médico. Este trabalho utiliza o método de contornos ativos por Fluxo do Vetor Gradiente (GVF) para obtenção das matrizes do contorno de estruturas com geometrias côncavas, neste representado por seções transversais obtidas da tomografia de uma mandíbula humana. Utilizando-se as matrizes obtidas, é gerado um modelo da mandíbula em 3D aplicando-se o método de triangulação foi utilizado o pacote MATLAB®, e para obtenção do modelo tridimensional, foi utilizado o pacote ANSYS®. / In biomechanics, the computer has become a strong ally to study using the images, as significant advances have been recorded owing to technical progress of the acquisition of medical images. In bone structures due to the complexity of geometric shapes, to obtain accurate models becomes a difficult processes, requiring equally complex computational methods. On the other hand, offers computer graphics techniques that enable the appropriate handling of these images. Among the various existing methods, the model of active contours, also known as snakes, have been widely disseminated in hte process of segmentation to extract structures of interest medical. This work uses the method of active contours for Gradient Vector Flow (GVF) to obtain the matrices of the outline of structures with concave geometries, this represented by cross sections obtained from the tomography of a human jaw. Using the matrices obtained, it generated a 3D model of the jaw by applying the method of triangulation between adjacent contours. For the process of segmentation and triangulation was performed using MATLAB® application, and for obtaining three-dimensional model was performed using ANSYS® application.
|
6 |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.Mesquita, Rafael Galvão de 27 February 2013 (has links)
Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-12T13:46:31Z
No. of bitstreams: 2
Dissertacao Rafael Mesquita.pdf: 3995191 bytes, checksum: 5535bd266c779130b6cdd14898d96405 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T12:54:54Z (GMT) No. of bitstreams: 2
Dissertacao Rafael Mesquita.pdf: 3995191 bytes, checksum: 5535bd266c779130b6cdd14898d96405 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T12:54:54Z (GMT). No. of bitstreams: 2
Dissertacao Rafael Mesquita.pdf: 3995191 bytes, checksum: 5535bd266c779130b6cdd14898d96405 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-27 / CNPQ / Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que
sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela
diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao
mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de
uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual
humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção
de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de
documento deve estar de um observador de forma que a região de texto e pequenos detalhes não
sejam mais percebidos, restando assim somente seu background. Para simular o modo como
percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em
série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da
imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo
algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto
como parte do algoritmo. O método proposto foi testado em duas bases de imagens de
documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e
outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados
quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles.
Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de
imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método
de melhores resultados no caso geral.
|
7 |
Investigação de uma arquitetura para reconhecimento dos campos presentes em cheques bancários brasileirosCristine Ferreira, Jeneffer 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:51:42Z (GMT). No. of bitstreams: 1
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / Processamento de Imagem Digital tem por objetivo maior fornecer ferramentas para facilitar a
identificação e extração de informações contidas em imagens digitais. Esta característica
proporciona um aumento significativo no desenvolvimento tecnológico, devido à sua
aplicabilidade em diversas áreas, por exemplo: processamento de cheques bancários, imagens
de satélite, reconhecimento facial e outras.
No contexto de processamento de cheques bancários, a correta localização e obtenção
dos campos de interesse são fatores que influenciam fortemente e positivamente o alto índice
de sucesso no reconhecimento. A obtenção dos campos de interesse é realizada na etapa
segmentação, sendo esta complexa e crítica, devido a ruídos existentes nas imagens.
Este trabalho tem por finalidade a investigação de uma arquitetura para o
reconhecimento automatizado dos campos presentes no cabeçalho dos cheques bancários
brasileiros. A definição da arquitetura foi baseada no estudo das principais características,
técnicas e arquiteturas aplicadas no reconhecimento de imagens digitais de cheques.
Para a etapa de segmentação foi utilizada a técnica Análise por Projeção com objetivo
de localizar e segmentar os campos presentes no cabeçalho dos cheques bancários. Como
resultado foi obtido 97,50 % de acertos na etapa de segmentação dos campos do cabeçalho e
uma média de 87,71% de cheques completamente reconhecidos
|
8 |
Sistema para segmentação de imagens por agrupamento hierárquico baseado no comportamento superparamagnético do modelo de PottsMatos Horta, Michelle January 2004 (has links)
Made available in DSpace on 2014-06-12T15:59:09Z (GMT). No. of bitstreams: 2
arquivo4920_1.pdf: 2771245 bytes, checksum: 173c72727ac29962087807a39d216e3e (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2004 / Recentemente foi estabelecida uma analogia entre o problema de agrupamento e a procura de configurações típicas de um modelo físico, o modelo de Potts. Para ilustrar essa analogia foi desenvolvido um programa, em linguagem C, pelo Professor Eytan Domany, do Departamento de Física de Sistemas Complexos, do Weizmann Institute of Science, de Israel. A função principal desse programa é a realização do agrupamento hierárquico de dados baseado no comportamento superparamagnético do modelo de Potts (SPC - Superparamagnetic Clustering). Essa coleção de agrupamentos é obtida simulando ocorrências de um modelo de Potts não-homogêneo em um estágio intermediário entre as fases ferromagnética e paramagnética. O foco deste trabalho é o desenvolvimento de um sistema que permite a aplicação dessa técnica à segmentação de imagens. Para tanto, foi desenvolvida uma interface, utilizando IDL e ENVI, para auxiliar o usuário na utilização dessa e de outras técnicas de agrupamento e na compreensão dos resultados provenientes de técnicas hierárquicas de agrupamento de dados. Os agrupamentos obtidos s.ao ilustrados através de imagens, de gráficos hierárquicos (dendrogramas) interativos e por animações
|
9 |
Binarização de Imagens de Documentos Históricos Baseada em Imagem de ContrasteARRUDA, Alisson Werner Arruda de 27 February 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-04T18:27:08Z
No. of bitstreams: 2
DISSERTAÇÃO Alisson Werner Arruda.pdf: 4901864 bytes, checksum: ca497864a9da3134128e43273e9f28f3 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-04T18:27:08Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Alisson Werner Arruda.pdf: 4901864 bytes, checksum: ca497864a9da3134128e43273e9f28f3 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-02-27 / CAPES / Binarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).
|
10 |
Medical image segmentation using statistical and fuzzy object shape models = Segmentação de imagens médicas usando modelos estatísticos e nebulosos da forma do objeto / Segmentação de imagens médicas usando modelos estatísticos e nebulosos da forma do objetoPhellan Aro, Renzo, 1989- 27 August 2018 (has links)
Orientador: Alexandre Xavier Falcão / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-27T03:30:14Z (GMT). No. of bitstreams: 1
PhellanAro_Renzo_M.pdf: 4734368 bytes, checksum: 27f258762d497b786df234144140e47a (MD5)
Previous issue date: 2014 / Resumo: A segmentação de imagens médicas consiste de duas tarefas fortemente acopladas: reconhecimento e delineamento. O reconhecimento indica a localização aproximada de um objeto, enquanto o delineamento define com precisão sua extensão espacial na imagem. O reconhecimento também verifica a corretude do delineamento do objeto. Os seres humanos são superiores aos computadores na tarefa de reconhecimento, enquanto o contrário acontece no delineamento. A segmentação manual, por exemplo, é geralmente passível de erro, tediosa, demorada e sujeita à variabilidade. Portanto, os métodos de segmentação interativa mais eficaces limitam a intervenção humana ao reconhecimento. No caso das imagens médicas, os objetos podem ser as estruturas anatômicas do corpo humano, como órgãos, sistemas e tumores. Sua segmentação é uma fase fundamental para obter medidas, como seus tamanhos e distâncias, para poder realizar sua análise quantitativa. A visualização de suas formas em 3D também é importante para sua análise qualitativa. Ambas análises podem ajudar os especialistas a estudar os fenómenos anatômicos e fisiológicos do corpo humano, diferenciar situações normais e anormais, diagnosticar doenças, estabelecer tratamentos, monitorar a evolução dos tumores e planejar procedimentos cirúrgicos. No entanto, um desafio crucial para a segmentação automática é obter um modelo matemático que possa substituir os seres humanos, capaz de reconhecer as estruturas anatômicas com base em suas características de textura e forma. Esta dissertação estuda duas aproximações importantes para este problema: os Modelos Estatísticos da Forma do Objeto (SOSMs) e os Modelos Nebulosos da Forma do Objeto (FOSMs). Os SOSMs são popularmente conhecidos como métodos de segmentação baseados em atlas e têm sido utilizados amplamente e com suceso em muitas aplicações. Porém, eles precisam do registro deformável das imagens --- um processo demorado que mapeia as imagens em um mesmo sistema de coordenadas (referência), que limita seu uso em estudos com grandes conjuntos de imagens. Os FOSMs são modelos mais recentes que podem ser significativamente mais eficientes que os SOSMs, mas precisam de métodos mais eficazes de reconhecimento e delineamento. Esta dissertação compara pela primeira vez os prós e contras dos SOSMs e FOSMs, utilizando conjuntos de imagens médicas de diferentes modalidades e estruturas anatômicas / Abstract: Image segmentation consists of two tightly coupled tasks: recognition and delineation. Recognition indicates the whereabouts of a desired object, while delineation precisely defines its spatial extent in the image. Recognition also verifies the correctness of the object's delineation. Humans are superior to computers in recognition and the other way around is valid for delineation. Manual segmentation, for instance, is usually considered error-prone, tedious, time-consuming, and subject to inter-observer variability. Therefore, the most effective interactive segmentation methods reduce human intervention to the recognition tasks. In medical images, objects may be body anatomical structures, such as organs, organ systems, and tumors. Their segmentation is a fundamental step to extract measures, such as sizes and distances for quantitative analysis. The visualization of their 3D shapes is also important for qualitative analysis. Both can help experts to study anatomical and physiological phenomena of the human body, differentiate between normal and abnormal, diagnose a disease, establish a treatment, monitor the evolution of a tumor, and plan a surgical procedure. However, a crucial challenge in automated segmentation is to obtain a surrogate mathematical model for humans, able to recognize the anatomy of such structures based on their texture and shape properties. This dissertation investigates two important approaches for this problem: the Statistical Object Shape Models (SOSMs) and the Fuzzy Object Shape Models (FOSMs). SOSMs are popularly known as atlas-based segmentation methods and have been extensively and successfully used in many applications. However, they require deformable image registration --- a time-consuming operation to map images into a common (reference) coordinate system, which limits their use in studies with large image datasets. FOSMs are more recent and can be significantly more efficient than SOSMs, but they require more effective recognition and delineation methods. This dissertation compares for the first time the pros and cons of SOSMs and FOSMs, using image datasets from distinct medical imaging modalities and anatomical structures of the human body / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
Page generated in 0.1009 seconds