Made available in DSpace on 2016-08-29T15:33:09Z (GMT). No. of bitstreams: 1
tese_2815_.pdf: 3059796 bytes, checksum: a6d79c5c2a1e17afae9982552dffcc95 (MD5)
Previous issue date: 2009-08-27 / Desde os tempos mais remotos, o homem procura e desenvolve ferramentas para facilitar sua vida. O ser humano busca maneiras de serem mais produtivos, eliminando, se possível, as limitações que encontram em seu caminho. Uma das maiores limitações é a ausência de recursos para automatizar tarefas que sem alguma ferramenta significam muito trabalho braçal e muito risco agregado. Limites de orçamento, prazos e recursos também se fazem presentes no cotidiano de pessoas que acabam sendo nem tão eficientes quanto podem, nem tão eficazes quanto querem. Não obstante, automação de determinadas tarefas representa um aumento substancial de produtividade e diminuição de riscos. Ter ferramentas para auxiliar neste trabalho é ter um recurso que permite a várias áreas se comunicar de maneira linear e multi-direcional.
Não é diferente na área de reconhecimento de cenas, uma das linhas de pesquisa mais importantes da área de processamento de imagens. Como o sistema de inspeção visual adotado por algumas empresas é manual, realizado a olho nu, e totalmente dependente do fator humano utilizado no processo, o mesmo não pode garantir totalmente a correspondência entra uma imagem e outra, além de ser uma tarefa trabalhosa, cara e demorada. Muitos algoritmos que tratam do problema de reconhecimento de cenas utilizam a representação da imagem através de grafos em seus trabalhos. Nessas representações, vértices representam objetos e arestas representam as relações espaciais entre os objetos, e informações relevantes ao processo de reconhecimento podem ser extraídos da cena e representadas como atributos do grafo.
O reconhecimento de uma imagem através da comparação com um modelo, quando ambas são representadas por grafos, caracteriza um problema de correspondência de grafos, onde o critério para a correspondência é medido a partir de um valor que mede a similaridade entre vértices (resp. arestas) do modelo e a imagem a ser reconhecida, comumente armazenados em uma matriz de similaridade entre vértices (resp. arestas).
Por vezes, a representação das imagens e a criação das matrizes de similaridades entre vértices (resp. arestas) eram feitos manualmente. Para suprir essa carência, uma interface para a manipulação das imagens e o desenho dos grafos correspondentes, denominada ImGraph, foi construída. A ferramenta permite a criação de grafos de atributos que representem imagens fornecidas como entrada. Dentre suas funcionalidades, destaca-se a geração de grafos para representação de imagens usadas como modelos e imagens a serem reconhecidas a partir dos modelos. Para isso, a ferramenta permite a segmentação manual (no caso do modelo) e automática (no caso da imagem a ser reconhecida) das imagens, além de utilizar funções que combinem os atributos em valores de similaridade.
Portanto, esta dissertação consiste em uma extensão dessa interface. Como aperfeiçoamento da ferramenta, foi sugerida uma nova abordagem para a segmentação automática de imagens, incluindo uma análise mais detalhada da fase de pré-processamento, que consiste na segmentação e extração de características da imagem, ao qual a mesma é submetida antes de ser convertida em um grafo.
Uma combinação de características de cor e textura para segmentação automática de imagens é investigada com o objetivo de aperfeiçoar sua representação através de grafos de atributos. Quanto melhor a segmentação da imagem, melhor será sua representação através de grafos. A análise de informações de cor nem sempre provê informações suficientemente acuradas para segmentação. Daí, características adicionais podem ser consideradas para aprimorar sua representação. A abordagem de segmentação split-and-merge é usada, dividindo a imagem recursivamente em regiões homogêneas cada vez menores, e então unindo-as de acordo com alguma medida de similaridade, computadas nesta dissertação através de medidas de distâncias probabilísticas. Também foi analisada a combinação com o descritor de textura denominado Local Binary Pattern (LBP) com o descritor de cor, partindo da premissa que algumas regiões da imagem avaliada podem ser melhor descritas não apenas por um descritor específico, mas por uma combinação dos mesmos.
Também foi analisada a utilização do PCA (Principal Components Analysis - Análise de Componentes Principais), em que o espaço de cor RGB foi reduzido de três dimensões para uma dimensão através do método.
Segmentada a imagem, a mesma será representada através de grafos de atributos que serão utilizados para a criação das Matrizes de Similaridade, que deverão conter informações acerca da similaridade entre vértices (resp. arestas) entre dois grafos de entrada: o grafo modelo e o grafo que se pretende reconhecer neste modelo. Para a construção das matrizes, foram estudadas duas funções para se verificar a similaridade entre vértices e de arestas
Experimentos foram realizados utilizando-se uma imagem aérea de alta-resolução espacial do Rio Jucu, estado do Espírito Santo. Ao final, todas as novas contribuições foram acrescentadas ao ambiente.
Identifer | oai:union.ndltd.org:IBICT/oai:dspace2.ufes.br:10/4210 |
Date | 27 August 2009 |
Creators | VENTURA, V. A. |
Contributors | BOERES, M. C. S., SALLES, E. O. T., CONCI, A., OLIVEIRA, E. S., Rauber, T. W. |
Publisher | Universidade Federal do Espírito Santo, Mestrado em Informática, Programa de Pós-Graduação em Informática, UFES, BR |
Source Sets | IBICT Brazilian ETDs |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | text |
Source | reponame:Repositório Institucional da UFES, instname:Universidade Federal do Espírito Santo, instacron:UFES |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds