• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 113
  • 19
  • Tagged with
  • 132
  • 93
  • 46
  • 42
  • 38
  • 38
  • 37
  • 34
  • 29
  • 28
  • 21
  • 21
  • 18
  • 17
  • 17
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Graphical models and point set matching / Modelos Gráficos e Casamento de Padrões de Pontos

Caetano, Tiberio Silva January 2004 (has links)
Casamento de padrões de pontos em Espaços Euclidianos é um dos problemas fundamentais em reconhecimento de padrões, tendo aplicações que vão desde Visão Computacional até Química Computacional. Sempre que dois padrões complexos estão codi- ficados em termos de dois conjuntos de pontos que identificam suas características fundamentais, sua comparação pode ser vista como um problema de casamento de padrões de pontos. Este trabalho propõe uma abordagem unificada para os problemas de casamento exato e inexato de padrões de pontos em Espaços Euclidianos de dimensão arbitrária. No caso de casamento exato, é garantida a obtenção de uma solução ótima. Para casamento inexato (quando ruído está presente), resultados experimentais confirmam a validade da abordagem. Inicialmente, considera-se o problema de casamento de padrões de pontos como um problema de casamento de grafos ponderados. O problema de casamento de grafos ponderados é então formulado como um problema de inferência Bayesiana em um modelo gráfico probabilístico. Ao explorar certos vínculos fundamentais existentes em padrões de pontos imersos em Espaços Euclidianos, provamos que, para o casamento exato de padrões de pontos, um modelo gráfico simples é equivalente ao modelo completo. É possível mostrar que inferência probabilística exata neste modelo simples tem complexidade polinomial para qualquer dimensionalidade do Espaço Euclidiano em consideração. Experimentos computacionais comparando esta técnica com a bem conhecida baseada em relaxamento probabilístico evidenciam uma melhora significativa de desempenho para casamento inexato de padrões de pontos. A abordagem proposta é signi- ficativamente mais robusta diante do aumento do tamanho dos padrões envolvidos. Na ausência de ruído, os resultados são sempre perfeitos. / Point pattern matching in Euclidean Spaces is one of the fundamental problems in Pattern Recognition, having applications ranging from Computer Vision to Computational Chemistry. Whenever two complex patterns are encoded by two sets of points identifying their key features, their comparison can be seen as a point pattern matching problem. This work proposes a single approach to both exact and inexact point set matching in Euclidean Spaces of arbitrary dimension. In the case of exact matching, it is assured to find an optimal solution. For inexact matching (when noise is involved), experimental results confirm the validity of the approach. We start by regarding point pattern matching as a weighted graph matching problem. We then formulate the weighted graph matching problem as one of Bayesian inference in a probabilistic graphical model. By exploiting the existence of fundamental constraints in patterns embedded in Euclidean Spaces, we prove that for exact point set matching a simple graphical model is equivalent to the full model. It is possible to show that exact probabilistic inference in this simple model has polynomial time complexity with respect to the number of elements in the patterns to be matched. This gives rise to a technique that for exact matching provably finds a global optimum in polynomial time for any dimensionality of the underlying Euclidean Space. Computational experiments comparing this technique with well-known probabilistic relaxation labeling show significant performance improvement for inexact matching. The proposed approach is significantly more robust under augmentation of the sizes of the involved patterns. In the absence of noise, the results are always perfect.
82

Depressão em hospital geral: avaliação do desepenho de escalas de rastreamento e desenvolvimento de instrumento para uso na rotina assistencial

Machado, Sérgio Carlos Eduardo Pinto January 2003 (has links)
O presente estudo desenvolve-se numa perspectiva prática, visando à integração de conhecimentos gerados pela pesquisa a atividades assistenciais no hospital geral universitário, dirigindo-se, especificamente, à questão da detecção da depressão. A depressão é um problema de saúde pública no mundo inteiro, transtorno mental de alta prevalência, com elevado custo para os sistemas de saúde. Entre pacientes clínicos e cirúrgicos, hospitalizados, aumenta a complexidade dos tratamentos, implica maior morbidade e mortalidade, importando também no aumento do tempo e dos custos das internações. Por outro lado, a depressão é subdiagnosticada. Este estudo, originado de um projeto cujo objetivo foi criar um instrumento para a detecção de depressão, utilizável na rotina assistencial, a partir da avaliação do desempenho de escalas de rastreamento já existentes, desdobra-se em três artigos. O primeiro, já aceito para publicação em revista indexada internacionalmente, é a retomada de estudos anteriores, realizados no final da década de 1980. É apresentada a comparação da detecção de depressão, realizada por médicos não-psiquiatras e por enfermeiros, no Hospital de Clínicas de Porto Alegre (HCPA), em 1987 e em 2002. O segundo artigo apresenta o processo de construção da nova escala, a partir da seleção de itens de outras escalas já validadas, utilizando modelos logísticos de Rasch. A nova escala, composta por apenas seis itens, exige menos tempo para sua aplicação. O terceiro artigo é um estudo de avaliação de desempenho da nova escala, denominada Escala de Depressão em Hospital Geral (EDHG), realizado em uma outra amostra de pacientes adultos clínicos e cirúrgicos internados no HCPA. O segundo e terceiro artigos já foram encaminhados para publicação internacional. Esses estudos, realizados em unidades de internação clínicas e cirúrgicas do Hospital de Clínicas de Porto Alegre, permitiram as seguintes conclusões: a) comparando-se os achados de 1987 com os de 2002, a prevalência de depressão e o seu diagnóstico, em pacientes adultos clínicos e cirúrgicos internados, mantêm-se nos mesmos níveis; b) foi possível selecionar um conjunto de seis itens, que constituíram a nova Escala de Depressão em Hospital Geral (EDHG), baseando-se no desempenho individual de cada um dos 48 itens componentes de outras três escalas (BDI, CESD e HADS); c) a EDHG apresentou desempenho semelhante aos das escalas que lhe deram origem, usando o PRIME-MD como padrão-ouro, com a vantagem de ter um pequeno número de itens, podendo constituir-se num dispositivo de alerta para detecção de depressão na rotina de hospital geral. / This study unfolds from a practical perspective. Its purpose is to integrate knowledge generated by research into care provided in general hospitals, specifically to detecting depression. Depression is a public health problem all over the world. It is a highly prevalent mental disorder that generates high costs to the health system. Depression increases treatment’s complexity, morbidity and mortality rates, time and costs of clinical and surgical hospitalizations. On the other hand, depression is under diagnosed. This study was originated from a project to develop an instrument for the detection of depression in general hospitals inpatients. This instrument was based on the evaluation of the performance of other already existing rating scales and was designed to be integrated in clinical routine. This study was developed as three papers. The first paper, accepted for publication in an international indexed journal, compares depression detection carried out by non-psychiatric physicians and nurses of Hospital de Clínicas de Porto Alegre (HCPA) between 1987 andandand 2002. The second paper describes the developing process of a new depression scale by Rasch models using items from other previously validated scales. The new scale, with only six items, requires less time for its use. The third paper is the performance evaluation of the new scale, General Hospital Depression Scale (GHDS). This evaluation was conducted in a sample of clinical and surgical adult inpatients at HCPA. The second and third papers have already been submitted to international journals for publication. The conclusions from these studies are: a) comparing the findings of 1987 and 2002, the prevalence rates and the diagnosis of depression in clinical and surgical adult inpatients have not significantly changed; b) it was possible to select a subset of six items to create the new General Hospital Depression Scale (GHDS); these items were selected by individual performance analysis of 48 items from three other scales (BDI, CESD and HADS); c) GHDS has similar performance, using PRIME-MD as gold-standard, to the three other scales from which the items were selected. GHDS has the advantage of a smaller number of items, and may serve as an alert instrument to depression in general hospitals routine.
83

Detecção de nódulos pulmonares em exames de tomografia computadorizada

Pureza, André Hallack Miranda 25 October 2012 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2011 / Made available in DSpace on 2012-10-25T21:35:43Z (GMT). No. of bitstreams: 1 297537.pdf: 3090654 bytes, checksum: 608c74ad577210f2fefee70fb3012bca (MD5) / O reconhecimento automatico de padrões é uma atividade de importância significativa em problemas das mais variadas áreas, desde identificação de caracteres a previsão do tempo, auxiliando ou mesmo substituindo o elemento humano nestas tarefas, com ganhos expressivos na qualidade do trabalho, no tempo de realização e no custo final. No âmbito médico, apesar da aplicação ainda ser limitada, há uma grande expectativa no uso de tais técnicas para garantir maior segurança e agilidade na identificação o de estruturas no corpo humano. Uma situação particularmente importante é a detecção de nódulos pulmonares, cuja população alvo é elevada e que envolve uma patologia com alta taxa de mortalidade. A análise de exames para detecção de nódulos é uma atividade repetitiva que toma um tempo elevado de uma mão de obra altamente especializada e que está sujeita a uma variabilidade significativa no diagnóstico. Este trabalho apresenta um novo sistema de detecção automática de nódulos pulmonares em exames de tomografia computadorizada com o intuito de auxiliar o radiologista no diagnóstico. Para este fim, é realizado um estudo de reconhecimento de padrões e de processamento de imagens. No campo de reconhecimento de padrões são analisadas técnicas não-paramétricas de classificação e algoritmos de seleção de descritores. São apresentadas as técnicas fundamentais de processamento de imagens, bem como um modelo de conectividade nebulosa para segmentação e uma medida de forma para identificação de estruturas. Finalmente, são avaliadas para este problema as diferentes técnicas de classificação estudadas e o sistema proposto é comparado quantitativamente com outros sistemas de detecção de nódulos pulmonares, obtendo resultados promissores.
84

[en] ALGORITHMS FOR MOTOR IMAGERY PATTERN RECOGNITION IN A BRAIN-MACHINE INTERFACE / [pt] ALGORITMOS PARA RECONHECIMENTO DE PADRÕES EM IMAGÉTICA MOTORA EM UMA INTERFACE CÉREBRO-MÁQUINA

GABRIEL CHAVES DE MELO 14 August 2018 (has links)
[pt] Uma interface cérebro-máquina (ICM) é um sistema que permite a um indivíduo, entre outras coisas, controlar um dispositivo robótico por meio de sinais oriundos da atividade cerebral. Entre os diversos métodos para registrar os sinais cerebrais, destaca-se a eletroencefalografia (EEG), principalmente por ter uma rápida resposta temporal e não oferecer riscos ao usuário, além de o equipamento ter um baixo custo relativo e ser portátil. Muitas situações podem fazer com que uma pessoa perca o controle motor sobre o corpo, mesmo preservando todas as funções do cérebro, como doenças degenerativas, lesões medulares, entre outras. Para essas pessoas, uma ICM pode representar a única possibilidade de interação consciente com o mundo externo. Todavia, muitas são as limitações que impossibilitam o uso das ICMs da forma desejada, entre as quais estão as dificuldades de se desenvolver algoritmos capazes de fornecer uma alta confiabilidade em relação ao reconhecimento de padrões dos sinais registrados com EEG. A escolha pelas melhores posições dos eletrodos e as melhores características a serem extraídas do sinal é bastante complexa, pois é altamente condicionada à variabilidade interpessoal dos sinais. Neste trabalho um método é proposto para escolher os melhores eletrodos e as melhores características para pessoas distintas e é testado com um banco de dados contendo registros de sete pessoas. Posteriormente dados são extraídos com um equipamento próprio e uma versão adaptada do método é aplicada visando uma atividade em tempo real. Os resultados mostraram que o método é eficaz para a maior parte das pessoas e a atividade em tempo real forneceu resultados promissores. Foi possível analisar diversos aspectos do algoritmo e da variabilidade inter e intrapessoal dos sinais e foi visto que é possível, mesmo com um equipamento limitado, obter bons resultados mediante análises recorrentes para uma mesma pessoa. / [en] A brain-machine interface (BMI) system allows a person to control robotic devices with brain signals. Among many existing methods for signal acquisition, electroencephalography is the most often used for BCI purposes. Its high temporal resolution, safety to use, portability and low cost are the main reasons for being the most used method. Many situations can affect a person s capability of controlling their body, although brain functions remain healthy. For those people in the extreme case, where there is no motor control, a BCI can be the only way to interact with the external world. Nevertheless, it is still necessary to overcome many obstacles for making the use of BCI systems to become practical, and the most important one is the difficulty to design reliable algorithms for pattern recognition using EEG signals. Inter-subject variability related to the EEG channels and features of the signal are the biggest challenges in the way of making BCI systems a useful technology for restoring function to disabled people. In this paper a method for selecting subject-specific channels and features is proposed and validated with data from seven subjects. Later in the work data is acquired with different EEG equipment and an adapted version of the proposed method is applied aiming online activities. Results showed that the method was efficient for most people and online activities had promising results. It was possible to analyze important aspects concerning the algorithm and inter and intrasubject variability of EEG signals. Also, results showed that it is possible to achieve good results when multiple analyses are performed with the same subject, even with EEG equipment with well known limitations concerning signal quality.
85

Sistema de reconhecimento de locutor utilizando redes neurais artificiais / Artificial neural networks speaker recognition system

Adami, Andre Gustavo January 1997 (has links)
Este trabalho envolve o emprego de recentes tecnologias ligadas a promissora área de Inteligência Computacional e a tradicional área de Processamento de Sinais Digitais. Tem por objetivo o desenvolvimento de uma aplicação especifica na área de Processamento de Voz: o reconhecimento de locutor. Inúmeras aplicações, ligadas principalmente a segurança e controle, são possíveis a partir do domínio da tecnologia de reconhecimento de locutor, tanto no que diz respeito a identificação quanto a verificação de diferentes locutores. O processo de reconhecimento de locutor pode ser dividido em duas grandes fases: extração das características básicas do sinal de voz e classificação. Na fase de extração, procurou-se aplicar os mais recentes avanços na área de Processamento Digital de Sinais ao problema proposto. Neste contexto, foram utilizadas a frequência fundamental e as frequências formantes como parâmetros que identificam o locutor. O primeiro foi obtido através do use da autocorrelação e o segundo foi obtido através da transformada de Fourier. Estes parâmetros foram extraídos na porção da fala onde o trato vocal apresenta uma coarticulação entre dois sons vocálicos. Esta abordagem visa extrair as características desta mudança do aparato vocal. Existem dois tipos de reconhecimento de locutor: identificação (busca-se reconhecer o locutor em uma população) e verificação (busca-se verificar se a identidade alegada é verdadeira). O processo de reconhecimento de locutor é dividido em duas grandes fases: extração das características (envolve aquisição, pré-processamento e extração dos parâmetros característicos do sinal) e classificação (envolve a classificação do sinal amostrado na identificação/verificação do locutor ou não). São apresentadas diversas técnicas para representação do sinal, como analise espectral, medidas de energia, autocorrelação, LPC (Linear Predictive Coding), entre outras. Também são abordadas técnicas para extração de características do sinal, como a frequência fundamental e as frequências formantes. Na fase de classificação, pode-se utilizar diversos métodos convencionais: Cadeias de Markov, Distância Euclidiana, entre outros. Além destes, existem as Redes Neurais Artificiais (RNAs) que são consideradas poderosos classificadores. As RNAs já vêm sendo utilizadas em problemas que envolvem classificações de sinais de voz. Neste trabalho serão estudados os modelos mais utilizados para o problema de reconhecimento de locutor. Assim, o tema principal da Dissertação de Mestrado deste autor é a implementação de um sistema de reconhecimento de locutor utilizando Redes Neurais Artificiais para classificação do locutor. Neste trabalho tamb6m é apresentada uma abordagem para a implementação de um sistema de reconhecimento de locutor utilizando as técnicas convencionais para o processo de classificação do locutor. As técnicas utilizadas são Dynamic Time Warping (DTW) e Vector Quantization (VQ). / This work deals with the application of recent technologies related to the promising research domain of Intelligent Computing (IC) and to the traditional Digital Signal Processing area. This work aims to apply both technologies in a Voice Processing specific application which is the speaker recognition task. Many security control applications can be supported by speaker recognition technology, both in identification and verification of different speakers. The speaker recognition process can be divided into two main phases: basic characteristics extraction from the voice signal and classification. In the extraction phase, one proposed goal was the application of recent advances in DSP theory to the problem approached in this work. In this context, the fundamental frequency and the formant frequencies were employed as parameters to identify the speaker. The first one was obtained through the use of autocorrelation and the second ones were obtained through Fourier transform. These parameters were extracted from the portion of speech where the vocal tract presents a coarticulation between two voiced sounds. This approach is used to extract the characteristics of this apparatus vocal changing. In this work, the Multi-Layer Perceptron (MLP) ANN architecture was investigated in conjunction with the backpropagation learning algorithm. In this sense, some main characteristics extracted from the signal (voice) were used as input parameters to the ANN used. The output of MLP, trained previously with the speakers features, returns the authenticity of that signal. Tests were performed with 10 different male speakers, whose age were in the range from 18 to 24 years. The results are very promising. In this work it is also presented an approach to implement a speaker recognition system by applying conventional methods to the speaker classification process. The methods used are Dynamic Time Warping (DTW) and Vector Quantization (VQ).
86

Reconhecimento automático de padrões em imagens ecocardiográficas / Automatic pattern recognition in echocardiographic images

Siqueira, Mozart Lemos de January 2010 (has links)
Ecocardiografia fetal é uma importante ferramenta para diagnóstico. Esta tese apresenta um método que provê localização automática de cavidades cardíacas em imagens ecocardiografias fetais, onde o diagnóstico de problemas congênitos do coração pode melhorar os resultados do tratamento. As estruturas de interesse são as quatro cavidades cardíacas (átrio direito, átrio esquerdo, ventrículo direito e ventrículo esquerdo). O método é baseado na busca por cavidades cardíacas através de uma molde de busca (template) para encontrar padrões de interesse. Este molde é calculado usando uma função densidade probabilidade que recebe como parâmetro os níveis de cinza de uma região representativa da cavidade, na imagem. Além disso, em alguns testes também foram utilizadas características espaciais da imagem para cálculo do molde de busca. Nesse sentido a busca é implementada de uma forma hierárquica: (i) primeiro, é localizada a região do coração; e (ii) em seguida, baseando na região do coração a cavidade de interesse á buscada. A comparação do molde de busca e as regiões de interesse na imagem é feita utilizando o Coeficiente de Bhattacharyya, o qual é analisado ao longo dos testes para justificar sua escolha. Uma das principais características do método é a invariância a rotação apresentada pelas estruturas. / Fetal echocardiography is an important tool for diagnosing. This thesis presents a method to provide automatic localization of cardiac cavities in fetal echocardiography images, where the early diagnostics of heart congenital diseases can greatly improve results from medical treatment. The structures of interest are the four cardiac cavities (left and right atrium, left and right ventricle). The method is based in the search of cardiac structures with a mold to find the pattern of interest. This mold is calculated using a probability density function that receives as parameter the gray level of a representative image and also uses spatial features of the images to calculate the mold. A hierarchical search is performed: (i) first, the region of interest is covered to locate the heart; and (ii) based on the position of the heart, the desired structure is found in the image. The comparison of the mold and the candidate image is made using the Bhattacharyya coefficient, which our experimental tests have shown good results. One of the main characteristics of the method is its rotation invariance.
87

Sistema audio visual para análise de solfejo / Audiovisual system for solfège analysis

Schramm, Rodrigo January 2015 (has links)
O solfejo, em seu conceito mais amplo, é uma técnica usual no processo de ensinoaprendizagem musical, o qual envolve a realização vocal de melodias, considerando as alturas e as durações dos sons musicais registrados em partitura, devidamente associado à marcação de compassos por intermédio de gestos que definem a estrutura métrica e o andamento da peça musical. Este trabalho apresenta uma abordagem audiovisual para avaliação automática dessa prática de estudo pertinente à leitura e à estruturação musicais. O sistema proposto é dividido em três partes. A primeira efetua o reconhecimento visual dos gestos de marcação de compassos realizados pela mão, por intermédio de um classificador probabilístico. Um processo de alinhamento temporal garante o reconhecimento dos padrões de movimento mesmo em casos com variação de andamento, permitindo também a avaliação da precisão rítmica do aluno, quando comparado com um referencial metronômico. A segunda parte deste sistema obtém a transcrição melódica do canto a partir da análise do respectivo sinal de áudio. Os fragmentos melódicos detectados são agrupados e mapeados em relação às notas da partitura do exercício de solfejo, permitindo uma avaliação direta nota-a-nota da performance do canto. Por fim, a terceira parte do sistema proposto faz a integração entre o gesto de marcação de compassos e a transcrição melódica. Nesse caso, o gesto atua como um metrônomo, controlando o fluxo temporal. Assim, a avaliação nota-a-nota do solfejo pode ser empregada também em casos onde exista grande variação no andamento da peça. Tanto o processo de avaliação do gesto de marcação de compassos quanto a avaliação do canto são obtidos por intermédio de um classificador Bayesiano gerado a partir de avaliações reais, feitas por especialistas em música. Dessa forma, o sistema desenvolvido efetua o mapeamento advindo da opinião de especialistas humanos em um sistema de avaliação automática de solfejo executado por máquina, que é capaz de identificar as notas musicais cantadas pelo aluno em cada instante métrico determinado, devidamente conduzido pelo gesto, sem a necessidade de sincronização por um metrônomo ou manutenção de um andamento fixo. / Solfége is a general technique used in the music learning process, which involves the vocal performance of melodies, regarding the time and duration of musical sounds as specified in the music score, properly associated the meter-mimicking performed by the hand movement. This thesis presents an audiovisual approach for automatic assessment of this relevant musical study practice. The proposed system is divided into three parts. First, a probabilistic classifier recognizes the musical metric patterns drawn by the hand movement. A time alignment process assures the proper recognition of the movement patterns even in cases where there are changes in the musical tempo. Also, this process allows to estimate the accuracy of the rhythmic performance. In the second part of this work, audio analysis is applied to achieve the melodic transcription of the sung notes. The detected melodic fragments are then grouped and mapped into single notes, which are connected to their related notes on the music score of the solfège exercise. This mapping procedure allows the direct assessment (note by note) of the singing performance, even if there are slight discrepancies between the transcribed notes and the music score. Finally, the last part of the proposed system combines the gesture of meter-mimicking (video information) with the melodic transcription (audio information), where the hand movement works as a metronome, controlling the time flow (tempo) of the musical piece. Thus, the meter-mimicking is used to align the music score (ground truth) with the sung melody, allowing the assessment even in time dynamic scenarios. Both meter-mimicking and sung notes are evaluated by a set of Bayesian classifiers that were generated from real evaluations done by experts listeners. In this way, the developed model performs the mapping of the point of view from human experts into an automatic system which is able to make the solfege assessment, regarding the pitch, onset and duration of the music notes, without the need for external synchronization with a metronome or the maintenance of a fixed tempo.
88

Aplicação de sistemas híbridos em problemas de otimização / Hybrid System applications to solve otimization problems

Ramos, Antonio Rogerio Machado January 1996 (has links)
Este trabalho discorre sobre o emprego de sistemas híbridos voltados resolução de problemas de otimizando. Como problemas de otimizando entende-se como sendo o emprego de técnicas que visam aumentar a produtividade de alguma tarefa, otimizando seus procedimentos. Desta forma, utiliza-se neste trabalho o paradigma de Algoritmos Genéticos sobre um modelo de Redes Neurais para otimizar seu funcionamento, tornando-o mais rapido e de tamanho menor na tarefa de reconhecimento de padrões. O modelo de Rede Neural escolhido para o reconhecimento de padrões foi o modelo de Teuvo Kohonen, também conhecido como modelo dos mapas auto organizados (SOM - Self Organization Feature Map). Este modelo tem sido empregado, obtendo ótimos resultados, no reconhecimento dos mais diversos padrões, como padrões fonéticos e padrões visuais, destacando sua aplicação em sistemas de reconhecimento 6tico de caracteres (OCR - Optical Character Recognization), que será explorado em detalhes no decorrer deste trabalho. O paradigma de Algoritmos Genéticos, criado por John Holland, alcança ótimo desempenho na resolução de problemas de otimizando, seja na classificação e seleção do melhor procedimento, seja no desenvolvimento de um novo procedimento baseado na interação do sistema com procedimentos anteriores. Desta forma, os algoritmos genéticos podem ser aplicados em atividades como seleção e classificação, tal como a aplicação para resolver o problema do caixeiro viajante, ou na geração de uma nova estrutura baseada em estruturas anteriores, a citar o redimensionamento de uma rede neural artificial para reduzir o seu tamanho. Em última instância, este trabalho se propõe a otimizar um sistema de reconhecimento de caracteres utilizando o melhor dos dois paradigmas anteriormente discutidos, obtendo resultados muito satisfatórios na realização dos procedimentos. / This work is about applying hybrid systems to the solving of optimization problems. We consider optimization problems as the productivity increase of some tasks by fine tuning their procedures using a Genetic Algorithm paradigm on a neural network model, optimizing its functionality, making it faster and decreasing the size of neural network. We choose Teuvo Kohonen's model for pattern recognition, also know as Self-Organization Feature Map - SOM, which has been used on a wide range of pattern recognition problems, such as phonetic an visual patterns, specially on Optical Character Recognition - OCR systems, which we will discuss later. The Genetic Algorithm paradigm, created by John Holland, reaches high score performances on solving optimization problems applyed on classification and selection process. In this way, genetic algorithms are suitable for selection and classification problems, such as solving the travelling sales person problem or on generating new structures based on prior ones as neural network redimensioning to reduce its size. The proposal is optimizing the Optical Character Recognition mixing the best properties of both paradigm, aimed very satisfactory results on process execution.
89

Sistema de reconhecimento de locutor utilizando redes neurais artificiais / Artificial neural networks speaker recognition system

Adami, Andre Gustavo January 1997 (has links)
Este trabalho envolve o emprego de recentes tecnologias ligadas a promissora área de Inteligência Computacional e a tradicional área de Processamento de Sinais Digitais. Tem por objetivo o desenvolvimento de uma aplicação especifica na área de Processamento de Voz: o reconhecimento de locutor. Inúmeras aplicações, ligadas principalmente a segurança e controle, são possíveis a partir do domínio da tecnologia de reconhecimento de locutor, tanto no que diz respeito a identificação quanto a verificação de diferentes locutores. O processo de reconhecimento de locutor pode ser dividido em duas grandes fases: extração das características básicas do sinal de voz e classificação. Na fase de extração, procurou-se aplicar os mais recentes avanços na área de Processamento Digital de Sinais ao problema proposto. Neste contexto, foram utilizadas a frequência fundamental e as frequências formantes como parâmetros que identificam o locutor. O primeiro foi obtido através do use da autocorrelação e o segundo foi obtido através da transformada de Fourier. Estes parâmetros foram extraídos na porção da fala onde o trato vocal apresenta uma coarticulação entre dois sons vocálicos. Esta abordagem visa extrair as características desta mudança do aparato vocal. Existem dois tipos de reconhecimento de locutor: identificação (busca-se reconhecer o locutor em uma população) e verificação (busca-se verificar se a identidade alegada é verdadeira). O processo de reconhecimento de locutor é dividido em duas grandes fases: extração das características (envolve aquisição, pré-processamento e extração dos parâmetros característicos do sinal) e classificação (envolve a classificação do sinal amostrado na identificação/verificação do locutor ou não). São apresentadas diversas técnicas para representação do sinal, como analise espectral, medidas de energia, autocorrelação, LPC (Linear Predictive Coding), entre outras. Também são abordadas técnicas para extração de características do sinal, como a frequência fundamental e as frequências formantes. Na fase de classificação, pode-se utilizar diversos métodos convencionais: Cadeias de Markov, Distância Euclidiana, entre outros. Além destes, existem as Redes Neurais Artificiais (RNAs) que são consideradas poderosos classificadores. As RNAs já vêm sendo utilizadas em problemas que envolvem classificações de sinais de voz. Neste trabalho serão estudados os modelos mais utilizados para o problema de reconhecimento de locutor. Assim, o tema principal da Dissertação de Mestrado deste autor é a implementação de um sistema de reconhecimento de locutor utilizando Redes Neurais Artificiais para classificação do locutor. Neste trabalho tamb6m é apresentada uma abordagem para a implementação de um sistema de reconhecimento de locutor utilizando as técnicas convencionais para o processo de classificação do locutor. As técnicas utilizadas são Dynamic Time Warping (DTW) e Vector Quantization (VQ). / This work deals with the application of recent technologies related to the promising research domain of Intelligent Computing (IC) and to the traditional Digital Signal Processing area. This work aims to apply both technologies in a Voice Processing specific application which is the speaker recognition task. Many security control applications can be supported by speaker recognition technology, both in identification and verification of different speakers. The speaker recognition process can be divided into two main phases: basic characteristics extraction from the voice signal and classification. In the extraction phase, one proposed goal was the application of recent advances in DSP theory to the problem approached in this work. In this context, the fundamental frequency and the formant frequencies were employed as parameters to identify the speaker. The first one was obtained through the use of autocorrelation and the second ones were obtained through Fourier transform. These parameters were extracted from the portion of speech where the vocal tract presents a coarticulation between two voiced sounds. This approach is used to extract the characteristics of this apparatus vocal changing. In this work, the Multi-Layer Perceptron (MLP) ANN architecture was investigated in conjunction with the backpropagation learning algorithm. In this sense, some main characteristics extracted from the signal (voice) were used as input parameters to the ANN used. The output of MLP, trained previously with the speakers features, returns the authenticity of that signal. Tests were performed with 10 different male speakers, whose age were in the range from 18 to 24 years. The results are very promising. In this work it is also presented an approach to implement a speaker recognition system by applying conventional methods to the speaker classification process. The methods used are Dynamic Time Warping (DTW) and Vector Quantization (VQ).
90

Reconhecimento automático de padrões em imagens ecocardiográficas / Automatic pattern recognition in echocardiographic images

Siqueira, Mozart Lemos de January 2010 (has links)
Ecocardiografia fetal é uma importante ferramenta para diagnóstico. Esta tese apresenta um método que provê localização automática de cavidades cardíacas em imagens ecocardiografias fetais, onde o diagnóstico de problemas congênitos do coração pode melhorar os resultados do tratamento. As estruturas de interesse são as quatro cavidades cardíacas (átrio direito, átrio esquerdo, ventrículo direito e ventrículo esquerdo). O método é baseado na busca por cavidades cardíacas através de uma molde de busca (template) para encontrar padrões de interesse. Este molde é calculado usando uma função densidade probabilidade que recebe como parâmetro os níveis de cinza de uma região representativa da cavidade, na imagem. Além disso, em alguns testes também foram utilizadas características espaciais da imagem para cálculo do molde de busca. Nesse sentido a busca é implementada de uma forma hierárquica: (i) primeiro, é localizada a região do coração; e (ii) em seguida, baseando na região do coração a cavidade de interesse á buscada. A comparação do molde de busca e as regiões de interesse na imagem é feita utilizando o Coeficiente de Bhattacharyya, o qual é analisado ao longo dos testes para justificar sua escolha. Uma das principais características do método é a invariância a rotação apresentada pelas estruturas. / Fetal echocardiography is an important tool for diagnosing. This thesis presents a method to provide automatic localization of cardiac cavities in fetal echocardiography images, where the early diagnostics of heart congenital diseases can greatly improve results from medical treatment. The structures of interest are the four cardiac cavities (left and right atrium, left and right ventricle). The method is based in the search of cardiac structures with a mold to find the pattern of interest. This mold is calculated using a probability density function that receives as parameter the gray level of a representative image and also uses spatial features of the images to calculate the mold. A hierarchical search is performed: (i) first, the region of interest is covered to locate the heart; and (ii) based on the position of the heart, the desired structure is found in the image. The comparison of the mold and the candidate image is made using the Bhattacharyya coefficient, which our experimental tests have shown good results. One of the main characteristics of the method is its rotation invariance.

Page generated in 0.0434 seconds