Global ETD Search

201	Rede neural para reconhecimento adaptativo de fonemas ruidosos Graciarena, Martin 22 July 1998 (has links) Orientador: Marcio Luiz de Andrade Netto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T05:39:47Z (GMT). No. of bitstreams: 1 Graciarena_Martin_M.pdf: 12012337 bytes, checksum: f8b1660fd6fbf146c9c94eb63f38e664 (MD5) Previous issue date: 1998 / Resumo: No presente trabalho é proposta a incorporação de um mecanismo adaptativo, o fIltro de Kalman, ao modelo tradicional de neurônio dando por resultado um modelo que chamamos Neurônio de Reconhecimento Adaptativo, especificamente destinado ao reconhecimento ruidoso de padrões. O objetivo do modelo é a classificação da estimação do padrão limpo realizado pelo filtro de Kalman, a partir de suas observações ruidosas. Se estende naturalmente o modelo proposto a uma rede de neurônios que chamamos Rede Neural de Reconhecimento Adaptativo. Estudaremos também desde o ponto de vista teórico suas propriedades e o aplicaremos à classificação de padrões ruidosos e de séries temporais no problema XOR. As experiências foram feitas com o objetivo de estudar a robustez do mecanismo proposto frente ao problema de desemparelhamento de condição. Este pode resumir-se como os problemas que surgem com os sistemas de reconhecimento quando têm que reconhecer padrões em condições diferentes às presentes nos padrões de treinamento. Em todos os problemas de reconhecimento estudados, o treinamento das redes neurais é feito com exemplos não ruidosos. A proposta que se apresentará está incluída dentro dos classificadores robustos. Isto é, propõe mecanismos para que o classificador seja robusto à distorção ruidosa dos padrões. Isto em contraposição à estratégia clássica de filtrar o ruído na etapa das características (chamadas características invariantes) e evitar que passem ao classificador. Mas o grande problema desta aproximação é que o classificador não é robusto ao ruído, portanto, em níveis de distorção onde as características não possam filtrar todo o ruído, existirá um erro no classificador. Aplicaremos o modelo proposto para a classificação de fonemas ruidosos. Para tal fim a proposta é utilizar três diferentes arquiteturas. Estas diferem entre si na forma de extração do padrão de características do sinal de voz. A primeira implica em análise através de um banco de fIltros digitais onde os fIltros de Kalman estimam os valores médios da energia de saída de cada filtro.A segunda implica no uso de um modelo de predição linear extraído pelo filtro de Kalman diretamente do sinal de voz, onde os padrões a serem reconhecidos são os coeficientes de predição linear. A terceira é uma melhora sobre a anterior, onde se classifica o ângulo dos coeficientes de predição linear. Para esta última arquitetura apresentamos o fundamento teórico de onde foi extraída. Junto com a proposta de dois índices de reconhecimento especificamente destinados a aplicações de voz, as arquiteturas propostas são primeiro comparadas no reconhecimento ruidoso de vogais espanholas afetadas por ruído branco gaussiano em diversas relações sinal - ruído e também no reconhecimento ruidoso de palavras, junto com os modelos Hidden Markov Models (HMM). A partir dos resultados encontrados no reconhecimento de palavras com a melhor arquitetura, foi proposta uma Rede Invariante. Esta tem a propriedade de ser robusta à compressão e dilatação dos padrões, que é a alteração sofrida pelos coeficientes de predição linear na presença do ruído. Esta é a rede que, juntamente com os coeficientes de predição linear foi a que melhor desempenho teve no reconhecimento ruidoso de palavras / Mestrado / Mestre em Engenharia Elétrica Redes neurais (Computação) Reconhecimento automático da voz
202	Codificação digital de voz em sub-bandas Runstein, Fernando Oscar 02 March 1990 (has links) Orientador: Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-13T21:48:18Z (GMT). No. of bitstreams: 1 Runstein_FernandoOscar_M.pdf: 9721976 bytes, checksum: a7b9db6951ce7c9256909057e0e4d48f (MD5) Previous issue date: 1990 / Resumo: A codificação digital de sinais de voz a baixas taxas (16 [Kbits/s ou menores), com qualidade comparável aos sistemas em uso atualmente (PCM a 64 Kbits/s), ADPCM a 32 Kbits/s), é um dos objetivos que se pretende atingir em pouco tempo. Os Codificadores de sub-bandas se apresentam como bons candidatos para alcançar este objetivo, preenchendo o vazio que existe entre sofisticados codificadores de baixas taxas que trabalham no domínio da freqüência, como codificadores ATC (Adaptive Transform Codlng), e codificadores simples, porém de altas taxas, que trabalham no domínio do tempo, como PCM, APCM, ADM, ADPCM, etc. Este trabalho trata dos codificadores de sub-bandas aplicados a sinais de voz e das questões que dizem respeito a seu projeto e desempenho / Abstract: Digital coding of speech at low bit rate (16 Kbits/s or less). whose performance could be comparable to today's digital systems (64 Kbits/s) PCM, 32 Kbits/s ADPCM)is one of the objectives to be achieved in the ver~ near future. The sub-band coders lead themselves as good candidates for this purpose. bridging the gap between complex low bit rate coders. working in the frequency domain (such as the Adaptive Transform Coding - ATC) and the simple. but high bit rate coders. working in the time domain (such as PCM, APCM, ADM, ADPCM, etc). ThiS work investigates the sub-band speech coders and the questions related to their design and performance / Mestrado / Mestre em Engenharia Elétrica Telemática Engenharia elétrica Reconhecimento automatico da fala
203	Um metodo para reconhecimento de figuras esboçadas a mão Santos, Willians 03 February 1990 (has links) Orientador: Hans K. E. Liesenberg / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Ciência da Computação / Made available in DSpace on 2018-07-13T23:15:52Z (GMT). No. of bitstreams: 1 Santos_Willians_M.pdf: 2709619 bytes, checksum: 2863d778e70294138853c2fd3f560daa (MD5) Previous issue date: 1990 / Resumo: Não informado / Abstract: Not informed / Mestrado / Mestre em Ciência da Computação Sistemas de reconhecimento de padrões Sistemas homem-máquina
204	Codificação otima de padrões e rotulação de sinais via analise de correspondencia, e homeomorfismo entre subespaços de Hamming, Euclideano e Euclideano ponderado Sosa, Blanca Rosa Maquera 21 September 1993 (has links) Orientador: Reginaldo Palazzo Jr / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-18T19:37:18Z (GMT). No. of bitstreams: 1 Sosa_BlancaRosaMaquera_D.pdf: 7052283 bytes, checksum: 6b4ecc9d25d91f1051c1e50c21e84114 (MD5) Previous issue date: 1993 / Resumo: Nesta tese desenvolvemos itens das áreas de Estatística, Matemática e Comunicações dentro da Engenharia Elétrica. Da área de Estatística, consideramos os itens da Análise de Correspondência, Reconhecimento de Padrões e Teoria de Decisão. Na área de Matemática, a Teoria de Grupos, Corpos de Galois e Topologia, e da área de Comunicações, Codificação, Modulação e Modulação-Codificada. Todas estas áreas possibilitaram um encaminhamento estruturado nos campos de Codificação de Fonte e Codificação de Canal. No contexto de Codificação de Fonte, mostramos uma forma ótima de codificar os padrões Via Análise de Correspondência (AC) até então, não utilizada dentro da área de comunicações. Com respeito a Codificação de Canal, mostramos que os conjuntos de sinais simplex cujo número de elementos é da forma '2 POT. n¿ , n 'PERTENCE¿ Z+ são rotulados com elementos de grupos, cujas características são comutativas, não cíclico e cada elemento operado por ele mesmo, resulta na identidade do grupo. Também mostramos que através da AC, é possível rotular os elementos do conjunto de sinais com elementos de um grupo. Finalmente, como uma conseqüência desta rotulação, mostramos que os subespaços métricos dos espaços de Hamming, Euclideano e Euclideano Ponderado são homeomorfos / Abstract: This thesis encompasses subjects from the fields of Statistics, Mathematics and Communication within the fields of Electrical Engineering. Correspondence Analysis, Pattern Recognition and Decision Theory are some are as of statistics which are considered. In Mathematics, the Groups Theory, Galois Fields and Topology it is utilized, and Communication, Codification, Coded Modulation. Ali these areas make it possible direction structure in the field of Source Codification and Channel Codification. In Source Coding context, it is presented an optimum form of coding the patterns by use of Correspondence Analysis. To the best of our knowledge, this is shown for the first time. This technique generalizes the Huffman coding technique for discrete-time source coding. In terms of Channel Coding it is show that the set of simplex signals , whose number of elements is of the form '2 POT. n¿ , n 'PERTENCE¿ Z+ , are labeled as group elements whose characteristics are: commutative, non cyclic and idempotent. It is also shown that it is possible to label the signal set elements as group elements through Correspondence Analysis. Finally, as a consequence of this labeling it is shown that these exists a homeomorphism between each pai r of the following spaces: Hamming, Euclidian, and weighted Euclidian / Doutorado / Doutor em Engenharia Elétrica Análise de correspondência Reconhecimento de padrões Comunicações digitais
205	Um sistema eficiente de detecção da ocorrência de eventos em sinais multimídia. / An efficient system for detecting events in multimidia signals. Oliveira, Celso de 01 July 2008 (has links) Nos últimos anos tem ocorrido uma necessidade crescente de métodos que possam lidar com conteúdo multimídia em larga escala, e com busca de tais informações de maneira eficiente e efetiva. Os objetos de interesse são representados por vetores descritivos (e. g. cor, textura, geometria, timbre) extraídos do conteúdo, associados a pontos de um espaço multidimensional. Um processo de busca visa, então, encontrar dados similares a uma dada amostra, tipicamente medindo distância entre pontos. Trata-se de um problema comum a uma ampla variedade de aplicações incluindo som, imagens, vídeo, bibliotecas digitais, imagens médicas, segurança, entre outras. Os maiores desafios dizem respeito às dificuldades inerentes aos espaços de alta dimensão, conhecidas por curse of dimensionality, que restringem significativamente a aplicação dos métodos comuns de busca. A literatura recente contém uma variedade de métodos de redução de dimensão que são altamente dependentes do tipo de dado considerado. Constata-se também certa carência de métodos gerais de análise que possam prever com precisão o desempenho dos algoritmos propostos. O presente trabalho contém uma análise geral dos princípios aplicáveis aos sistemas de busca em espaços de alta dimensão. Tal análise permite estabelecer de maneira precisa o compromisso existente entre robustez, refletida principalmente na imunidade a ruído, a taxa de erros de reconhecimento e a dimensão do espaço de observação. Além disto, mostra-se que é possível conceber um método geral de mapeamento, para fins de reconhecimento, que independe de especificidades do conteúdo. Para melhorar a eficiência de busca, um novo método de busca em espaços de alta dimensão é introduzido e analisado. Por fim, descreve-se sumariamente uma realização prática, desenvolvida segundo os princípios discutidos e que atende eficientemente aplicações comerciais de monitoramento de exibição de conteúdo em rádio e TV. / In the last few years there has been an increasing need for methods to deal with large scale multimedia content, and to search such information efficiently and effectively. The objects of interest are represented by feature vectors (e. g. color, texture, geometry, timbre) extracted from the content, associated to points in a multidimensional space. A search process aims, therefore, to find similar data to a given sample, typically measuring distance between points. It is a common problem to a wide range of applications that include sound, image, video, digital library, medical imagery, security, amongst others. The major challenges refer to the difficulties, inherent to the high dimension spaces, known as curse of dimensionality that limit significantly the application of the most common search methods. The recent literature contains a number of dimension reduction methods that are highly dependent on the type of data considered. Besides, there has been a certain lack of general analysis methods that can predict accurately the performance of the proposed algorithms. The present work contains a general analysis of the principles applicable to high dimension space search systems. Such analysis allows establishing in a precise manner the existing tradeoff amongst the system robustness, reflected mainly in the noise immunity, the error rate and the dimension of the observation space. Furthermore, it is shown that it is possible to conceive a mapping method, for recognition purpose, that can be independent of the content specificities. To improve the search efficiency, a new high dimension space search method is introduced and analyzed. Finally, a practical realization is briefly described, which has been developed in accordance with the principles discussed, and that addresses efficiently commercial applications relative to radio and TV content broadcasting monitoring. Audio High dimension space Media Media recognition Multimedia Multimídia Reconhecimento de imagem Reconhecimento de padrões Video
206	Um sistema eficiente de detecção da ocorrência de eventos em sinais multimídia. / An efficient system for detecting events in multimidia signals. Celso de Oliveira 01 July 2008 (has links) Nos últimos anos tem ocorrido uma necessidade crescente de métodos que possam lidar com conteúdo multimídia em larga escala, e com busca de tais informações de maneira eficiente e efetiva. Os objetos de interesse são representados por vetores descritivos (e. g. cor, textura, geometria, timbre) extraídos do conteúdo, associados a pontos de um espaço multidimensional. Um processo de busca visa, então, encontrar dados similares a uma dada amostra, tipicamente medindo distância entre pontos. Trata-se de um problema comum a uma ampla variedade de aplicações incluindo som, imagens, vídeo, bibliotecas digitais, imagens médicas, segurança, entre outras. Os maiores desafios dizem respeito às dificuldades inerentes aos espaços de alta dimensão, conhecidas por curse of dimensionality, que restringem significativamente a aplicação dos métodos comuns de busca. A literatura recente contém uma variedade de métodos de redução de dimensão que são altamente dependentes do tipo de dado considerado. Constata-se também certa carência de métodos gerais de análise que possam prever com precisão o desempenho dos algoritmos propostos. O presente trabalho contém uma análise geral dos princípios aplicáveis aos sistemas de busca em espaços de alta dimensão. Tal análise permite estabelecer de maneira precisa o compromisso existente entre robustez, refletida principalmente na imunidade a ruído, a taxa de erros de reconhecimento e a dimensão do espaço de observação. Além disto, mostra-se que é possível conceber um método geral de mapeamento, para fins de reconhecimento, que independe de especificidades do conteúdo. Para melhorar a eficiência de busca, um novo método de busca em espaços de alta dimensão é introduzido e analisado. Por fim, descreve-se sumariamente uma realização prática, desenvolvida segundo os princípios discutidos e que atende eficientemente aplicações comerciais de monitoramento de exibição de conteúdo em rádio e TV. / In the last few years there has been an increasing need for methods to deal with large scale multimedia content, and to search such information efficiently and effectively. The objects of interest are represented by feature vectors (e. g. color, texture, geometry, timbre) extracted from the content, associated to points in a multidimensional space. A search process aims, therefore, to find similar data to a given sample, typically measuring distance between points. It is a common problem to a wide range of applications that include sound, image, video, digital library, medical imagery, security, amongst others. The major challenges refer to the difficulties, inherent to the high dimension spaces, known as curse of dimensionality that limit significantly the application of the most common search methods. The recent literature contains a number of dimension reduction methods that are highly dependent on the type of data considered. Besides, there has been a certain lack of general analysis methods that can predict accurately the performance of the proposed algorithms. The present work contains a general analysis of the principles applicable to high dimension space search systems. Such analysis allows establishing in a precise manner the existing tradeoff amongst the system robustness, reflected mainly in the noise immunity, the error rate and the dimension of the observation space. Furthermore, it is shown that it is possible to conceive a mapping method, for recognition purpose, that can be independent of the content specificities. To improve the search efficiency, a new high dimension space search method is introduced and analyzed. Finally, a practical realization is briefly described, which has been developed in accordance with the principles discussed, and that addresses efficiently commercial applications relative to radio and TV content broadcasting monitoring. Multimídia Reconhecimento de imagem Reconhecimento de padrões Audio High dimension space Media Media recognition Multimedia Video
207	Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em modelos ocultos de Markov Gomez Cipriano, Jose Luis January 2001 (has links) Este trabalho foi realizado dentro da área de reconhecimento automático de voz (RAV). Atualmente, a maioria dos sistemas de RAV é baseada nos modelos ocultos de Markov (HMMs) [GOM 99] [GOM 99b], quer utilizando-os exclusivamente, quer utilizando-os em conjunto com outras técnicas e constituindo sistemas híbridos. A abordagem estatística dos HMMs tem mostrado ser uma das mais poderosas ferramentas disponíveis para a modelagem acústica e temporal do sinal de voz. A melhora da taxa de reconhecimento exige algoritmos mais complexos [RAV 96]. O aumento do tamanho do vocabulário ou do número de locutores exige um processamento computacional adicional. Certas aplicações, como a verificação de locutor ou o reconhecimento de diálogo podem exigir processamento em tempo real [DOD 85] [MAM 96]. Outras aplicações tais como brinquedos ou máquinas portáveis ainda podem agregar o requisito de portabilidade, e de baixo consumo, além de um sistema fisicamente compacto. Tais necessidades exigem uma solução em hardware. O presente trabalho propõe a implementação de um sistema de RAV utilizando hardware baseado em FPGAs (Field Programmable Gate Arrays) e otimizando os algoritmos que se utilizam no RAV. Foi feito um estudo dos sistemas de RAV e das técnicas que a maioria dos sistemas utiliza em cada etapa que os conforma. Deu-se especial ênfase aos Modelos Ocultos de Markov, seus algoritmos de cálculo de probabilidades, de treinamento e de decodificação de estados, e sua aplicação nos sistemas de RAV. Foi realizado um estudo comparativo dos sistemas em hardware, produzidos por outros centros de pesquisa, identificando algumas das suas características mais relevantes. Foi implementado um modelo de software, descrito neste trabalho, utilizado para validar os algoritmos de RAV e auxiliar na especificação em hardware. Um conjunto de funções digitais implementadas em FPGA, necessárias para o desenvolvimento de sistemas de RAV é descrito. Foram realizadas algumas modificações nos algoritmos de RAV para facilitar a implementação digital dos mesmos. A conexão, entre as funções digitais projetadas, para a implementação de um sistema de reconhecimento de palavras isoladas é aqui apresentado. A implementação em FPGA da etapa de pré-processamento, que inclui a pré-ênfase, janelamento e extração de características, e a implementação da etapa de reconhecimento são apresentadas finalmente neste trabalho. Reconhecimento : Padroes Reconhecimento : Voz Fpga Projeto : Circuitos integrados Processamento : Sinais Voz computacional
208	Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado / Campos, Victor de Abreu. January 2017 (has links) Orientador: Daniel Carlos Guimarães Pedronette / Resumo: A quantidade vertiginosa de conteúdo multimídia acumulada diariamente tem demandado o desenvolvimento de abordagens eficazes de recuperação. Nesse contexto, ferramentas de reconhecimento de locutor capazes de identificar automaticamente um indivíduo pela sua voz são de grande relevância. Este trabalho apresenta uma nova abordagem de reconhecimento de locutor modelado como um cenário de recuperação e usando algoritmos de aprendizado não supervisionado recentes. A abordagem proposta considera Coeficientes Cepstrais de Frequência Mel (MFCCs) e Coeficientes de Predição Linear Perceptual (PLPs) como características de locutor, em combinação com múltiplas abordagens de modelagem probabilística, especificamente Quantização Vetorial, Modelos por Mistura de Gaussianas e i-vectors, para calcular distâncias entre gravações de áudio. Em seguida, métodos de aprendizado não supervisionado baseados em ranqueamento são utilizados para aperfeiçoar a eficácia dos resultados de recuperação e, com a aplicação de um classificador de K-Vizinhos Mais Próximos, toma-se uma decisão quanto a identidade do locutor. Experimentos foram conduzidos considerando três conjuntos de dados públicos de diferentes cenários e carregando ruídos de diversas origens. Resultados da avaliação experimental demonstram que a abordagem proposta pode atingir resultados de eficácia altos. Adicionalmente, ganhos de eficácia relativos de até +318% foram obtidos pelo procedimento de aprendizado não supervisionado na tarefa de... / Abstract: The huge amount of multimedia content accumulated daily has demanded the development of effective retrieval approaches. In this context, speaker recognition tools capable of automatically identifying a person through their voice are of great relevance. This work presents a novel speaker recognition approach modelled as a retrieval scenario and using recent unsupervised learning methods. The proposed approach considers Mel-Frequency Cepstral Coefficients (MFCCs) and Perceptual Linear Prediction Coefficients (PLPs) as features along with multiple modelling approaches, namely Vector Quantization, Gaussian Mixture Models and i-vector to compute distances among audio objects. Next, rank-based unsupervised learning methods are used for improving the effectiveness of retrieval results and, based on a K-Nearest Neighbors classifier, an identity decision is taken. Several experiments were conducted considering three public datasets from different scenarios, carrying noise from various sources. Experimental results demonstrate that the proposed approach can achieve very high effectiveness results. In addition, effectiveness gains up to +318% were obtained by the unsupervised learning procedure in a speaker retrieval task. Also, accuracy gains up to +7,05% were obtained by the unsupervised learning procedure in a speaker identification task considering recordings from different domains / Mestre Ciência da computação. Recuperação da informação. Reconhecimento de padrões. Reconhecimento automatico da voz. Programas de aprendizado. Computer science
209	Inspeção visual automática baseada na análise de texturas / Tobias, Orlando José January 1995 (has links) Dissertação (Mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. / Made available in DSpace on 2012-10-16T08:28:39Z (GMT). No. of bitstreams: 0Bitstream added on 2016-01-08T19:46:28Z : No. of bitstreams: 1 142146.pdf: 11814572 bytes, checksum: ba52a0f5b3f13d23ae25abeb0432ec91 (MD5) Cerâmica Indústria Visão por computador Sistemas de reconhecimento de padrOes Reconhecimento visual de textura Algoritmos
210	[en] INTELLIGENT CONTROL OF ROBOTS / [pt] CONTROLE INTELIGENTE DE ROBOS (C.I.R) JACK ALBERTO SILBERMAN 02 July 2012 (has links) [pt] Esta dissertação propõe um exemplo prático de desenvolvimento e integração de um sistema robotizado que dispensa um operador com conhecimentos mais profundos em robótica. A interface com o usuário é amigável, tanto quanto possível. O objetivo ao final do trabalho é ter um sistema que seja capaz de manipular peças mecânicas com um simples comando dado, pela voz do operador do sistema. Para tanto, realiza-se uma integração de diversos sistemas independentes que, colocados para trabalhar em conjunto, irão proporcionar um certo grau de Inteligência ao sistema como um todo. O trabalho utiliza: um sistema de reconhecimento de voz, para permitir que a voz do operador interaja com o controle central; um sistema de reconhecimento de imagens, para possibilitar a identificação de objetos; e um robô, para manipular pequenas peças. / [en] This dissertation discusses a practical example development and integration of a robotics system that does not require an expert operator. The interface is as much as possible user friendly. For that purpose, it will be shown how the integration of diverse independent systems, working together, make possible to the whole system to acquire some degree of intelligence. Techniques of voice recognition were used to give the system the ability of recognize voice commands. The system was completed using a computer vision system and a servo robot. [pt] RECONHECIMENTO DE VOZ [en] SPEECH RECOGNITION [pt] RECONHECIMENTO DE IMAGENS [en] RECOGNITION OF IMAGES [pt] ROBO [en] ROBOT

Search results