• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 404
  • 309
  • 42
  • 35
  • 15
  • 12
  • 10
  • 10
  • 10
  • 10
  • 6
  • 5
  • 5
  • 5
  • 5
  • Tagged with
  • 943
  • 345
  • 145
  • 145
  • 128
  • 107
  • 96
  • 91
  • 87
  • 85
  • 80
  • 67
  • 66
  • 66
  • 60
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
231

Complex Bases, Number Systems and Their Application to Fractal-Wavelet Image Coding

Pich??, Daniel G. January 2002 (has links)
This thesis explores new approaches to the analysis of functions by combining tools from the fields of complex bases, number systems, iterated function systems (IFS) and wavelet multiresolution analyses (MRA). The foundation of this work is grounded in the identification of a link between two-dimensional non-separable Haar wavelets and complex bases. The theory of complex bases and this link are generalized to higher dimensional number systems. Tilings generated by number systems are typically fractal in nature. This often yields asymmetry in the wavelet trees of functions during wavelet decomposition. To acknowledge this situation, a class of extensions of functions is developed. These are shown to be consistent with the Mallat algorithm. A formal definition of local IFS on wavelet trees (LIFSW) is constructed for MRA associated with number systems, along with an application to the inverse problem. From these investigations, a series of algorithms emerge, namely the Mallat algorithm using addressing in number systems, an algorithm for extending functions and a method for constructing LIFSW operators in higher dimensions. Applications to image coding are given and ideas for further study are also proposed. Background material is included to assist readers less familiar with the varied topics considered. In addition, an appendix provides a more detailed exposition of the fundamentals of IFS theory.
232

Um método não-limiar para redução de ruído em sinais de voz no domínio wavelet /

Soares, Wendel Cleber. January 2009 (has links)
Resumo: Neste trabalho é feito um estudo dos métodos de redução de ruído aditivo em sinais de voz baseados em wavelets e, através deste estudo, propõe-se um novo método não-limiar para redução de ruído em sinais de voz no domínio wavelet. Em geral os sinais de voz podem estar contaminados com ruídos artificiais ou reais. O problema consiste que dado um sinal limpo adiciona-se o ruído branco ou colorido, obtendo assim o sinal ruidoso, ambos no domínio do tempo. O que se propõe neste trabalho, é aplicar a transformada wavelet, obtendo assim o sinal transformado no domínio wavelet, reduzindo ou atenuando o ruído sem o uso de limiar. Os métodos mais usados no domínio wavelet são os métodos de redução por limiar, pois permitem bons resultados para sinais contaminados por ruído branco, mas não são eficientes no processamento de sinais contaminados por ruído colorido, que é o tipo de ruído mais comum em situações reais. Nesses métodos, o limiar, geralmente, é calculado nos intervalos de silêncio e aplicado em todo o sinal. Os coeficientes no domínio wavelet são comparados com este limiar e aqueles que estão abaixo deste valor são eliminados ou reduzidos, fazendo assim uma aplicação linear deste limiar. Esta eliminação, na maioria das vezes, causa descontinuidades no tempo e na frequência no sinal processado. Além disso, a forma com que o limiar é calculado pode degradar os trechos de voz do sinal processado, principalmente nos casos em que o limiar depende fortemente da última janela do último trecho de silêncio. O método proposto nesta pesquisa consiste na execução de três processamentos, agindo de acordo com as suas características nas regiões de voz e silêncio, sem o uso de limiar. A execução dos três processamentos é sintetizada numa única função, denominada de função de transferência, que atua como um filtro no processamento do sinal... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In this work a study of the methods for speech noise reduction based on wavelets is done and, through this study, a new non-thresholding method for speech noise reduction in the wavelet domain is proposed. Generally, a speech signal may be corrupted by artificial or real noise. Let a clean signal be corrupted by white or colored noise, rising a noisy signal in time domain. This work proposes the wavelet application to which gives rise to in the wavelet domain. In this domain, noise is reduced or attenuated without a threshold use. After, the signal is recomposed using the inverse discrete wavelet transform. The most used methods in the wavelet domain wavelet are the thresholding reduction methods, because they allow good results for signals corrupted by white noise, but they do not have the same efficiency when processing signals corrupted by colored noise, this is the most common noise in real situations. In those methods, the threshold is usually calculated in the silence intervals and applied to the whole signal. The coefficients in the wavelet domain are compared with this threshold and those that have absolute value below this value are eliminated or reduced, making a linear application of this threshold. This elimination causes discontinuities in time and in the frequency of the processed signal. Besides, the form with that the threshold is applied can degrade the voice segments of the processed signal, principally in cases that the threshold depends strongly on the last window of the last silence segment. The method proposed in this research consists in the execution of three processing, acting according to their characteristics in the voice and silence segments, without the threshold use. The three processing execution is synthesized in an unique function, called transfer function, acting as a filter in the signal processing. This method has as main objective the overcoming... (Complete abstract click electronic access below) / Orientador: Francisco Villarreal Alvarado / Coorientador: Jozué Vieira Filho / Banca: Carlos Roberto Minussi / Banca: Ailton Akira Shinoda / Banca: Jorge Diaz Calle / Banca: Leandro de Campos Teixeira Gomes / Doutor
233

Detecção computacional de assimetrias entre mamogramas / Computational detection of asymmetries between mammograms

Ferrari, Ricardo José 01 April 2002 (has links)
Neste trabalho foram propostas técnicas para a segmentação automática de mamogramas e para a detecção de assimetrias entre mamogramas esquerdo e direito. A segmentação é realizada através de três técnicas computacionais para a identificação de três importantes regiões anatômicas nos mamogramas: borda da mama, músculo peitoral e disco fibro-glandular. O primeiro método focaliza a identificação da borda da mama através do uso de um modelo de contorno ativo especialmente projetado para esse propósito. Neste estágio, a borda da mama é automaticamente demarcada, todos os artefatos fora dessa região são eliminados, e a região de interesse usada para a detecção do músculo peitoral é definida. No próximo estágio, a borda do músculo peitoral é determinada usando uma técnica multiresolução baseada na representação Gabor wavelets. Finalmente, um modelo de densidades da mama, baseado no modelo da mistura finita de Gaussianas, é proposto para a representação de quatro categorias de tecidos mamários com diferentes densidades. O disco fibro-glandular é identificado através da aplicação de um limiar sob as classes de densidades determinadas no modelo. Os métodos propostos foram aplicados em 84 imagens de mamogramas de projeções médio-laterais oblíqüas da base de dados Mini-MIAS (\"Mammographic Image Analysis Society\", London, UK). A avaliação dos resultados dos procedimentos de segmentação da borda da mama e borda do músculo peitoral foi realizada com base no percentual de pixels falso-positivos (FPs) e falso-negativos (FNs) determinados por comparação entre os contornos verdadeiros e os contornos automaticamente identificados. As taxas médias de FPs e FNs para as bordas da mama e do músculo peitoral foram, respectivamente, de 0,41% e 0,58%, e 1,78% e 5,77%. A segmentação dos discos fibro-glandulares foi subjetivamente classificada por radiologistas e os resultados indicaram que em mais de 80% dos casos a segmentação foi ) considerada aceitável para o uso em sistemas de auxílio ao diagnóstico. A detecção de assimetrias foi realizada usando informações direcionais, obtidas a partir da representação multiresolução Gabor wavelets, e de informações de forma e densidade, extraídas dos discos fibro-glandulares dos mamogramas esquerdo e direito. No procedimento de análise direcional, uma representação wavelet formada por filtros de Gabor bidimensionais com variação em freqüência e orientação, especialmente projetadas para reduzir a redundância na representação, é aplicada para uma dada imagem. As respostas dos filtros para diferentes escalas e orientações são analisadas através da transformada de Karhunen-Loève (KL) e pelo método de limiarização de Otsu. A transformada KL é aplicada para selecionar os componentes principais das respostas dos filtros, preservando apenas os elementos direcionais mais relevantes que aparecem em todas as escalas. Os componentes principais selecionados e limiarizados pela técnica de Otsu são usados para obter as imagens de magnitude e fase dos componentes direcionais da imagem. Medidas estatísticas extraídas dos diagramas de rosa calculados a partir das imagens de fase são usadas para a análise quantitativa e qualitativa dos padrões orientados. Um total de 11 atributos é extraído dos discos fibro-glandulares segmentados dos mamogramas esquerdo e direito, e a diferença calculada para cada par de atributos é usada como uma medida para a detecção de assimetrias. Um total de 88 imagens (22 casos normais, 14 casos de densidades assimétricas e 8 casos de distorções de arquitetura) da base de dados Mini-MIAS foram usadas para avaliar o método proposto. A combinação exaustiva dos atributos juntamente com a análise de componentes principais foi usada para selecionar o melhor subgrupo de atributos. A classificação foi realizada através de classificadores de Bayes (linear e quadrático) ) e usando o método \"leave-one-out\". Uma taxa de classificação correta de 84,44% foi alcançada. / In this work, techniques are proposed for the automatic segmentation of mammograms and detection of asymmetries between left and right mammograms. The segmentation is performed by using three computational techniques for the identification of three important anatomical regions of mammograms: the skin-air boundary, the pectoral muscle, and the fibro-glandular disc. The first method focuses on the identification of the skin-air boundary by using an active contour model algorithm specially tailored for this purpose. In this stage, the skin-air boundary is demarcated, all artefacts outside the breast region are eliminated, and the region of interest for detection of the pectoral muscle is defined. In the next stage, the edge of the pectoral muscle is determined by using a multiresolution technique based upon a Gabor wavelets representation. Finally, a density breast model based upon a Gaussian mixture model is proposed for the representation of four categories of different density tissues in the breast. The fibro-glandular disc is identified by thresholding the density categories of the model. The methods proposed were applied to 84 images of medio-lateral oblique mammograms from the Mini-MIAS (Mammographic Image Analysis Society, London, U.K.) database. The evaluation of the skin-air boundary and the pectoral muscle edge were performed based upon the percentage of false-positive (FP) and false-negative (FN) pixels determined by comparison between the true contours and the contours automatically identified. The FP and FN average rates for the skin-air boundary and the pectoral muscle edge were, respectively, 0.41% and 0.58%, and 1.78% and 5.77%. Two radiologists subjectively rated the segmentation of the fibro-glandular disc and the results indicate that in more than 80% of the cases, the segmentation was considered acceptable for a Computer Aided Diagnosis purposes. Detection of asymmetries (continua) (continuação) is performed by using directional information, obtained from a multiresolution Gabor wavelets representation, and shape and density information, extracted from the fibro-glandular discs of left and right mammograms. In the directional procedure, a particular wavelet scheme with 2-D Gabor filters as elementary functions with varying tuning frequency and orientation, specifically designed in order to reduce the redundancy in the wavelet-based representation, is applied to the given image. The filter responses for different scales and orientation are analyzed by using the Karhunen-Loève (KL) transform and Otsu\'s method of thresholding. The KL transform is applied to select the principal components of the filter responses, preserving only the most relevant directional elements appearing at all scales. The selected principal components are thresholded by using Otsu\'s method and used to obtain the magnitude and phase of the image directional components. Rose diagrams computed from the phase images and statistical measures computed thereof are used for quantitative and qualitative analysis of the oriented patterns. A total of 11 features are also extracted from the segmented fibro-glandular discs of left-right mammograms, and the difference of each feature pair is used as a measure for detecting asymmetries. A total of 88 images from 22 normal cases, 14 asymmetric cases, and 8 architectural distortion cases from the Mini-MIAS database were used to evaluate the scheme. An exhaustive combination of the features along with the principal components analysis was used to select the best feature set. The classification was performed by using two Bayes\' classifiers (linear and quadratic) and the leave-one-out methodology. Average classification accuracy up to 84.44% was achieved.
234

Segmentação de voz baseada na análise fractal e na transformada wavelet. / Speech segmentation based on fractal analysis and wavelet transform.

Fantinato, Paulo César 02 December 2008 (has links)
Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC). / Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost, to allow use in real-time, and accuracy in the results, to produce a correct segmentation, delivering consistent data to the classifier. Aiming at meeting these two requirements, this work proposes a technique for speech segmentation based on the fractal dimension, obtained by using the discrete wavelet transform (DWT). Many families of wavelets were tested and compared, being the experiments performed with speech data collected from TIMIT corpus provided by the Linguistic Data Consortium.
235

Detecção da condição de rubbing em maquinas rotativas atraves da transformada Wavelet / Detection of rubbing condition on rotating machinery by wavelet transform

Aquino, Marcelo Braz de 22 February 2008 (has links)
Orientador: Robson Pederiva / Tese (doutorado) - Universidade Estadual de Campinas. Faculdade de Engenharia Mecanica / Made available in DSpace on 2018-09-11T21:11:47Z (GMT). No. of bitstreams: 1 Aquino_MarceloBrazde_D.pdf: 2578383 bytes, checksum: cfe62d4a785e2dd17a987600f5ef2e7c (MD5) Previous issue date: 2008 / Resumo: Este trabalho apresenta um procedimento de detecção do fenômeno de rubbing e seus efeitos em máquinas rotativas, aplicável para o regime estacionário e não-estacionário, utilizando como ferramenta de análise a Transformada de Wavelet. Primeiramente, aplica-se a Transformada de Wavelet Contínua (CWT) para sinais estacionários com o uso da wavelet Morlet Complexa como wavelet mãe, para extração de características intrínsecas da falha estudada. Aplica-se esta técnica para este regime de operação, pois, a análise multi-resolução é capaz de evidenciar possíveis transientes, mesmo no regime estacionário. Posteriormente, aplicou-se a Transformada de Wavelet Packet (WPT) visando-se analisar a variação da distribuição das energias contidas em bandas de freqüências específicas para o regime nãoestacionário. Diante da grande quantidade de informações contidas no sinal de partida e passagem pelas velocidades críticas do sistema, esta segunda técnica foi escolhida considerandose sua habilidade de compactação de dados, viabilizando o uso de outras técnicas e também o monitoramento on-line de máquinas. Todas as análises em questão, CWT no regime estacionário e a WPT no não-estacionário, são através de simulações computacionais com auxílio do Método dos Elementos Finitos e para sinais reais proveniente de uma bancada experimental de testes / Abstract: This work presents a detection procedure of the rubbing phenomenon and its effects in rotating machinery, applicable on the stationary and non-stationary regimes, using the Wavelet Transform as analysis tool. Firstly, the Continuous Wavelet Transform (CWT) is applied for stationary signals using the Complex Morlet wavelet as mother wavelet, for extracting of intrinsic features of the studied fault. The use of this technique and regime of operation is suitable, because, this multi-resolution analysis is able to evidence possible transients, even in the stationary regime. Afterward, the Wavelet Packet Transform (WPT) is applied for analyzing the variation of the energy distribution contained in bands of specific frequencies for the nonstationary regime. Related to the amount of information contained on the signal of run-up and while passing through the critical speeds of the system, this second technique was chosen by its ability of data compression that makes possible the use of another techniques as well as the online monitoring of machines. Both analyses, CWT in the stationary regime and WPT in the nonstationary one, are studied through computational simulations by the use of Finite Element Method and also through real signals got from the experimental test rig / Doutorado / Mecanica dos Sólidos e Projeto Mecanico / Doutor em Engenharia Mecânica
236

Avaliação do desempenho de recuperação de imagens médicas baseada em conteúdo em redes de computadores / Performance evaluation of content-based image retrieval on networks

Gracioso, Ana Carolina Nicolosi da Rocha 25 March 2008 (has links)
A área de recuperação de informação baseada em conteúdo visual, a cada dia ganha maior importância graças ao volume de material existente, incluindo imagens e vídeo digitais, compartilhado e distribuído principalmente via internet. Neste cenário, novas formas de consumo, manipulação e exploração de materiais digitais, têm sido criadas através da organização e indexação apropriadas. O grande aumento de bases de imagens médicas digitalizadas, somado às tecnologias associadas à imagens médicas e à ferramentas de recuperação baseadas no conteúdo dessas imagens, têm oferecido relevantes contribuições à prática da medicina. Além de positivamente influenciar no processo de aprendizagem de estudantes e também auxiliar nos diagnósticos, agregando esses recursos aos sistemas de arquivamento e comunicação de imagens (Picture Archiving and Communication Systems - PACS). O principal objetivo deste trabalho é verificar a viabilidade de um sistema de recuperação de imagens por conteúdo em rede, testando os tempos computacionais envolvidos para acesso em uma rede óptica de alta velocidade (KyaTera) e na internet. Também foram avaliadas famílias Wavetels como extratores de características de texturas e os resultados foram comparados em imagens médicas, considerando a eficiência de recuperação. Os resultados obtidos neste trabalho poderão servir como base para o desenvolvimento de programas de recuperação de imagens aplicados na área das ciências médicas e como indicativo da velocidade e do tráfego em redes de computadores instaladas em hospitais, conectando estes a clínicas, consultórios e demais infra-estruturas da área médica. / The field of information retrieval based on visual contents, has increased in importance due to its great deal of available material, including digital images and videos, which has been shared and disseminated mainly via internet. Thus, new patterns of consumption, handling, and exploration of digital materials have been developed using proper organization and indexation. The considerable increase in the digital medical image database, as well as the emerging technology and the retrieval tools based on the contents of these images, has contributed substantially to medicine practice. Additionally, associated to the picture archiving and communication systems (PACS), this advancement has positively influenced the education process and has aided diagnoses.The main objective of this work is to verify the performance of a content-based image retrieval system running on computer networks, testing the computational times involved for access on a high-speed optical (KyaTera) network and on the internet. Wavetels families were also evaluated as texture extractors and the results were compared in medical images, considering the recovery efficiency.The results obtained herein may serve as a basis for the development of image recovery programs applied to the medical sciences area, and as indicative of traffic speed on computer networks installed in hospitals, connecting them to clinics and other infrastructures in the medical field.
237

Ubiquitous Scalable Graphics: An End-to-End Framework using Wavelets

Wu, Fan 19 November 2008 (has links)
"Advances in ubiquitous displays and wireless communications have fueled the emergence of exciting mobile graphics applications including 3D virtual product catalogs, 3D maps, security monitoring systems and mobile games. Current trends that use cameras to capture geometry, material reflectance and other graphics elements means that very high resolution inputs is accessible to render extremely photorealistic scenes. However, captured graphics content can be many gigabytes in size, and must be simplified before they can be used on small mobile devices, which have limited resources, such as memory, screen size and battery energy. Scaling and converting graphics content to a suitable rendering format involves running several software tools, and selecting the best resolution for target mobile device is often done by trial and error, which all takes time. Wireless errors can also affect transmitted content and aggressive compression is needed for low-bandwidth wireless networks. Most rendering algorithms are currently optimized for visual realism and speed, but are not resource or energy efficient on mobile device. This dissertation focuses on the improvement of rendering performance by reducing the impacts of these problems with UbiWave, an end-to-end Framework to enable real time mobile access to high resolution graphics using wavelets. The framework tackles the issues including simplification, transmission, and resource efficient rendering of graphics content on mobile device based on wavelets by utilizing 1) a Perceptual Error Metric (PoI) for automatically computing the best resolution of graphics content for a given mobile display to eliminate guesswork and save resources, 2) Unequal Error Protection (UEP) to improve the resilience to wireless errors, 3) an Energy-efficient Adaptive Real-time Rendering (EARR) heuristic to balance energy consumption, rendering speed and image quality and 4) an Energy-efficient Streaming Technique. The results facilitate a new class of mobile graphics application which can gracefully adapt the lowest acceptable rendering resolution to the wireless network conditions and the availability of resources and battery energy on mobile device adaptively."
238

Avaliação do desempenho de recuperação de imagens médicas baseada em conteúdo em redes de computadores / Performance evaluation of content-based image retrieval on networks

Ana Carolina Nicolosi da Rocha Gracioso 25 March 2008 (has links)
A área de recuperação de informação baseada em conteúdo visual, a cada dia ganha maior importância graças ao volume de material existente, incluindo imagens e vídeo digitais, compartilhado e distribuído principalmente via internet. Neste cenário, novas formas de consumo, manipulação e exploração de materiais digitais, têm sido criadas através da organização e indexação apropriadas. O grande aumento de bases de imagens médicas digitalizadas, somado às tecnologias associadas à imagens médicas e à ferramentas de recuperação baseadas no conteúdo dessas imagens, têm oferecido relevantes contribuições à prática da medicina. Além de positivamente influenciar no processo de aprendizagem de estudantes e também auxiliar nos diagnósticos, agregando esses recursos aos sistemas de arquivamento e comunicação de imagens (Picture Archiving and Communication Systems - PACS). O principal objetivo deste trabalho é verificar a viabilidade de um sistema de recuperação de imagens por conteúdo em rede, testando os tempos computacionais envolvidos para acesso em uma rede óptica de alta velocidade (KyaTera) e na internet. Também foram avaliadas famílias Wavetels como extratores de características de texturas e os resultados foram comparados em imagens médicas, considerando a eficiência de recuperação. Os resultados obtidos neste trabalho poderão servir como base para o desenvolvimento de programas de recuperação de imagens aplicados na área das ciências médicas e como indicativo da velocidade e do tráfego em redes de computadores instaladas em hospitais, conectando estes a clínicas, consultórios e demais infra-estruturas da área médica. / The field of information retrieval based on visual contents, has increased in importance due to its great deal of available material, including digital images and videos, which has been shared and disseminated mainly via internet. Thus, new patterns of consumption, handling, and exploration of digital materials have been developed using proper organization and indexation. The considerable increase in the digital medical image database, as well as the emerging technology and the retrieval tools based on the contents of these images, has contributed substantially to medicine practice. Additionally, associated to the picture archiving and communication systems (PACS), this advancement has positively influenced the education process and has aided diagnoses.The main objective of this work is to verify the performance of a content-based image retrieval system running on computer networks, testing the computational times involved for access on a high-speed optical (KyaTera) network and on the internet. Wavetels families were also evaluated as texture extractors and the results were compared in medical images, considering the recovery efficiency.The results obtained herein may serve as a basis for the development of image recovery programs applied to the medical sciences area, and as indicative of traffic speed on computer networks installed in hospitals, connecting them to clinics and other infrastructures in the medical field.
239

Morphlet: uma nova família de transformadas wavelet aplicadas ao processo de conversão de voz / Morphlet: a new wavelet transform family applied for voice conversion process

Vieira, Lucimar Sasso 27 January 2012 (has links)
O presente trabalho de doutorado teve por objetivo a criaçãao de uma nova família de transformadas wavelet, chamadas Morphlets, que é específica para o processo de conversão de voz. Antes de explicar a criação da Morphlet, foi apresentada uma breve revisão bibliográfica sobre o funcionamento da Transformada Discreta Wavelet, sobre os processos de conversão de voz, algoritmos para criação de novas wavelets, entre outros tópicos. Em seguida é feita uma descrição detalhada da técnica utilizada para criação das Morphlets e, posteriormente, foi apresentado um novo algoritmo para conversão de voz baseado nas Morphlets. A criação das Morphlet, assim como o algoritmo proposto para conversão de voz baseado nela, inexistem na literatura, até o presente momento. Para testar à eficiência da técnica proposta de conversão de voz usando as Morphlets foram realizados testes diversos, principalmente baseados em critérios perceptuais, sendo os resultados obtidos motivadores, o que indicou um avanço na área. / The objective of this PhD work is the creation of a new family of wavelet transforms, called Morphlets, particularly designed for voice conversion. Before explaining the creation of this new family of transforms, a brief literature review on the Discrete Wavelet Transform, voice morphing procedures, algorithms to create specific wavelets, among other topics, was presented. This is followed by a detailed description of the technique used to create the new family of wavelets and, then, the algorithm for voice conversion based on this new transform. To date, the creation of Morphlets and the algorithm for voice conversion do not exist in the literature. In order to test the effectiveness of the proposed approach, many tests, mainly based on perceptual criteria, were performed. The results indicate an improvement in the area.
240

Segmentação de voz baseada na análise fractal e na transformada wavelet. / Speech segmentation based on fractal analysis and wavelet transform.

Paulo César Fantinato 02 December 2008 (has links)
Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC). / Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost, to allow use in real-time, and accuracy in the results, to produce a correct segmentation, delivering consistent data to the classifier. Aiming at meeting these two requirements, this work proposes a technique for speech segmentation based on the fractal dimension, obtained by using the discrete wavelet transform (DWT). Many families of wavelets were tested and compared, being the experiments performed with speech data collected from TIMIT corpus provided by the Linguistic Data Consortium.

Page generated in 0.0488 seconds