• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 7
  • 2
  • 2
  • 1
  • Tagged with
  • 12
  • 12
  • 12
  • 6
  • 6
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Síntese de fala em português brasileiro baseada em modelos ocultos de Markov

Francisco Soares de Souza, Carlos 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:55:58Z (GMT). No. of bitstreams: 2 arquivo2336_1.pdf: 1261229 bytes, checksum: 95035af35c94363c8e59a5bd6cf8bc31 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / O avanço da tecnologia nos conduz a uma relação cada vez mais próxima a computadores e outros dispositivos eletrônicos. Juntos a este avanço dos equipamentos está a evolução das interfaces humano-maquina que auxiliam nesta relação nem sempre agradável. Assim sendo, o desenvolvimento de sistemas que têm como objetivo tornar esta comunicação mais natural e agradável tem estado em foco, e dentre estes, os sistemas de processamento de fala são excelentes opções, pois permitem esta interação com equipamentos através da fala, como na comunicação humana tradicional. Atualmente, tanto o reconhecimento de fala quanto a síntese já se fazem presentes no dia-a-dia, como reconhecedores de palavras no pré-atendimento de call centers de empresas, ou fala sintética para se comunicar com o usuário em equipamentos de navegação GPS, leitores de mensagens de celular e e-mail, dentre outros. O uso de modelos ocultos de Markov em processamento de fala tem alcançado excelentes resultados, primeiramente em reconhecimento, onde foram suas primeiras aplicações e as que obtiveram maior destaque, e atualmente também em síntese, superando inclusive aspectos negativos de outras abordagens, como a necessidade de uma extensa base de dados de unidades fonéticas para obter bons resultados. Esta dissertação apresenta o desenvolvimento de um sintetizador de fala para o idioma português falado no Brasil, baseado em modelos ocultos de Markov. Este trabalho aborda a construção de um algoritmo de determinação da sílaba tônica de palavras, um algoritmo de conversão de grafemas em fonemas, e um algoritmo de separação silábica de palavras transcritas foneticamente. Por conseguinte, apresenta a técnica e suas características aplicadas à síntese de fala
2

Alineamiento de cadenas cí­clicas en el reconocimiento de formas bidimensionales

Palazón González, Vicente 28 May 2010 (has links)
Cuando queremos comparar dos formas bidimensionales utilizando sus contornos, suele presentarse un problema importante: la invarianza al punto inicial en su codificación como secuencia. Aunque existen métodos heurísticos para conseguir un buen punto de inicio que funcionan en ciertos contextos, si queremos una solución genérica, la única manera de conseguir esta invarianza es midiendo distancias con todos los posibles puntos iniciales, es decir, utilizando el alineamiento por fuerza bruta con todo posible inicio de la secuencia del contorno. De aquí surge el concepto de cadena cíclica. Así, medir una distancia entre dos cadenas cíclicas sería lo mismo que medir una distancia entre todos los posibles puntos iniciales de las dos cadenas. Esta comparación es muy costosa computacionalmente y el trabajo de la literatura se ha orientado sobre todo a reducir este coste.Existe mucho trabajo, a este respecto, en el dominio de las distancias de edición. Sin embargo, con otras técnicas, como son el alineamiento temporal no lineal (en inglés, Dynamic Time Warping) o los modelos ocultos de Markov (más tolerantes al ruido y otras deformaciones), no se ha profundizado demasiado con las cadenas cíclicas. Las aportaciones de esta tesis, van orientadas en esta dirección.Con el alineamiento temporal no lineal (ATNL), hemos desarrollado un algoritmo eficiente para el cálculo del ATNL cíclico. Hemos planteado también diversas alternativas para acelerar el cálculo del ATNL cíclico en tareas de reconocimiento. En primer lugar, un heurístico para evitar el cálculo cíclico, en el caso de que tengamos categorías etiquetadas. En segundo lugar, un método óptimo para acelerar el cálculo cíclico, utilizando una cota inferior basada en un pseudo-alineamiento que aproxima la distancia cíclica. Finalmente, aportamos soluciones basadas en AESA (Approximating and Eliminating Search Algorithm) y una mejora al algoritmo LAESA (Linear AESA).Con los modelos ocultos de Markov, estudiamos la topología lineal en el reconocimiento de contornos y desarrollamos extensiones cíclicas para los algoritmos de Viterbi (reconocimiento y entrenamiento) y Baum-Welch (entrenamiento).
3

RASTREAMENTO DE AGROBOTS EM ESTUFAS AGRÍCOLAS USANDO MODELOS OCULTOS DE MARKOV: Comparação do desempenho e da correção dos algoritmos de Viterbi e Viterbi com janela de observações deslizante

Alves, Roberson Junior Fernandes 17 September 2015 (has links)
Made available in DSpace on 2017-07-21T14:19:26Z (GMT). No. of bitstreams: 1 Roberson Junior Fernandes Alves.pdf: 17901245 bytes, checksum: 170e17bbccf0e54fa9b0dab204aca2e4 (MD5) Previous issue date: 2015-09-17 / Developing mobile and autonomous agrobots for greenhouses requires the use of procedures which allow robot autolocalization and tracking. The tracking problem can be modeled as finding the most likely sequence of states in a hidden Markov model„ whose states indicate the positions of an occupancy grid. This sequence can be estimated with Viterbi’s algorithm. However, the processing time and consumed memory, of this algorithm, grows with the dimensions of the grid and tracking duration, and, this can constraint its use for tracking agrobots. Considering it, this work presents a tracking procedure which uses two approximated implementations of Viterbi’s algorithm called Viterbi-JD(Viterbi’s algorithm with a sliding window) and Viterbi-JD-MTE(Viterbi’s algorithm with a sliding window over an hidden Markov model with sparse transition matrix). The experimental results show that the time and memory performance of tracking with this two approximated implementations are significantly higher than the Viterbi’s based tracking. The reported tracking hypothesis is suboptimal, when compared to the hypothesis generated by Viterbi, but the error does not grows substantially. Th experimentos was performed using RSSI(Received Signal Strength Indicator) simulated data. / O desenvolvimento de agrobots móveis e autônomos para operar em estufas agrícolas depende da implementação de procedimentos que permitam o rastreamento do robô no ambiente. O problema do rastreamento pode ser modelado como a determinação da sequência de estados mais prováveis de um modelo oculto de Markov cujos estados indicam posições de uma grade de ocupação. Esta sequência pode ser estimada pelo algoritmo de Viterbi. No entanto, o tempo de processamento e a memória consumida, por esse algoritmo, crescem com as dimensões da grade e com a duração do rastreamento, e isto pode limitar seu uso no rastreamento de agrobots em estufas. Considerando o exposto, este trabalho apresenta um procedimento de rastreamento que utiliza mplementações aproximadas do algoritmo de Viterbi denominadas de Viterbi-JD(Viterbi com janela deslizante) e Viterbi- JD-MTE(Viterbi com janela deslizante sobre um modelo oculto de Markov com matriz de transição esparsa). Os experimentos mostram que o desempenho de tempo e memória do rastreamento baseado nessas implementações aproximadas é significativamente melhor que aquele do algoritmo original. A hipótese de rastreamento gerada é sub ótima em relação àquela calculada pelo algoritmo original, contudo, não há um aumento substancial do erro. Os experimentos foram realizados utilizando dados simulados de RSSI (Received Signal Strength Indicator).
4

Using unsupervised corpus-based methods to build rule-based machine translation systems / Empleo de métodos no supervisados basados en corpus para construir traductores automáticos basados en reglas

Sánchez-Martínez, Felipe 30 June 2008 (has links)
No description available.
5

Homologias em genes relacionados à resistência à mastite em vacas, ovelhas e cabras

IDALINO, Rita de Cássia de Lima 20 December 2010 (has links)
Submitted by (ana.araujo@ufrpe.br) on 2016-08-10T13:59:35Z No. of bitstreams: 1 Rita de Cassia de Lima Idalino.pdf: 2600123 bytes, checksum: 41f878b68e3437742821d874a6955502 (MD5) / Made available in DSpace on 2016-08-10T13:59:35Z (GMT). No. of bitstreams: 1 Rita de Cassia de Lima Idalino.pdf: 2600123 bytes, checksum: 41f878b68e3437742821d874a6955502 (MD5) Previous issue date: 2010-12-20 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Given the large amount of data that is generated in the field of molecular genetics, is of paramount importance that techniques which allow the organization and interpretation of such data be developed and widely disseminated. Initially, we carried out a composition analysis of three gene sequences of the species: ox (Bos taurus), goat (Capra hircus), and sheep (Ovis aries), then we applied alignment techniques for identification of similarities between them. Subsequently, we used the Markov Chain theory with hidden states, i.e. Hidden Markov Models (HMMs, hereafter), in the application of discrimination problem of homogeneous regions in DNA sequences. We used the Viterbi algorithm as an auxiliary tool to obtain homogeneous regions, and then the Baum-Eelch algorithm in order to maximize the probability of a sequence of observations. We analyzed portions of HSP70.1 and NRAMP-1 genes for three different species. / Diante da grande massa de dados que é gerada na área da genética molecular, é de suma importância que técnicas que possibilitem a organização e interpretação desses dados sejam desenvolvidas e amplamente divulgadas. Inicialmente, neste trabalho, foi realizada uma análise da composição de três sequências genéticas, das espécies Bovina (Bos taurus), Caprina (Capra hircus) e Ovina (Ovis aries), em seguida aplicamos técnicas de alinhamentos para identificação de similaridades entre estas. Posteriormente, utilizamos a teoria das cadeias de Markov com estados ocultos, HMM’s (Hidden Markov Models), na aplicação do problema de discriminação de regiões homogêneas em sequências de DNA. Utilizamos o algoritmo de Viterbi como uma ferramenta auxiliar para obtenção de regiões homogêneas e em seguida o algoritmo Baum-Welch para maximizar as probabilidades de uma sequência de observações. Foram analisados trechos dos genes HSP70.1 e NRAMP-1 para três espécies diferentes.
6

Nuevos desarrollos y aplicaciones basados en métodos estocásticos para el agrupamiento no supervisado de latidos en señales electrocardiográficas

Micó Tormos, Pau 06 May 2008 (has links)
El trabajo presentado, pretende dar continuidad a la línea de trabajo iniciada con una tesis previa titulada ''Estudio de métodos para procesamiento y agrupación de señales electrocardiográficas''. La problemática a abordar es la misma que en la tesis mencionada: reducción del número de latidos a examinar el un registro electrocardiográfico (ECG) de larga duración (conocido como Holter), mediante técnicas de agrupamiento no supervisado. Sin embargo, en este caso y como técnica de extracción de características se utiliza la aproximación poligonal (Polygonal Approximation, PA) y además, en la etapa de reducción de características, se usará un método estocástico basado en los modelos ocultos de Markov (Hidden Markov Models, HMM) y uno estadístico basado en el análisis de componentes principales (Principal Component Analysis, PCA). En esta tesis se describen las aportaciones realizadas en estas tres áreas: PA, HMM y PCA, aplicadas a esta problemática concreta. La validez de los! métodos viene refrendada por un conjunto amplio de experimentos utilizando como fuentes de datos las señales ECG disponibles en la base de datos del Massachusetts Institute of Technology (MIT). Como conclusión se enumeran las mejoras obtenidas de la aplicación de estos métodos sobre el proceso de clustering de latidos sobre señales ECG de tipo Holter. / Micó Tormos, P. (2005). Nuevos desarrollos y aplicaciones basados en métodos estocásticos para el agrupamiento no supervisado de latidos en señales electrocardiográficas [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1856 / Palancia
7

Uma abordagem integrada para a construção e utilização de HMMs de perfil para análises genômicas e metagenômicas / An integrated approach for the construction and application of profile HMMs for genomic and metagenomic analyses.

Kashiwabara, Liliane Santana Oliveira 02 August 2019 (has links)
HMMs de perfil são um método poderoso para modelar a diversidade de sequências biológicas e constituem uma abordagem muito sensível para a detecção de ortólogos remotos. Uma potencial aplicação de tais modelos é a detecção de vírus emergentes e novos elementos genéticos móveis. Nosso grupo desenvolveu recentemente o GenSeed-HMM, um programa que emprega HMMs de perfil como sementes para montagem progressiva de genes-alvo, utilizando tanto dados genômicos como metagenômicos. No presente trabalho foi desenvolvido o TABAJARA, um programa para o desenho racional de HMMs de perfil. Partindo de um alinhamento de múltiplas sequências, o TABAJARA é capaz de encontrar blocos que são (1) conservados ou (2) discriminativos para dois ou mais grupos de sequências. O programa utiliza diferentes métricas para atribuir pontuações posição-específicas ao longo de todo o alinhamento e utiliza então uma janela deslizante para encontrar as regiões com maiores pontuações. Blocos de alinhamento selecionados são então extraídos e utilizados para construir HMMs de perfil. Para validar o método, o programa TABAJARA foi empregado para a construção de modelos para vírus do gênero Flavivirus e para fagos da família Microviridae. Em ambos os grupos virais foi possível se obter modelos de ampla abrangência, capazes de detectar todos os membros de um respectivo grupo taxonômico, e modelos de abrangência mais restrita, específicos para espécies distintas de Flavivirus (ex. DENV, ZIKV ou YFV) ou subfamílias de Microviridae (ex. Alpavirinae, Gokushovirinae e Pichovirinae). Em outra validação, foram utilizadas sequências da endonuclease Cas1 para se obter modelos capazes de diferenciar CRISPRs de casposons, esses últimos representando uma superfamília de transposons de DNA autossintetizantes, os quais originaram o sistema de imunidade CRISPR-Cas de procariotos. O TABAJARA conseguiu gerar modelos específicos de Cas1 derivada de casposons, permitindo sua diferenciação em relação aos seus ortólogos de CRISPRs. No presente trabalho foi desenvolvido ainda o HMM-Prospector, uma ferramenta que utiliza um conjunto de HMMs de perfil para a triagem de dados de sequenciamento genômico ou metagenômico. O programa informa quais são os modelos mais reconhecidos pelas leituras, sob valores de corte de pontuação definidos pelo usuário, assim como quantas leituras são detectadas por cada modelo. Com esta informação, os modelos mais relevantes podem ser utilizados como sementes em montagens progressivas com o programa GenSeed-HMM, dentro de uma abordagem integrada para a construção de modelos e sua aplicação. Finamente, foi desenvolvido o e-Finder, um aplicativo genérico para a detecção e extração de elementos multigênicos a partir de genomas ou metagenomas montados utilizando HMMs de perfil. O e-Finder executa buscas de similaridade entre os HMMs de perfil e as sequências traduzidas dos dados montados e checa, em seguida, se os critérios de sintenia pré-definidos foram atendidos, incluindo o número mínimo de genes, a ordem dos genes e as distâncias intergênicas. As sequências dos elementos são então extraídas, as regiões codificantes (ORFs) identificadas e traduzidas conceitualmente em sequências completas de proteínas. Para validar esta ferramenta, foram empegados dois estudos de caso, profagos da família Microviridae e casposons, utilizando-se HMMs de perfil específicos, construídos com o programa TABAJARA. Em ambos os casos, o e-Finder foi executado usando-se a base de dados PATRIC, um repositório com mais de 135.000 genomas de bactérias e arqueias. Foram identificados um total de 91 contigs positivos para casposons a partir de 79 genomas distintos. No caso dos Microviridae, foram encontrados 104 profagos candidatos, estendendo o conhecimento da gama de hospedeiros bacterianos. Em ambos os casos, análises filogenéticas confirmaram a correta atribuição taxonômica das sequências positivas. Os programas desenvolvidos neste trabalho podem ser utilizados isoladamente ou em combinação para detectar e discriminar sequências conhecidas ou remotamente relacionadas. Juntamente com o GenSeed-HMM, estes programas constituem um conjunto integrado de ferramentas com potencial aplicação na busca de novos vírus e elementos genéticos móveis, bem como em qualquer outra tarefa relacionada à detecção e/ou discriminação de subgrupos de famílias de sequências nucleotídicas ou proteicas / Profile HMMs are a powerful way of modeling sequence diversity and constitute a very sensitive approach to detect remote orthologs. A potential application of such models is the detection of emerging viruses and novel mobile genetic elements. Our group has recently developed GenSeed-HMM, a tool that employs profile HMMs as seeds for gene-targeted progressive assembly using either genomic or metagenomic data. In this work we developed TABAJARA, a program for the rational design of profile HMMs. Starting from a multiple sequence alignment, TABAJARA is able to find blocks that are either (1) conserved across all sequences or (2) discriminative for two or more specific groups of sequences. The program uses different metrics to ascribe position-specific scores along the whole alignment and then uses a sliding-window to find top-scoring regions. Selected alignment blocks are then extracted and used to build profile HMMs. To validate the method, we employed TABAJARA to construct models for viruses of the Flavivirus genus and phages of the Microviridae family. In both viral groups we were able to obtain wide-range models, able to detect all members of the respective taxonomic group, and models that are specific to particular Flavivirus species (e.g. DENV, ZIKV or YFV) or Microviridae subfamilies (e.g. Alpavirinae, Gokushovirinae and Pichovirinae). In another validation, we used sequences of the endonuclease Cas1 to obtain models capable of differentiating CRISPRs from casposons, the latter elements representing a superfamily of self-synthesizing DNA transposons that originated the prokaryotic CRISPR-Cas immunity. TABAJARA succeeded to generate models specific to casposon-derived Cas1, enabling their differentiation from CRISPR orthologs. We also developed HMM-Prospector, a tool that can use a batch of profile HMMs to screen genomic or metagenomic sequencing data, reporting which profile HMMs are mostly recognized under user-defined score cutoff values, and how many reads are detected by each model. With this information, the most relevant models can be used as seeds in progressive assemblies with GenSeed-HMM program, providing an integrated approach for model construction and application. Finally, we developed e-Finder, a generic application for detecting and extracting multigene elements from assembled genomes or metagenomes using profile HMMs. e-Finder runs similarity searches of profile HMMs against translated sequences of the assembled data and then checks if pre-defined syntenic criteria have been fulfilled, including minimum number of genes, gene order and intergenic distances. Element sequences are then extracted, their ORFs identified and conceptually translated into full-length protein sequences. To validate the tool, we employed two distinct case studies, prophages of the Microviridae family and casposons, using specific profile HMMs constructed by TABAJARA. In both cases, we executed e-Finder using the PATRIC database, a repository with over 135,000 bacterial and archaeal genomes. We identified in total 91 casposon-positive contigs from 79 distinct genomes. In the case of Microviridae, we found a total of 104 provirus candidates, extending the known range of bacterial hosts. In both cases, phylogenetic analyses confirmed the correct taxonomic assignment of the positive sequences. The programs developed in this work can be used alone or in combination to detect and discriminate known or distantly related sequences. Together with GenSeed-HMM, these programs provide an integrated toolbox with potential application in the search of novel viruses and mobile genetic elements, as well as in any other task related to the detection and/or discrimination of subgroups of DNA or protein sequences.
8

Descoberta e caracterização de vírus emergentes e reergentes em áreas peri-florestais. / Discovering and characterizing emerging and re-emerging viruses in communities encroaching tropical hotspots.

Paola, Nicholas Di 21 March 2018 (has links)
A fragmentação e a invasão de florestas tropicais e a crescente concentração de assentamentos humanos aumentaram exponencialmente as chances de exposição a vírus emergentes e emergentes. Dado o grande potencial de espalhamento de patógenos em população humanas, a identificação e caracterização de agentes patogênicos circulantes podem melhorar a atenção primária e as capacidades de diagnóstico para um agente emergente futuro. As abordagens moleculares e metagenômicas que utilizam as tecnologias de sequenciação da próxima geração levaram a descoberta e caracterização de muitos vírus emergentes na última década. Além disso, as abordagens in silico também podem ajudar a identificar vírus emergentes usando apenas dados de sequenciamento publicamente disponíveis. Além disso, estimar a ascendência filogenética e até mesmo analisar as mudanças no uso de codons são ferramentas adicionais que podem melhorar a nossa compreensão de vírus emergentes ou reemergentes. Este projeto visou aplicar essas ferramentas em ambos os vírus que poderiam estar circulando no Brasil: Parvovírus B19 e vírus da Febre Amarela. Também exploramos as aplicações de modelos ocultos de Markov e índice de adaptação de codons usando dados publicamente disponíveis. Esperamos que este trabalho forneça uma prova de conceito para futuros projetos metagenômicos e demonstre a utilidade das várias técnicas moleculares e bioinformáticas no estudo de vírus emergentes. / Fragmentation and encroachment of tropical rainforests and the growing concentration of human settlements have exponentially increased chances of exposure to re-emerging and emerging viruses. Given the large potential for pathogens to spillover and spread in a population, identifying and characterizing circulating human pathogens could improve the readiness and diagnostic capabilities for a future emergence. Molecular and metagenomic approaches using next-generation sequencing technologies have led to the discovery and characterization of many emerging viruses over the last decade. In complement, in silico approaches can also help identify emerging viruses using only publicly available sequencing data. Moreover, estimating the phylogenetic ancestry and even analyzing changes in codon usage are additional tools that can improve our understanding of an emerging or re-emerging virus. This project aimed to apply these tools to two viruses that could be circulating in Brazil: Parvovirus B19 and Yellow Fever virus. We also explored the applications of Hidden Markov models and codon adaptation index using publicly available data. We expect this work to provide a proof-of-concept for future metagenomic projects, and demonstrate the utility for several molecular and bioinformatics techniques in the study of emerging viruses.
9

Síntesi basada en models ocults de Markov aplicada a l'espanyol i a l'anglès, les seves aplicacions i una proposta híbrida

Gonzalvo Fructuoso, Javier 16 July 2010 (has links)
Avui en dia, la Interacció Home Màquina (IHM) és una de les disciplines més estudiades amb l'objectiu de millorar les interaccions humanes amb sistemes reals actuals i futurs. Cada vegada més gent utilitza més dispositius electrònics a la vida quotidiana Aquesta incursió electrònica es deu principalment a dues raons. D'una banda, la facilitat d'accés a aquesta tecnologia però d'altra banda, unes interfícies més amigables que permeten un ús més fàcil i intuitiu. Simplement fa falta observar els ordinadors personals d'avui en dia, les computadores de butxaca i inclús els telèfons mòbils. Tots aquests nous dispositius permeten que usuaris poc experimentats puguin fer ús de les tecnologies més punteres. D'altra banda, la inclusió de les tecnologies de la parla estan arribant a ser més comunes gràcies a què els sistemes de reconeixement i de síntesi de veu han millorat considerablement el seu funcionament i fiabilitat.L'objectiu final de les tecnologies de la parla és crear sistemes tan naturals com els éssers humans per tal de fer que el seu ús es pugui extendre a qualsevol racó de la vida quotidiana Els conversors de Text-a-Parla (o sintetitzadors) són un dels mòduls que més esforç investigador han rebut amb l'objectiu de millorar la seva naturalitat i expressivitat. L'ús de sintetitzadors s'ha ampliat durant els últims temps degut a l'alta qualitat aconseguida en aplicacions de domini restringit i el bon comportament en aplicacions de propòsit general. De totes formes, encara queda un llarg camí per recòrrer pel que respecta a la qualitat en aplicacions de domini obert. A més a més, algunes de les tendències dels sistemes sintetitzadors comporten reduir el tamany de les bases de dades, sistemes flexibles per adaptar locutors i estils de locució i sistemes entrenables.Aquesta tesi doctoral presentarà un sintetizador de veu basat en l'entorn probabilístic dels Models Ocults de Makov (MOM) que tractarà amb els principals temes estudiats a l'actualitat, tal com l'adaptació de l'estil del locutor, sistemes conversors de veu entrenables i bases de dades de tamany reduit. Es descriurà el funcionament convencional dels algoritmes i es propondran millores en diferents àmbits com per exemple l'expressivitat. A la vegada, es presenta un sistema híbrid punter que combina models estadístics i de concatenació de veu. Els resultats obtinguts mostren com les propostes d'aquest treball donen un pas endavant en l'àmbit de la creació de veu sintètica utilitzant models estadístics. / Hoy en día, la Interacción Hombre-Máquina (IHM) es una de las disciplinas más estudiadas con el objetivo de mejorar las interacciones humanas con sistemas reales para el presente y para el futuro venidero. Más y más dispositivos electrónicos son usados por más gente en la vida diaria. Esta incursión electrónica se debe principalmente a dos razones. Por un lado, el indudable aumento en la accesibilidad económica a esta tecnología pero por otra parte, unos interfaces más amigables que permiten un uso más fácil e intuitivo. Simplemente hace falta observar hoy en día los ordenadores personales, las computadoras de bolsillo e incluso los teléfonos móviles. Todos estos nuevos dispositivos admiten que usuarios poco experimentados puedan hacer uso de las tecnologías más punteras. Por otra parte, la inclusión de las tecnologías del habla está llegando a ser más común gracias a que los sistemas de reconocimiento y de síntesis de voz han estado mejorando su funcionamiento y fiabilidad.El objetivo final de las tecnologías del habla es crear sistemas tan naturales como los seres humanos para que su uso se pueda extender a cualquier rincón de la vida diaria. Los conversores de Texto-a-Voz (o sintetizadores) son de los módulos que más esfuerzo investigador han recibido con el objetivo de mejorar su naturalidad y la expresividad. El uso de los sintetizadores se ha ampliado durante los últimos tiempos debido a la alta calidad alcanzada en usos de dominio restringido y el buen comportamiento en aplicaciones de propósito general. De todas formas, todavía queda un largo camino por recorrer por lo que respecta a la calidad en aplicaciones de dominio abierto. Además, algunas de las tendencias de los sistemas sintetizadores conllevan reducir el tamaño de las bases de datos, sistemas flexibles para adaptar locutores y estilos de locución y sistemas entrenables.Esta tesis doctoral presentará un sintetizador de voz basado en el entorno probabilístico de los Modelos Ocultos de Markov (MOM) que lidiará con los principales temas estudiados en la actualidad tales como adaptación del estilo de locutor, sistema conversores de voz entrenables y bases de datos de tamaño reducido. Se describirá el funcionamiento convencional de los algoritmos y se propondrán mejoras en varios ámbitos tales como la expresividad. A la vez se presenta un sistema híbrido puntero que combina modelos estadísticos y de concatenación de voz. Los resultados obtenidos muestran como las propuestas de este trabajo dan un paso adelante en el ámbito de la creación de voz sintética usando modelos estadísticos. / Nowadays, Human Computer Interaction (HCI) is one of the most studied disciplines in order to improve real human interactions with machines on the present time and for the incoming future. More and more electronic devices of the daily life are used by more people. This electronic incursion is mainly due to two reasons. On the one hand, the undoubted increasing of the economical accessibility to this technology but on the other hand, the more friendly interfaces allow an easier and more intuitive use. As a matter of fact, nowadays it is only necessary to observe the personal computer interfaces, pocket size computers and even mobile telephones. All these new interfaces let little experienced users make use of cutting edge technologies. Moreover, the inclusion of speech technologies in these systems is becoming more usual since speech recognition and synthesis systems have improved their performance and reliability.The purpose of speech technology is to provide systems with a natural human interface so the use can be extended to daily life. Text-to-Speech (TTS) systems are one of the main modules under intense research activity in order to improve their naturalness and expressiveness. The use of synthesizers has been extended during the last times due to the high-quality reached in real limited domain applications and the good performance in generic purposes applications. However, there is still a long way to go with respect to quality and open domain systems.This work will present a TTS system based on a statistical framework using Hidden Markov Models (HMMs) that will deal with the main topics under study in recent years such as voice style adaptation, trainable TTS systems and low print databases. Moreover, a cutting edge hybrid approach combining concatenative and statistical synthesis will also be presented. Ideas and results in this work show a step forward in the HMM-based TTS system field
10

Automatic speech recognition, with large vocabulary, robustness, independence of speaker and multilingual processing

Caon, Daniel Régis Sarmento 27 August 2010 (has links)
Made available in DSpace on 2016-12-23T14:33:42Z (GMT). No. of bitstreams: 1 Dissertacao de Daniel Regis Sarmento Caon.pdf: 1566094 bytes, checksum: 67b557539f4bc5b354bc90066e805215 (MD5) Previous issue date: 2010-08-27 / This work aims to provide automatic cognitive assistance via speech interface, to the elderly who live alone, at risk situation. Distress expressions and voice commands are part of the target vocabulary for speech recognition. Throughout the work, the large vocabulary continuous speech recognition system Julius is used in conjunction with the Hidden Markov Model Toolkit(HTK). The system Julius has its main features described, including its modification. This modification is part of the contribution which is in this work, including the detection of distress expressions ( situations of speech which suggest emergency). Four different languages were provided as target for recognition: French, Dutch, Spanish and English. In this same sequence of languages (determined by data availability and the local of scenarios for the integration of systems) theoretical studies and experiments were conducted to solve the need of working with each new configuration. This work includes studies of the French and Dutch languages. Initial experiments (in French) were made with adaptation of hidden Markov models and were analyzed by cross validation. In order to perform a new demonstration in Dutch, acoustic and language models were built and the system was integrated with other auxiliary modules (such as voice activity detector and the dialogue system). Results of speech recognition after acoustic adaptation to a specific speaker (and the creation of language models for a specific scenario to demonstrate the system) showed 86.39 % accuracy rate of sentence for the Dutch acoustic models. The same data shows 94.44 % semantical accuracy rate of sentence / Este trabalho visa prover assistência cognitiva automática via interface de fala, à idosos que moram sozinhos, em situação de risco. Expressões de angústia e comandos vocais fazem parte do vocabulário alvo de reconhecimento de fala. Durante todo o trabalho, o sistema de reconhecimento de fala contínua de grande vocabulário Julius é utilizado em conjunto com o Hidden Markov Model Toolkit(HTK). O sistema Julius tem suas principais características descritas, tendo inclusive sido modificado. Tal modificação é parte da contribuição desse estudo, assim como a detecção de expressões de angústia (situações de fala que caracterizam emergência). Quatro diferentes linguas foram previstas como alvo de reconhecimento: Francês, Holandês, Espanhol e Inglês. Nessa mesma ordem de linguas (determinadas pela disponibilidade de dados e local de cenários de integração de sistemas) os estudos teóricos e experimentos foram conduzidos para suprir a necessidade de trabalhar com cada nova configuração. Este trabalho inclui estudos feitos com as linguas Francês e Holandês. Experimentos iniciais (em Francês) foram feitos com adaptação de modelos ocultos de Markov e analisados por validação cruzada. Para realizar uma nova demonstração em Holandês, modelos acústicos e de linguagem foram construídos e o sistema foi integrado a outros módulos auxiliares (como o detector de atividades vocais e sistema de diálogo). Resultados de reconhecimento de fala após adaptação dos modelos acústicos à um locutor específico (e da criação de modelos de linguagem específicos para um cenário de demonstração do sistema) demonstraram 86,39% de taxa de acerto de sentença para os modelos acústicos holandeses. Os mesmos dados demonstram 94,44% de taxa de acerto semântico de sentença

Page generated in 0.4864 seconds