• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 12
  • 9
  • 7
  • Tagged with
  • 28
  • 28
  • 28
  • 28
  • 28
  • 17
  • 12
  • 7
  • 6
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

A new approach to Decimation in High Order Boltzmann Machines

Farguell Matesanz, Enric 20 January 2011 (has links)
La Màquina de Boltzmann (MB) és una xarxa neuronal estocàstica amb l'habilitat tant d'aprendre com d'extrapolar distribucions de probabilitat. Malgrat això, mai ha arribat a ser tant emprada com d'altres models de xarxa neuronal, com ara el perceptró, degut a la complexitat tan del procés de simulació com d'aprenentatge: les quantitats que es necessiten al llarg del procés d'aprenentatge són normalment estimades mitjançant tècniques Monte Carlo (MC), a través de l'algorisme del Temprat Simulat (SA). Això ha portat a una situació on la MB és més ben aviat considerada o bé com una extensió de la xarxa de Hopfield o bé com una implementació paral·lela del SA. Malgrat aquesta relativa manca d'èxit, la comunitat científica de l'àmbit de les xarxes neuronals ha mantingut un cert interès amb el model. Una de les extensions més rellevants a la MB és la Màquina de Boltzmann d'Alt Ordre (HOBM), on els pesos poden connectar més de dues neurones simultàniament. Encara que les capacitats d'aprenentatge d'aquest model han estat analitzades per d'altres autors, no s'ha pogut establir una equivalència formal entre els pesos d'una MB i els pesos d'alt ordre de la HOBM. En aquest treball s'analitza l'equivalència entre una MB i una HOBM a través de l'extensió del mètode conegut com a decimació. Decimació és una eina emprada a física estadística que es pot també aplicar a cert tipus de MB, obtenint expressions analítiques per a calcular les correlacions necessàries per a dur a terme el procés d'aprenentatge. Per tant, la decimació evita l'ús del costós algorisme del SA. Malgrat això, en la seva forma original, la decimació podia tan sols ser aplicada a cert tipus de topologies molt poc densament connectades. La extensió que es defineix en aquest treball permet calcular aquests valors independentment de la topologia de la xarxa neuronal; aquest model es basa en afegir prou pesos d'alt ordre a una MB estàndard com per a assegurar que les equacions de la decimació es poden solucionar. Després, s'estableix una equivalència directa entre els pesos d'un model d'alt ordre, la distribució de probabilitat que pot aprendre i les matrius de Hadamard: les propietats d'aquestes matrius es poden emprar per a calcular fàcilment els pesos del sistema. Finalment, es defineix una MB estàndard amb una topologia específica que permet entendre millor la equivalència exacta entre unitats ocultes de la MB i els pesos d'alt ordre de la HOBM. / La Máquina de Boltzmann (MB) es una red neuronal estocástica con la habilidad de aprender y extrapolar distribuciones de probabilidad. Sin embargo, nunca ha llegado a ser tan popular como otros modelos de redes neuronals como, por ejemplo, el perceptrón. Esto es debido a la complejidad tanto del proceso de simulación como de aprendizaje: las cantidades que se necesitan a lo largo del proceso de aprendizaje se estiman mediante el uso de técnicas Monte Carlo (MC), a través del algoritmo del Temple Simulado (SA). En definitiva, la MB es generalmente considerada o bien una extensión de la red de Hopfield o bien como una implementación paralela del algoritmo del SA. Pese a esta relativa falta de éxito, la comunidad científica del ámbito de las redes neuronales ha mantenido un cierto interés en el modelo. Una importante extensión es la Màquina de Boltzmann de Alto Orden (HOBM), en la que los pesos pueden conectar más de dos neuronas a la vez. Pese a que este modelo ha sido analizado en profundidad por otros autores, todavía no se ha descrito una equivalencia formal entre los pesos de una MB i las conexiones de alto orden de una HOBM. En este trabajo se ha analizado la equivalencia entre una MB i una HOBM, a través de la extensión del método conocido como decimación. La decimación es una herramienta propia de la física estadística que también puede ser aplicada a ciertos modelos de MB, obteniendo expresiones analíticas para el cálculo de las cantidades necesarias en el algoritmo de aprendizaje. Por lo tanto, la decimación evita el alto coste computacional asociado al al uso del costoso algoritmo del SA. Pese a esto, en su forma original la decimación tan solo podía ser aplicada a ciertas topologías de MB, distinguidas por ser poco densamente conectadas. La extensión definida en este trabajo permite calcular estos valores independientemente de la topología de la red neuronal: este modelo se basa en añadir suficientes pesos de alto orden a una MB estándar como para asegurar que las ecuaciones de decimación pueden solucionarse. Más adelante, se establece una equivalencia directa entre los pesos de un modelo de alto orden, la distribución de probabilidad que puede aprender y las matrices tipo Hadamard. Las propiedades de este tipo de matrices se pueden usar para calcular fácilmente los pesos del sistema. Finalmente, se define una BM estándar con una topología específica que permite entender mejor la equivalencia exacta entre neuronas ocultas en la MB y los pesos de alto orden de la HOBM. / The Boltzmann Machine (BM) is a stochastic neural network with the ability of both learning and extrapolating probability distributions. However, it has never been as widely used as other neural networks such as the perceptron, due to the complexity of both the learning and recalling algorithms, and to the high computational cost required in the learning process: the quantities that are needed at the learning stage are usually estimated by Monte Carlo (MC) through the Simulated Annealing (SA) algorithm. This has led to a situation where the BM is rather considered as an evolution of the Hopfield Neural Network or as a parallel implementation of the Simulated Annealing algorithm. Despite this relative lack of success, the neural network community has continued to progress in the analysis of the dynamics of the model. One remarkable extension is the High Order Boltzmann Machine (HOBM), where weights can connect more than two neurons at a time. Although the learning capabilities of this model have already been discussed by other authors, a formal equivalence between the weights in a standard BM and the high order weights in a HOBM has not yet been established. We analyze this latter equivalence between a second order BM and a HOBM by proposing an extension of the method known as decimation. Decimation is a common tool in statistical physics that may be applied to some kind of BMs, that can be used to obtain analytical expressions for the n-unit correlation elements required in the learning process. In this way, decimation avoids using the time consuming Simulated Annealing algorithm. However, as it was first conceived, it could only deal with sparsely connected neural networks. The extension that we define in this thesis allows computing the same quantities irrespective of the topology of the network. This method is based on adding enough high order weights to a standard BM to guarantee that the system can be solved. Next, we establish a direct equivalence between the weights of a HOBM model, the probability distribution to be learnt and Hadamard matrices. The properties of these matrices can be used to easily calculate the value of the weights of the system. Finally, we define a standard BM with a very specific topology that helps us better understand the exact equivalence between hidden units in a BM and high order weights in a HOBM.
12

Marc integrador de les capacitats de Soft-Computing i de Knowledge Discovery dels Mapes Autoorganitzatius en el Raonament Basat en Casos

Fornells Herrera, Albert 14 December 2007 (has links)
El Raonament Basat en Casos (CBR) és un paradigma d'aprenentatge basat en establir analogies amb problemes prèviament resolts per resoldre'n de nous. Per tant, l'organització, l'accés i la utilització del coneixement previ són aspectes claus per tenir èxit en aquest procés. No obstant, la majoria dels problemes reals presenten grans volums de dades complexes, incertes i amb coneixement aproximat i, conseqüentment, el rendiment del CBR pot veure's minvat degut a la complexitat de gestionar aquest tipus de coneixement. Això ha fet que en els últims anys hagi sorgit una nova línia de recerca anomenada Soft-Computing and Intelligent Information Retrieval enfocada en mitigar aquests efectes. D'aquí neix el context d'aquesta tesi.Dins de l'ampli ventall de tècniques Soft-Computing per tractar coneixement complex, els Mapes Autoorganitzatius (SOM) destaquen sobre la resta per la seva capacitat en agrupar les dades en patrons, els quals permeten detectar relacions ocultes entre les dades. Aquesta capacitat ha estat explotada en treballs previs d'altres investigadors, on s'ha organitzat la memòria de casos del CBR amb SOM per tal de millorar la recuperació dels casos.La finalitat de la present tesi és donar un pas més enllà en la simple combinació del CBR i de SOM, de tal manera que aquí s'introdueixen les capacitats de Soft-Computing i de Knowledge Discovery de SOM en totes les fases del CBR per nodrir-les del nou coneixement descobert. A més a més, les mètriques de complexitat apareixen en aquest context com un instrument precís per modelar el funcionament de SOM segons la tipologia de les dades. L'assoliment d'aquesta integració es pot dividir principalment en quatre fites: (1) la definició d'una metodologia per determinar la millor manera de recuperar els casos tenint en compte la complexitat de les dades i els requeriments de l'usuari; (2) la millora de la fiabilitat de la proposta de solucions gràcies a les relacions entre els clústers i els casos; (3) la potenciació de les capacitats explicatives mitjançant la generació d'explicacions simbòliques; (4) el manteniment incremental i semi-supervisat de la memòria de casos organitzada per SOM.Tots aquests punts s'integren sota la plataforma SOMCBR, la qual és extensament avaluada sobre datasets provinents de l'UCI Repository i de dominis mèdics i telemàtics.Addicionalment, la tesi aborda de manera secundària dues línies de recerca fruït dels requeriments dels projectes on ha estat ubicada. D'una banda, s'aborda la definició de funcions de similitud específiques per definir com comparar un cas resolt amb un de nou mitjançant una variant de la Computació Evolutiva anomenada Evolució de Gramàtiques (GE). D'altra banda, s'estudia com definir esquemes de cooperació entre sistemes heterogenis per millorar la fiabilitat de la seva resposta conjunta mitjançant GE. Ambdues línies són integrades en dues plataformes, BRAIN i MGE respectivament, i són també avaluades amb els datasets anteriors. / El Razonamiento Basado en Casos (CBR) es un paradigma de aprendizaje basado en establecer analogías con problemas previamente resueltos para resolver otros nuevos. Por tanto, la organización, el acceso y la utilización del conocimiento previo son aspectos clave para tener éxito. No obstante, la mayoría de los problemas presentan grandes volúmenes de datos complejos, inciertos y con conocimiento aproximado y, por tanto, el rendimiento del CBR puede verse afectado debido a la complejidad de gestionarlos. Esto ha hecho que en los últimos años haya surgido una nueva línea de investigación llamada Soft-Computing and Intelligent Information Retrieval focalizada en mitigar estos efectos. Es aquí donde nace el contexto de esta tesis.Dentro del amplio abanico de técnicas Soft-Computing para tratar conocimiento complejo, los Mapas Autoorganizativos (SOM) destacan por encima del resto por su capacidad de agrupar los datos en patrones, los cuales permiten detectar relaciones ocultas entre los datos. Esta capacidad ha sido aprovechada en trabajos previos de otros investigadores, donde se ha organizado la memoria de casos del CBR con SOM para mejorar la recuperación de los casos.La finalidad de la presente tesis es dar un paso más en la simple combinación del CBR y de SOM, de tal manera que aquí se introducen las capacidades de Soft-Computing y de Knowledge Discovery de SOM en todas las fases del CBR para alimentarlas del conocimiento nuevo descubierto. Además, las métricas de complejidad aparecen en este contexto como un instrumento preciso para modelar el funcionamiento de SOM en función de la tipología de los datos. La consecución de esta integración se puede dividir principalmente en cuatro hitos: (1) la definición de una metodología para determinar la mejor manera de recuperar los casos teniendo en cuenta la complejidad de los datos y los requerimientos del usuario; (2) la mejora de la fiabilidad en la propuesta de soluciones gracias a las relaciones entre los clusters y los casos; (3) la potenciación de las capacidades explicativas mediante la generación de explicaciones simbólicas; (4) el mantenimiento incremental y semi-supervisado de la memoria de casos organizada por SOM. Todos estos puntos se integran en la plataforma SOMCBR, la cual es ampliamente evaluada sobre datasets procedentes del UCI Repository y de dominios médicos y telemáticos.Adicionalmente, la tesis aborda secundariamente dos líneas de investigación fruto de los requeri-mientos de los proyectos donde ha estado ubicada la tesis. Por un lado, se aborda la definición de funciones de similitud específicas para definir como comparar un caso resuelto con otro nuevo mediante una variante de la Computación Evolutiva denominada Evolución de Gramáticas (GE). Por otro lado, se estudia como definir esquemas de cooperación entre sistemas heterogéneos para mejorar la fiabilidad de su respuesta conjunta mediante GE. Ambas líneas son integradas en dos plataformas, BRAIN y MGE, las cuales también son evaluadas sobre los datasets anteriores. / Case-Based Reasoning (CBR) is an approach of machine learning based on solving new problems by identifying analogies with other previous solved problems. Thus, organization, access and management of this knowledge are crucial issues for achieving successful results. Nevertheless, the major part of real problems presents a huge amount of complex data, which also presents uncertain and partial knowledge. Therefore, CBR performance is influenced by the complex management of this knowledge. For this reason, a new research topic has appeared in the last years for tackling this problem: Soft-Computing and Intelligent Information Retrieval. This is the point where this thesis was born.Inside the wide variety of Soft-Computing techniques for managing complex data, the Self-Organizing Maps (SOM) highlight from the rest due to their capability for grouping data according to certain patterns using the relations hidden in data. This capability has been used in a wide range of works, where the CBR case memory has been organized with SOM for improving the case retrieval.The goal of this thesis is to take a step up in the simple combination of CBR and SOM. This thesis presents how to introduce the Soft-Computing and Knowledge Discovery capabilities of SOM inside all the steps of CBR to promote them with the discovered knowledge. Furthermore, complexity measures appear in this context as a mechanism to model the performance of SOM according to data topology. The achievement of this goal can be split in the next four points: (1) the definition of a methodology for setting up the best way of retrieving cases taking into account the data complexity and user requirements; (2) the improvement of the classification reliability through the relations between cases and clusters; (3) the promotion of the explaining capabilities by means of the generation of symbolic explanations; (4) the incremental and semi-supervised case-based maintenance. All these points are integrated in the SOMCBR framework, which has been widely tested in datasets from UCI Repository and from medical and telematic domains. Additionally, this thesis secondly tackles two additional research lines due to the requirements of a project in which it has been developed. First, the definition of similarity functions ad hoc a domain is analyzed using a variant of the Evolutionary Computation called Grammar Evolution (GE). Second, the definition of cooperation schemes between heterogeneous systems is also analyzed for improving the reliability from the point of view of GE. Both lines are developed in two frameworks, BRAIN and MGE respectively, which are also evaluated over the last explained datasets.
13

Facing-up Challenges of Multiobjective Clustering Based on Evolutionary Algorithms: Representations, Scalability and Retrieval Solutions

García Piquer, Álvaro 13 April 2012 (has links)
Aquesta tesi es centra en algorismes de clustering multiobjectiu, que estan basats en optimitzar varis objectius simultàniament obtenint una col•lecció de solucions potencials amb diferents compromisos entre objectius. El propòsit d'aquesta tesi consisteix en dissenyar i implementar un nou algorisme de clustering multiobjectiu basat en algorismes evolutius per afrontar tres reptes actuals relacionats amb aquest tipus de tècniques. El primer repte es centra en definir adequadament l'àrea de possibles solucions que s'explora per obtenir la millor solució i que depèn de la representació del coneixement. El segon repte consisteix en escalar el sistema dividint el conjunt de dades original en varis subconjunts per treballar amb menys dades en el procés de clustering. El tercer repte es basa en recuperar la solució més adequada tenint en compte la qualitat i la forma dels clusters a partir de la regió més interessant de la col•lecció de solucions ofertes per l’algorisme. / Esta tesis se centra en los algoritmos de clustering multiobjetivo, que están basados en optimizar varios objetivos simultáneamente obteniendo una colección de soluciones potenciales con diferentes compromisos entre objetivos. El propósito de esta tesis consiste en diseñar e implementar un nuevo algoritmo de clustering multiobjetivo basado en algoritmos evolutivos para afrontar tres retos actuales relacionados con este tipo de técnicas. El primer reto se centra en definir adecuadamente el área de posibles soluciones explorada para obtener la mejor solución y que depende de la representación del conocimiento. El segundo reto consiste en escalar el sistema dividiendo el conjunto de datos original en varios subconjuntos para trabajar con menos datos en el proceso de clustering El tercer reto se basa en recuperar la solución más adecuada según la calidad y la forma de los clusters a partir de la región más interesante de la colección de soluciones ofrecidas por el algoritmo. / This thesis is focused on multiobjective clustering algorithms, which are based on optimizing several objectives simultaneously obtaining a collection of potential solutions with different trade¬offs among objectives. The goal of the thesis is to design and implement a new multiobjective clustering technique based on evolutionary algorithms for facing up three current challenges related to these techniques. The first challenge is focused on successfully defining the area of possible solutions that is explored in order to find the best solution, and this depends on the knowledge representation. The second challenge tries to scale-up the system splitting the original data set into several data subsets in order to work with less data in the clustering process. The third challenge is addressed to the retrieval of the most suitable solution according to the quality and shape of the clusters from the most interesting region of the collection of solutions returned by the algorithm.
14

Modelatge multimodal de transicions en entorn microstrip

Pajares Vega, Francisco Javier 27 November 2007 (has links)
Avui dia cada vegada s'ha de tenir més en compte com es realitza el traçat de pistes en les plaques de circuit imprès (PCB). Això és degut a que cada vegada més hi viatgen senyals amb components freqüencials més elevades. Per tant, paràmetres com la desadaptació per impedància característica, acoblaments, ressonàncies i comportaments complexes de les transicions que es troben els senyals en la seva propagació per les pistes, han de ser considerats per evitar problemes d'integritat del senyal i garantir la compatibilitat electromagnètica (EMC) amb el seu entorn. El present treball de tesi s'ha centrat en l'estudi del comportament d'una situació particular, però molt habitual, de pistes: dues pistes sobre un pla de massa, formant el que es coneix com una línia de transmissió microstrip acoblada. Els senyals que viatgen a través d'una línia microstrip acoblada es poden descompondre en dos modes bàsics de propagació: mode comú (on la tensió està definida entre el pla de massa i cada pista) i el mode diferencial (on la tensió està definida entre les pistes). Aquesta descomposició és molt habitual en el món de la compatibilitat electromagnètica ja que les tècniques de filtratge de les interferències varien depenent si aquestes viatgen en mode comú o en mode diferencial. El treball desenvolupat s'ha focalitzat en l'estudi, des d'aquest punt de vista multimodal (que té en compte simultàniament tant el mode comú com el diferencial), de les diferents transicions que es pot trobar el senyal en la seva propagació degut al traçat de pistes. Com a resultat d'aquest estudi s'han obtingut uns models circuitals que permeten l'anàlisi i simulació dels diferents modes que intervenen i que han estat validats de forma experimental. Aquest fet ha permès l'ús d'aquests models en l'anàlisi de problemes d'integritat del senyal que són comuns en el entorn de la compatibilitat electromagnètica (EMC). Els resultats obtinguts han estat presentats en congressos nacionals i internacionals. / Hoy en día cada vez se debe tener más en cuenta como se realiza el trazado de pistas en las placas de circuito impreso (PCB). Esto es así debido a que cada vez más viajan por ellas señales con componentes frecuenciales más elevadas. Por lo tanto, parámetros como la desadaptación por impedancia característica, acoplamientos, resonancias y comportamientos complejos de las transiciones que se encuentran las señales mientras se propagan por las pistas, deben ser tenidos en consideración para evitar problemas de integridad de la señal y garantizar la compatibilidad electromagnética (EMC) con su entorno. En el presente trabajo de tesis se ha centrado en el estudio del comportamiento de una situación particular, pero habitual, de pistas: dos pistas sobre un plano de masa, formando lo que se conoce como línea de transmisión microstrip acoplada. Las señales que viajan a través de una línea microstrip acoplada se pueden descomponer en dos modos básicos de propagación: modo común (donde la tensión está definida entre el plano de masa y cada pista) y modo diferencial (donde la tensión está definida entre pistas). Esta descomposición es muy habitual en el mundo de la compatibilidad electromagnética ya que las técnicas de filtrado de las interferencias varían dependiendo si estas viajan en modo común o en modo diferencial. El trabajo desarrollado se ha focalizado en el estudio, desde este punto de vista multimodal (que tiene en cuenta simultáneamente tanto el modo común como el diferencial), de las diferentes transiciones que puede encontrarse la señal durante su propagación debido al trazado de pistas. Como resultado se han obtenido unos modelos circuitales que permiten el análisis y simulación de los diferentes modos que intervienen y que han sido validados de forma experimental. Este hecho ha permitido el uso de dichos modelos en el análisis de problemas de integridad de la señal que son comunes en el entorno de la compatibilidad electromagnética (EMC). Los resultados obtenidos han sido mostrados en congresos nacionales e internacionales. / Nowadays, the placement of the strips in a printed circuit board (PCB) has to be performed with increasing care, because of the rise of the spectral content of the signals propagating through the strips. Due to this fact, mismatches of the characteristic impedances, crosstalks, resonances and complex behavior of the transitions that the signals may encounter in their propagation have to be considered in order to avoid signal integrity problems and to guarantee the electromagnetic compatibility with their environment. This work is focused on the study of the behavior of a particular, but also a very common way of routing strips: two close strips above a ground plane, forming a extit{coupled microstrip transmission line}. The signals present at this transmission line can be decomposed into two basic signals known as common mode (where its voltage is defined between the ground plane and each strip) and differential mode (where its voltage is defined between the two strips). This decomposition is often found in electromagnetic compatibility because the different techniques of filtering interferences depend on their main mode of propagation. The study carried out in this thesis is focused on the analysis from a multimodal point of view of different transitions that signals encounter during their propagation in a coupled microstrip transmission line. As a result of this analysis, a number of circuit models for different transitions have been obtained and experimentally validated. These models have been used to successfully study signal integrity problems found in EMC and they have been presented in national and international symposiums.
15

Producción de un corpus oral y modelado prosódico para la síntesis del habla expresiva

Iriondo Sanz, Ignasi 18 June 2008 (has links)
Aquesta tesi aborda diferents aspectes relacionats amb la síntesi de la parla expressiva. Es parteix de l'experiència prèvia en sistemes de conversió de text a parla del Grup en Processament Multimodal (GPMM) d'Enginyeria i Arquitectura La Salle, amb l'objectiu de millorar la capacitat expressiva d'aquest tipus de sistemes. La parla expressiva transmet informació paralingüística com, per exemple, l'emoció del parlant, el seu estat d'ànim, una determinada intenció o aspectes relacionats amb l'entorn o amb el seu interlocutor. Els dos objectius principals de la present tesi consisteixen, d'una banda, en el desenvolupament d'un corpus oral expressiu i, d'una altra, en la proposta d'un sistema de modelatge i predicció de la prosòdia per a la seva utilització en l'àmbit de la síntesi expressiva del parla.En primer lloc, es requereix un corpus oral adequat per a la generació d'alguns dels mòduls que componen un sistema de síntesi del parla expressiva. La falta de disponibilitat d'un recurs d'aquest tipus va motivar el desenvolupament d'un nou corpus. A partir de l'estudi dels procediments d'obtenció de parla emocionada o expressiva i de l'experiència prèvia del grup, es planteja el disseny, l'enregistrament, l'etiquetatge i la validació del nou corpus. El principal objectiu consisteix a aconseguir una elevada qualitat del senyal i una cobertura fonètica suficient (segmental i prosòdica), sense renunciar a l'autenticitat des del punt de vista de l'expressivitat oral. El corpus desenvolupat té una durada de més de cinc hores i conté cinc estils expressius: neutre, alegre, sensual, agressiu i trist. En tractar-se de parla expressiva obtinguda mitjançant la lectura de textos semànticament relacionats amb els estils definits, s'ha requerit un procés de validació que garanteixi que les locucions que formen el corpus incorporin el contingut expressiu desitjat. L'avaluació exhaustiva de tots els enunciats del corpus seria excessivament costosa en un corpus de gran grandària. D'altra banda, no existeix suficient coneixement científic per a emular completament la percepció subjectiva mitjançant tècniques automàtiques que permetin una validació exhaustiva i fiable dels corpus orals. En el present treball s'ha proposat un mètode que suposa un avanç cap a una solució pràctica i eficient d'aquest problema, mitjançant la combinació d'una avaluació subjectiva amb tècniques d'identificació automàtica de l'emoció en el parla. El mètode proposat s'utilitza per a portar a terme una revisió automàtica de l'expressivitat del corpus desenvolupat. Finalment, una prova subjectiva ha permès validar el correcte funcionament d'aquest procés automàtic. En segon lloc i, sobre la base dels coneixements actuals, de l'experiència adquirida i dels reptes que es desitjaven abordar, s'ha desenvolupat un sistema d'estimació de la prosòdia basat en corpus. Tal sistema es caracteritza per modelar de forma conjunta les funcions lingüística i paralingüística de la prosòdia a partir de l'extracció automàtica d'atributs prosòdics del text, que constitueixen l'entrada d'un sistema d'aprenentatge automàtic que prediu els trets prosòdics modelats prèviament. El sistema de modelatge prosòdic presentat en aquest treball es fonamenta en el raonament basat en casos, que es tracta d'una tècnica d'aprenentatge automàtic per analogia. Per a l'ajustament d'alguns paràmetres del sistema desenvolupat i per a la seva avaluació s'han utilitzat mesures objectives de l'error i de la correlació calculades en les locucions del conjunt de prova. Atès que les mesures objectives sempre es refereixen a casos concrets, no aporten informació sobre el grau d'acceptació que tindrà la parla sintetitzada en els oïdors. Per tant, s'han portat a terme una sèrie de proves de percepció en les quals un conjunt d'avaluadors ha puntuat un grup d'estímuls en cada estil. Finalment, s'han analitzat els resultats per a cada estil i s'han comparat amb les mesures objectives obtingudes, el que ha permès extreure algunes conclusions sobre la rellevància dels trets prosòdics en la parla expressiva, així com constatar que els resultats generats pel mòdul prosòdic han tingut una bona acceptació, encara que s'han produït diferències segons l'estil. / Esta tesis aborda diferentes aspectos relacionados con la síntesis del habla expresiva. Se parte de la experiencia previa en sistemas de conversión de texto en habla del Grup en Processament Multimodal (GPMM) de Enginyeria i Arquitectura La Salle, con el objetivo de mejorar la capacidad expresiva de este tipo de sistemas. El habla expresiva transmite información paralingüística como, por ejemplo, la emoción del hablante, su estado de ánimo, una determinada intención o aspectos relacionados con el entorno o con su interlocutor. Los dos objetivos principales de la presente tesis consisten, por una parte, en el desarrollo de un corpus oral expresivo y, por otra, en la propuesta de un sistema de modelado y predicción de la prosodia para su utilización en el ámbito de la síntesis expresiva del habla. En primer lugar, se requiere un corpus oral adecuado para la generación de algunos de los módulos que componen un sistema de síntesis del habla expresiva. La falta de disponibilidad de un recurso de este tipo motivó el desarrollo de un nuevo corpus. A partir del estudio de los procedimientos de obtención de habla emocionada o expresiva y de la experiencia previa del grupo, se plantea el diseño, la grabación, el etiquetado y la validación del nuevo corpus. El principal objetivo consiste en conseguir una elevada calidad de la señal y una cobertura fonética suficiente (segmental y prosódica), sin renunciar a la autenticidad desde el punto de vista de la expresividad oral. El corpus desarrollado tiene una duración de más de cinco horas y contiene cinco estilos expresivos: neutro, alegre, sensual, agresivo y triste. Al tratarse de habla expresiva obtenida mediante la lectura de textos semánticamente relacionados con los estilos definidos, se ha requerido un proceso de validación que garantice que las locuciones que forman el corpus incorporen el contenido expresivo deseado. La evaluación exhaustiva de todos los enunciados del corpus sería excesivamente costosa en un corpus de gran tamaño. Por otro lado, no existe suficiente conocimiento científico para emular completamente la percepción subjetiva mediante técnicas automáticas que permitan una validación exhaustiva y fiable de los corpus orales. En el presente trabajo se ha propuesto un método que supone un avance hacia una solución práctica y eficiente de este problema, mediante la combinación de una evaluación subjetiva con técnicas de identificación automática de la emoción en el habla. El método propuesto se utiliza para llevar a cabo una revisión automática de la expresividad del corpus desarrollado. Finalmente, una prueba subjetiva con oyentes ha permitido validar el correcto funcionamiento de este proceso automático.En segundo lugar y, sobre la base de los conocimientos actuales, a la experiencia adquirida y a los retos que se deseaban abordar, se ha desarrollado un sistema de estimación de la prosodia basado en corpus. Tal sistema se caracteriza por modelar de forma conjunta las funciones lingüística y paralingüística de la prosodia a partir de la extracción automática de atributos prosódicos del texto, que constituyen la entrada de un sistema de aprendizaje automático que predice los rasgos prosódicos modelados previamente. El sistema de modelado prosódico presentado en este trabajo se fundamenta en el razonamiento basado en casos que se trata de una técnica de aprendizaje automático por analogía. Para el ajuste de algunos parámetros del sistema desarrollado y para su evaluación se han utilizado medidas objetivas del error y de la correlación calculadas en las locuciones del conjunto de prueba. Dado que las medidas objetivas siempre se refieren a casos concretos, no aportan información sobre el grado de aceptación que tendrá el habla sintetizada en los oyentes. Por lo tanto, se han llevado a cabo una serie de pruebas de percepción en las que un conjunto de oyentes ha puntuado un grupo de estímulos en cada estilo. Finalmente, se han analizado los resultados para cada estilo y se han comparado con las medidas objetivas obtenidas, lo que ha permitido extraer algunas conclusiones sobre la relevancia de los rasgos prosódicos en el habla expresiva, así como constatar que los resultados generados por el módulo prosódico han tenido una buena aceptación, aunque se han producido diferencias según el estilo. / This thesis deals with different aspects related to expressive speech synthesis (ESS). Based on the previous experience in text-to-speech (TTS) systems of the Grup en Processament Multimodal (GPMM) of Enginyeria i Arquitectura La Salle, its main aim is to improve the expressive capabilities of such systems. The expressive speech transmits paralinguistic information as, for example, the emotion of the speaker, his/her mood, a certain intention or aspects related to the environment or to his/her conversational partner. The present thesis tackles two main objectives: on the one hand, the development of an expressive speech corpus and, on the other, the modelling and the prediction of prosody from text for their use in the ESS framework. First, an ESS system requires a speech corpus suitable for the development and the performance of some of its modules. The unavailability of a resource of this kind motivated the development of a new corpus. Based on the study of the strategies to obtain expressive speech and the previous experience of the group, the different tasks have been defined: design, recording, segmentation, tagging and validation. The main objective is to achieve a high quality speech signal and sufficient phonetic coverage (segmental and prosodic), preserving the authenticity from the point of view of the oral expressiveness. The recorded corpus has 4638 sentences and it is 5 h 12 min long; it contains five expressive styles: neutral, happy, sensual, aggressive and sad. Expressive speech has been obtained by means of the reading of texts semantically related to the defined styles. Therefore, a validation process has been required in order to guarantee that recorded utterances incorporate the desired expressive content. A comprehensive assessment of the whole corpus would be too costly. Moreover, there is insufficient scientific knowledge to completely emulate the subjective perception through automated techniques that yield a reliable validation of speech corpora. In this thesis, we propose an approach that supposes a step towards a practical solution to this problem, by combining subjective evaluation with techniques for the automatic identification of emotion in speech. The proposed method is used to perform an automatic review of the expressiveness of the corpus developed. Finally, a subjective test has allowed listeners to validate this automatic process.Second, based on our current experience and the proposed challenges, a corpus-based system for prosody estimation has been developed. This system is characterized by modelling both the linguistic and the paralinguistic functions of prosody. A set of prosodic attributes is automatically extracted from text. This information is the input to an automatic learning system that predicts the prosodic features modelled previously by a supervised training. The root mean squared error and the correlation coefficient have been used in both the adjustment of some system parameters and the objective evaluation. However, these measures are referred to specific utterances delivered by the speaker in the recording session, and then they do not provide information about the degree of acceptance of synthesized speech in listeners. Therefore, we have conducted different perception tests in which a group of listeners has scored a set of stimuli in each expressive style. Finally, the results for each style have been analyzed and compared with the objective measures, which has allowed to draw some conclusions about the relevance of prosodic features in expressive speech, as well as to verify that the results generated by the prosodic module have had a good acceptance, although with differences as a function of the style.
16

Caracterización multimodal de filtros de red y equipos electrónicos

Pérez Jiménez, Antonio 18 July 2008 (has links)
Un dels problemes més importants en la Compatibilitat Electromagnètica és el control de les interferències emeses i/o rebudes per un equip electrònic a través dels seus terminals d'alimentació monofàsica. Aquestes interferències es classifiquen en mode comú i mode diferencial. La manera més usual de mitigar-les és mitjançant la utilització de filtres de xarxa. Els mètodes actuals de disseny de filtres de xarxa tracten la mitigació d'aquest tipus d'interferències per separat: no tenen en compte que ambdós tipus de senyals (mode comú i diferencial) interaccionen entre sí i es transfereixen energia en qualsevol tipus d'asimetria originada pels equips electrònics o pels mateixos filtres. Aquest fet produeix freqüentment situacions inesperades: inefectivitat dels filtres de xarxa, aparició d'interferències en mode comú o diferencial inexplicables per la topologia dels circuits, selectivitat en freqüència del filtratge de les interferències, processos de radiació, etc. Aquest tipus de situacions poden ser analitzades i corregides a partir d'un anàlisi multimodal, que tingui en compte simultàniament el mode comú i el diferencial, i la seva interacció. El treball exposat aquí pretén:- Desenvolupar sistemes de mesura multimodal per a equips electrònics i filtres de xarxa. Aquests sistemes han de tenir en compte tant el mode comú, com el diferencial, com la seva interacció, i han de millorar les prestacions dels sistemes de mesura normatius actuals.- Trobar models equivalents des d'un punt de vista multimodal (tenint en compte simultàniament el mode comú, el diferencial i la seva interacció) tant d'equips electrònics com de filtres de xarxa.- Desenvolupar una metodologia de predicció de les interferències conduïdes que l'equip electrònic subministra a la xarxa elèctrica a través del filtre de xarxa al qual es troba connectat a partir dels models multimodals equivalents proposats per a ambdós dispositius.PARAULES CLAU: Compatibilitat electromagnètica, filtre de xarxa, equip electrònic, circuit equivalent, emissió conduïda, mode comú, mode diferencial, impedància d'entrada, paràmetres S. / Uno de los problemas más importantes en Compatibilidad Electromagnética es el control de las interferencias emitidas y/o recibidas por un equipo electrónico a través de sus terminales de alimentación monofásica. Estas interferencias se clasifican en modo común y modo diferencial. La manera más usual de mitigarlas es mediante el empleo de filtros de red. Los métodos actuales de diseño de filtros de red abordan la mitigación de este tipo de interferencias por separado: no tienen en cuenta que ambos tipos de señales (modo común y diferencial) interaccionan entre sí y se transfieren energía en cualquier tipo de asimetría originada por los equipos electrónicos o por los mismos filtros. Este hecho produce frecuentemente situaciones inesperadas: inefectividad de los filtros de red, aparición de interferencias en modo común o diferencial inexplicables por la topología de los circuitos, selectividad en frecuencia del filtrado de las interferencias, procesos de radiación, etc. Este tipo de situaciones pueden ser analizadas y corregidas a partir de un análisis multimodal, que tenga en cuenta simultáneamente el modo común y el diferencial, y su interacción. El trabajo aquí expuesto pretende:- Desarrollar sistemas de medida multimodal para equipos electrónicos y filtros de red. Dichos sistemas deben tener en cuenta tanto el modo común, como el diferencial, como su interacción, y deben mejorar las prestaciones de los sistemas de medida normativos actuales.- Hallar modelos equivalentes desde un punto de vista multimodal (teniendo en cuenta simultáneamente el modo común, el diferencial y su interacción) tanto de equipos electrónicos como de filtros de red.- Desarrollar una metodología de predicción de las interferencias conducidas que el equipo electrónico suministra a la red eléctrica a través del filtro de red al cual está conectado a partir de los modelos multimodales equivalentes propuestos para ambos dispositivos.PALABRAS CLAVE: Compatibilidad electromagnética, filtro de red, equipo electrónico, circuito equivalente, emisión conducida, modo común, modo diferencial, impedancia de entrada, parámetros S. / One of the most important problems in EMC is the control of the common and differential mode interferences emitted or received by an electronic device through its single phase power-line cable. These interferences are mitigated using power-line filters. The present power-line filter methodologies treat separately the mitigation of this kind of interferences: they do not take into account that both modes interact and exchange energy at any kind of asymmetry originated by the devices connected to the power-line, or by the power-line filters themselves. This fact leads to unexpected situations: power-line filter infectivity, appearance of common and differential mode interferences not accountable by the circuit topology, frequency selectivity of the interferences, radiation processes, etc. This kind of situations can be analyzed and corrected using multimodal analysis, which takes into account at the same time the common mode, the differential mode and their interaction. This project aims to:- Develop accurate multimodal measurement systems for both electronic devices and power-line network filters. They have to consider the common and differential modes, and their interaction, and have to improve the features of present normative measurement systems. - Derive equivalent models from a multimodal point of view (taking into account simultaneously the common mode, the differential mode and their interaction) for both electronic devices and power-line filters.- Develop a methodology for predicting the level of conducted emissions that an electronic device supplies to the power-line network through the power-line filter to which it is connected, using the equivalent multimodal models proposed for both devices.KEYWORDS: Electromagnetic compatibility, power-line filter, electronic device, equivalent circuit, conducted emissions, common mode, differential mode, input impedance, S parameters.
17

Modelatge multimodal de transicions i asimetries en línies three-line-microstrip

Rodríguez Cepeda, Juan Pablo 07 April 2010 (has links)
Una línia de transmissió three-line-microstrip consisteix en tres pistes paral·leles practicades sobre la cara d'un dielèctric amb un pla de massa inferior. La propagació en aquesta línia es pot descriure en termes de tres modes fonamentals anomenats ee, oo i oe. Tot i que aquests modes són ortogonals interaccionen entre sí a qualsevol transició, discontinuïtat o asimetria. En el pla d'una transició o asimetria es genera un intercanvi d'energia o conversió modal en el que prenen part tots els modes.En aquest treball s'analitza la conversió modal que s'origina en un conjunt de transicions i asimetries construïdes sobre línies three-line-microstrip. L'estudi es realitza aplicant la tècnica de l'anàlisi multimodal. L'ús d'aquesta tècnica permet la deducció d'una sèrie de models multimodals (un per a cada transició) que proporcionen una anàlisi simple, rigorosa i quantitativa d'aquest fenomen.La validesa d'aquest estudi es verifica de manera experimental. Els bons resultats obtinguts demostren que els models multimodals proposats prediuen de manera precisa el comportament de les transicions. Aquest fet permet el seu ús per analitzar circuits o estructures constituïts per trams de tres pistes acoblades. En el cas d'aquesta tesi, han estat aplicats als camps de l'EMC i de les microones. Pel que fa a l'EMC, s'ha realitzat un estudi de l'acoblament i la integritat del senyal en configuracions de PCB amb trams de tres pistes acoblades. Aquest estudi ha permès identificar les transicions i asimetries en aquests circuits com a possibles fonts d'interferència i de degradació dels senyals ja que la conversió modal es pot interpretar com a un procés d'interferència que involucra tots els senyals presents. Pel que fa a les microones, s'ha realitzat una anàlisi multimodal de filtres spurline. Aquesta anàlisi ha permès desenvolupar dues noves estructures, la principal característica de les quals és la seva compacitat que, a diferència d'altres estructures similars, s'aconsegueix permetent la presència d'un nou mode en el procés de ressonància. L'ús dels models multimodals per a l'anàlisi d'aquestes estructures ha permès una interpretació clara i senzilla del seu funcionament així com el desenvolupament d'una sèrie de regles de disseny que permeten un ajust fàcil i ràpid de certs paràmetres dels filtres com ara la freqüència central i l'ample de banda. / Una línea de transmisión three-line-microstrip consiste en tres pistas paralelas practicadas sobre la cara de un dieléctrico con un plano de masa inferior. La propagación en esta línea se puede describir en términos de tres modos fundamentales llamados ee, oo i oe. Aunque estos modos son ortogonales interaccionan entre se en cualquier transición, discontinuidad o asimetría. En el plano de una transición o asimetría se genera un intercambio de energía o conversión modal en el que toman parte todos los modos.En este trabajo se analiza la conversión modal que se origina en un conjunto de transiciones i asimetrías construidas sobre líneas three-line-microstrip. El estudio se realiza aplicando la técnica del análisis multimodal. El uso de esta técnica permite la deducción de una serie de modelos multimodales (un per a cada transición) que proporcionan un análisis simple, riguroso i cuantitativo de este fenómeno.La validez de este estudio se verifica de manera experimental. Los buenos resultados obtenidos demuestran que los modelos multimodales propuestos predicen de manera precisa el comportamiento de las transiciones. Este hecho permite su uso para analizar circuitos o estructuras constituidos por tramos de tres pistas acopladas. En esta tesis doctoral, han sido aplicados a los campos de la EMC i de las microondas. En el primero de ellos, se ha realizado un estudio del acoplamiento y la integridad de la señal en configuraciones de PCB con tramos de tres pistas acopladas. Este estudio ha permitido identificar las transiciones y asimetrías en estos circuitos como posibles fuentes de interferencia y de degradación de las señales ya que la conversión modal se puede interpretar como a un proceso de interferencia que involucra todas las señales presentes. En el campo de las microondas, se ha realizado un análisis multimodal de filtros spurline. Este análisis ha permitido desarrollar dos nuevas estructuras, cuya principal característica es su compacidad que, a diferencia de otras estructuras similares, se consigue permitiendo la presencia de un nuevo modo en el proceso de resonancia. El uso de los modelos multimodales para el análisis de estas estructuras ha permitido una interpretación clara i sencilla del su funcionamiento así como el desarrollo de una serie de reglas de diseño que permiten un ajuste fácil i rápido de ciertos parámetros de los filtros como por ejemplo la frecuencia central y el ancho de banda. / A three-line-microstrip transmission line consists of three parallel coupled strips printed on a grounded dielectric substrate. The propagation in this line can be described in terms of three fundamental modes, namely the ee, oo and oe modes. These modes are orthogonal and propagate independently unless a transition or asymmetry is present in the line. Any transition or asymmetry will generate an energy exchange or modal interaction among all the propagating modes. In this work, the modal interaction of a set of transitions and asymmetries in three-line-microstrip transmission lines is analyzed. The study is carried out by using the multimodal analysis. By means of this technique a set of multimodal circuit models (one for each transition) is derived. These models provide a simple and a quantitative interpretation of the modal interaction.The proposed multimodal analysis is experimentally validated. The obtained results show that the derived multimodal models accurately predict the behavior of the transitions. Due to this fact, they can be used for the analysis of circuits and structures composed of three-coupled-strip sections. In this work, the models have been applied to both the EMC and microwave fields. In the former, they have been employed to study the cross-talk and signal-integrity problems in PCB configurations involving tree-coupled-trace sections. The performed analysis has shown that transitions and asymmetries in these circuits must be considered as a source of interference and signal degradation since the modal interaction can be interpreted as an interference process that involves all the present signals. In the latter, a multimodal analysis of spurline filters has been performed. This study has allowed the derivation of two new filter structures whose main feature is their compactness, which, in contrast to other analogous filters, is achieved by allowing the presence of an additional mode in the resonance process. The use of the multimodal models for the analysis of these structures has permitted both a simple interpretation of the filter operation and the derivation of a set of design rules which allows a rapid fine tuning of some filter parameters such as the center frequency and the bandwidth.
18

Creixement de nanoestructures plamòniques mitjançant la deposició induïda per un feix d'electrons focalitzat

Graells Castellà, Simó 22 July 2009 (has links)
L'enginyeria de les propietats plasmòniques de les nanoestructures metàl·liques requereix un control acurat de les seves formes i distribució. Això normalment s'aconsegueix amb l'ús de la litografia per feix d'electrons sobre polímers electro-sensibles combinat amb la deposició de capes fines de metall i el lift-off. La deposició directa i localitzada de metalls induïda per un feix d'electrons (FEBID per Focused Electron Beam Induced Deposition) és un mètode alternatiu querecentment ha rebut un interès creixent en microelectrònica però encara no ha despertat massa atenció dins la comunitat d'òptica. L'FEBID és el resultat de la descomposició local, per un feixd'electrons focalitzat, de les molècules d'un precursor adsorbides sobre una superfície. Aquesta s'ha aplicat majoritàriament en la escriptura directa de contactes o per a la reparació de circuits, però amb l'ús de metalls nobles podria aprofitar-se per a l'òptica de plasmons.En aquesta tesi es demostra l'ús de l'FEBID per a fabricar nanoestructures d'or per a aplicacions d'òptica de plasmons. S'investiguen els efectes del material del substrat i dels paràmetres de deposició, com ara el corrent del feix i la pressió de vapor d'aigua, sobre el ritme de creixement i la puresa de l'or. S'ha emprat un recuit ex situ de la mostra com a mètode de millora de la puresa. Les mesures òptiques de dispersió sobre les estructures purificades evidencien que suporten plasmons de superfície localitzats. Aquest mètode de fabricació permet el creixement d'estructures plasmòniques amb una elevada relació d'aspecte i ha de facilitar l'escriptura en superfícies no planes com l'extremitat d'una sonda de rastreig allargada. / La ingeniería de las propiedades plasmónicas de las nanoestructuras metálicas requiere un control preciso de sus formas y distribución. Esto normalmente se consigue con el uso de la litografía por haz de electrones sobre polímeros electro-sensibles combinado con la deposición de capas finas de metal y el lift-off. La deposición directa y localizada de metales inducida por un haz de electrones (FEBID por Focused Electron Beam Induced Deposition) es un método alternativo que recientemente ha despertado un interés creciente en microelectrónica pero todavía no ha recibido demasiada atención dentro de la comunidad de óptica. La FEBID es el resultado de la descomposición local, por un haz de electrones focalizado, de las moléculas de un precursor adsorbidas sobre una superficie. Esta se ha aplicado mayoritariamente en la escritura directa de contactos o para la reparación de circuitos, pero con el uso de metales nobles podría ser aprovechada para la óptica de plasmones.En esta tesis se demuestra el uso de la FEBID para fabricar nanoestructuras de oro para aplicaciones de óptica de plasmones. Se investigan los efectos del material del sustrato y de los parámetros de deposición, como la corriente del haz y la presión de vapor de agua, sobre el ritmo de crecimiento y la pureza del oro. Se ha utilizado un recocido ex situ de la muestracomo método de mejora de la pureza. Las medidas ópticas de dispersión sobre las estructuras purificadas evidencian que soportan plasmones de superficie localizados. Este método de fabricación permite el crecimiento de estructuras plasmónicas con una elevada relación de aspecto y tiene que facilitar la escritura en superficies no planas como la extremidad de una sonda de rastreo alargada. / Engineering the plasmon properties of metal nanostructures requires an accurate control on their shapes and distribution. This is conventionally achieved by using electron-beam lithography on electro-sensitive polymers combined with thin-metal-film deposition and lift-off. Direct local deposition of metals induced by a focused electron beam (FEBID for Focused ElectronBeam Induced Deposition) is an alternative method that has been receiving a growing interest in microelectronics but it has not yet received much attention in the optical community. The FEBID is the result of the local decomposition, by a focused electron beam, of precursor molecules adsorbed on a surface. It has mostly been applied to direct-contact writing or to circuit reparation, but can be applied advantageously to plasmon optics when involving noble metals.In this thesis the use of the FEBID to fabricate gold nanostructures for plasmon optics applications is demonstrated. The effects of the substrate material and the deposition parameters, such as beam current and water vapor pressure, on both the deposition rate and the gold purity are investigated. Ex-situ annealing of the sample is used as a purity improvement method. Scattering optical measurements on the purified structures evidence that they support localized surface plasmon resonances. This fabrication method enables to grow high aspect ratio plasmonic structures and to render much easier nano-patterning on non-flat surfaces such as the extremity of an elongated scanning probe.
19

Electric-Device Characterization for Interference Prediction and Mitigation by an Optimal Filtering Design

Sánchez Delgado, Albert Miquel 01 July 2010 (has links)
Les interferències de mode comú i diferencial que es propaguen en un cable de la xarxa elèctrica monofàsica s'acostumen a suprimir utilitzant els filtres de xarxa. Aquesta classe de filtres estan formats per xocs de mode comú, condensadors X i condensadors Y per a mitigar tant el mode comú com el mode diferencial. Tot i això, les metodologies actuals de disseny de filtres de xarxa presenten alguns inconvenients: els filtres es dissenyen per treballar en un entorn ideal amb impedàncies de 50 Ω i les atenuacions del mode comú i del mode diferencial s'analitzen de manera independent, sense considerar la conversió modal que es produeixen en les asimetries presents a la xarxa elèctrica, al dispositiu elèctric o al mateix filtre de xarxa. Aquests fets impliquen que les prediccions del comportament del filtre siguin inexactes i, conseqüentment, el filtre més adequat en una situació particular s'acaba majoritàriament escollint mitjançant la prova i error en llargues i costoses sessions de mesura. Per tal de millorar aquesta situació, aquest treball presenta:- Nous sistemes de mesura i caracterització per modelar completament el comportament dels filtres de xarxa, xarxa elèctrica i dispositius elèctrics. Amb aquesta finalitat, s'introdueix una nova metodologia de caracterització: la caracterització modal, que confina el mode comú i el mode diferencial en ports diferents, proporcionant així informació sobre la propagació de la interferència modal. Aquesta informació pot ser d'utilitat a l'hora de seleccionar el filtre de xarxa adient.- Una nova metodologia per a predir amb exactitud el nivell de les emissions conduïdes que un dispositiu elèctric introdueix a la xarxa elèctrica a través del filtre de xarxa. Aquesta metodologia està basada en les metodologies de caracterització presentades anteriorment. Caracteritzacions acurades permetran obtenir prediccions similars a les emissions conduïdes reals, evitant així llargues sessions de mesura.- Noves metodologies de disseny de filtres de xarxa per aconseguir implementacions òptimes i de baix cost. En una primera proposta, els components dels filtres de xarxa (condensadors i xocs) es caracteritzen modalment per trobar la combinació que obté el filtratge desitjat amb el mínim nombre de components. Aquesta metodologia és millorada posteriorment utilitzant filtres de xarxa asimètrics, obtenint així un filtratge òptim del mode comú i del mode diferencial.Tots els sistemes de mesura, així com les metodologies de caracterització, predicció i disseny, han estat provats amb èxit sobre equips reals. / Las interferencias de modo común y diferencial que se propagan en un cable de la red eléctrica monofásica se acostumbran a suprimir utilizando los filtros de red. Esta clase de filtros están formatos por choques de modo común, condensadores X y condensadores Y para mitigar tanto el modo común como el modo diferencial. Aún así, las metodologías actuales de diseño de filtros de red presentan algunos inconvenientes: los filtros se diseñan para trabajar en un entorno ideal con impedancias de 50 Ω y las atenuaciones del modo común y del modo diferencial se analizan de manera independiente, sin considerar la conversión modal que se producen en las asimetrías presentes en la red eléctrica, en el dispositivo eléctrico o en el mismo filtro de red. Estos hechos implican que las predicciones del comportamiento del filtro sean inexactas y, consecuentemente, el filtro más adecuado en una situación particular se acaba escogiendo mayoritariamente mediante la prueba y error en largas y costosas sesiones de medida. Para mejorar esta situación, este trabajo presenta:- Nuevos sistemas de medida y caracterización para modelar completamente el comportamiento de los filtros de red, red eléctrica y dispositivos eléctricos. Con este objetivo, se introduce una nueva metodología de caracterización: la caracterización modal, que confina el modo común y el modo diferencial en puertos diferentes, proporcionando así información sobre la propagación de la interferencia modal. Esta información puede ser de utilidad a la hora de seleccionar el filtro de red adecuado. - Una nueva metodología para predecir con exactitud el nivel de las emisiones conducidas que un dispositivo eléctrico introduce en la red eléctrica a través del filtro de red. Esta metodología está basada en las metodologías de caracterización presentadas anteriormente. Caracterizaciones precisas permitirán obtener predicciones similares a las emisiones conducidas reales, evitando así largas sesiones de medida. - Nuevas metodologías de diseño de filtros de red para conseguir implementaciones óptimas y de bajo coste. En una primera propuesta, los componentes de los filtros de red (condensadores y choques) se caracterizan modalmente para encontrar la combinación que obtiene el filtraje deseado con el mínimo número de componentes. Esta metodología es mejorada posteriormente utilizando filtros de red asimétricos, obteniendo así un filtraje óptimo del modo común y del modo diferencial. Todos los sistemas de medida, así como las metodologías de caracterización, predicción y diseño, han sido probados con éxito sobre equipos reales. / The common mode and differential mode interference propagated through the single-phase power-line cable is usually suppressed with power-line filters. This kind of filters is composed by common-mode chokes, X capacitors and Y capacitors to mitigate both the common mode and the differential mode. However, the present-day power-line filter design methodologies present some disadvantages: they are designed to be placed in an ideal 50-Ω system and the common mode and differential mode attenuations are analyzed independently, without considering the mode conversion that can be produced by asymmetries in the power-line filter, in the power-line network or in the electric device. These facts lead to inaccurate predictions of the power-line filter behavior and, consequently, the suitable filter is usually selected by trial and error in long and expensive measurement sessions. In order to improve this situation, this work presents:- New measurement systems and characterization methodologies to completely model the behavior of power-line filters, power-line networks and electric devices. To this end, a new characterization methodology is presented: the modal characterization, which confines the common mode and the differential mode into a different port and provides the information about the propagation of the modal interference, information that can be useful to select the suitable filter for its mitigation.- A new methodology to accurately predict the level of conducted emissions that an electric device supplies to the power-line network through its power-line filter, based on the measurement systems and characterization methodologies presented before. Accurate characterizations will allow predictions similar to the actual conducted emissions, avoiding long measurement sessions.- New design methodologies of power-line filters to achieve optimal and low cost implementations. In a first proposal, the components of the power-line filters are modally characterized to find, by computation, the combination that gets the desired filtering response with the minimum number of components. This methodology is further improved by using asymmetric power-line filters, obtaining an optimal mitigation of the common and differential mode.All measurement systems, as well as characterization, prediction and designing methodologies, have been successfully tested on actual devices.
20

Modelado de la cualidad de la voz para la síntesis del habla expresiva

Monzo Sánchez, Carlos Manuel 14 July 2010 (has links)
Aquesta tesi es realitza dins del marc de treball existent en el grup d'investigació Grup de Recerca en Tecnologies Mèdia (GTM) d'Enginyeria i Arquitectura La Salle, amb l'objectiu de dotar de major naturalitat a la interacció home-màquina. Per això ens basem en les limitacions de la tecnologia emprada fins al moment, detectant punts de millora en els que poder aportar solucions. Donat que la naturalitat de la parla està íntimament relacionada amb l'expressivitat que aquesta pot transmetre, aquests punts de millora es centren en la capacitat de treballar amb emocions o estils de parla expressius en general.L'objectiu últim d'aquesta tesi és la generació d'estils de parla expressius en l'àmbit de sistemes de Conversió de Text a Parla (CTP) orientats a la Síntesi de la Parla Expressiva (SPE), essent possible transmetre un missatge oral amb una certa expressivitat que l'oient sigui capaç de percebre i interpretar correctament. No obstant, aquest objectiu implica diferents metes intermitges: conèixer les opcions de parametrització existents, entendre cadascun dels paràmetres, detectar els pros i contres de la seva utilització, descobrir les relacions existents entre ells i els estils de parla expressius i, finalment, portar a terme la síntesi de la parla expressiva. Donat això, el propi procés de síntesi implica un treball previ en reconeixement d'emocions, que en si mateix podria ser una línia complerta d'investigació, ja que aporta el coneixement necessari per extreure models que poden ser usats durant el procés de síntesi.La cerca de l'increment de la naturalitat ha implicat una millor caracterització de la parla emocional o expressiva, raó per la qual s'ha investigat en parametritzacions que poguessin portar a terme aquesta comesa. Aquests són els paràmetres de Qualitat de la Veu Voice Quality (VoQ), que presenten com a característica principal que són capaços de caracteritzar individualment la parla, identificant cadascun dels factors que fan que sigui única. Els beneficis potencials, que aquest tipus de parametrització pot aportar a la interacció natural, són de dos classes: el reconeixement i la síntesi d'estils de parla expressius. La proposta de la parametrització de VoQ no pretén substituir a la ja emprada prosòdia, sinó tot el contrari, treballar conjuntament amb ella per tal de millorar els resultats obtinguts fins al moment.Un cop realitzada la selecció de paràmetres es planteja el modelat de la VoQ, és a dir la metodologia d'anàlisi i de modificació, de forma que cadascun d'ells pugui ser extret a partir de la senyal de veu i posteriorment modificat durant la síntesi. Així mateix, es proposen variacions pels paràmetres implicats i tradicionalment utilitzats, adaptant la seva definició al context de la parla expressiva. A partir d'aquí es passa a treballar en les relacions existents amb els estils de parla expressius, presentant finalment la metodologia de transformació d'aquests últims, mitjançant la modificació conjunta de la VoQ y la prosòdia, per a la SPE en un sistema de CTP. / Esta tesis se realiza dentro del marco de trabajo existente en el grupo de investigación Grup de Recerca en Tecnologies Mèdia (GTM) de Enginyeria i Arquitectura La Salle, con el objetivo de dotar de mayor naturalidad a la interacción hombre-máquina. Para ello nos basamos en las limitaciones de la tecnología empleada hasta el momento, detectando puntos de mejora en los que poder aportar soluciones. Debido a que la naturalidad del habla está íntimamente relacionada con la expresividad que esta puede transmitir, estos puntos de mejora se centran en la capacidad de trabajar con emociones o estilos de habla expresivos en general.El objetivo último de esta tesis es la generación de estilos de habla expresivos en el ámbito de sistemas de Conversión de Texto en Habla (CTH) orientados a la Síntesis del Habla Expresiva (SHE), siendo posible transmitir un mensaje oral con una cierta expresividad que el oyente sea capaz de percibir e interpretar correctamente. No obstante, este objetivo implica diferentes metas intermedias: conocer las opciones de parametrización existentes, entender cada uno de los parámetros, detectar los pros y contras de su utilización, descubrir las relaciones existentes entre ellos y los estilos de habla expresivos y, finalmente, llevar a cabo la síntesis del habla expresiva. El propio proceso de síntesis implica un trabajo previo en reconocimiento de emociones, que en sí mismo podría ser una línea completa de investigación, ya que muestra la viabilidad de usar los parámetros seleccionados en la discriminación de estos y aporta el conocimiento necesario para extraer los modelos que pueden ser usados durante el proceso de síntesis.La búsqueda del incremento de la naturalidad ha implicado una mejor caracterización del habla emocional o expresiva, con lo que para ello se ha investigado en parametrizaciones que pudieran llevar a cabo este cometido. Estos son los parámetros de Cualidad de la Voz Voice Quality (VoQ), que presentan como característica principal que son capaces de caracterizar individualmente el habla, identificando cada uno de los factores que hacen que sea única. Los beneficios potenciales, que este tipo de parametrización puede aportar a la interacción natural, son de dos clases: el reconocimiento y la síntesis de estilos de habla expresivos. La propuesta de la parametrización de VoQ no pretende sustituir a la ya empleada prosodia, sino todo lo contrario, trabajar conjuntamente con ella para mejorar los resultados obtenidos hasta el momento.Una vez realizada la selección de los parámetros se plantea el modelado de la VoQ, es decir, la metodología de análisis y de modificación de forma que cada uno de ellos pueda ser extraído a partir de la señal de voz y posteriormente modificado durante la síntesis. Asimismo, se proponen variaciones para los parámetros implicados y tradicionalmente utilizados, adaptando su definición al contexto del habla expresiva.A partir de aquí se pasa a trabajar en las relaciones existentes con los estilos de habla expresivos, presentando finalmente la metodología de transformación de estos últimos, mediante la modificación conjunta de VoQ y prosodia, para la SHE en un sistema de CTH. / This thesis is conducted on the existing working framework in the Grup de Recerca en Tecnologies Mèdia (GTM) research group of the Enginyeria i Arquitectura La Salle, with the aim of providing the man-machine interaction with more naturalness. To do this, we are based on the limitations of the technology used up to now, detecting the improvement points where we could contribute solutions. Given that the speech naturalness is closely linked with the expressivity communication, these improvement points are focused on the ability of working with emotions or expressive speech styles in general.The final goal of this thesis is the expressive speech styles generation in the field of Text-to-Speech (TTS) systems aimed at Expressive Speech Synthesis (ESS), with the possibility of communicating an oral message with a certain expressivity that the listener will be able to correctly perceive and interpret. Nevertheless, this goal involves different intermediate aims: to know the existing parameterization options, to understand each of the parameters, to find out the existing relations among them and the expressive speech styles and, finally, to carry out the expressive speech synthesis. All things considered, the synthesis process involves a previous work in emotion recognition, which could be a complete research field, since it shows the feasibility of using the selected parameters during their discrimination and provides with the necessary knowledge for the modelling that can be used during the synthesis process.The search for the naturalness improvement has implied a better characterization of the emotional or expressive speech, so we have researched on parameterizations that could perform this task. These are the Voice Quality (VoQ) parameters, which main feature is they are able to characterize the speech in an individual way, identifying each factor that makes it unique. The potential benefits that this kind of parameterization can provide with natural interaction are twofold: the expressive speech styles recognition and the synthesis. The VoQ parameters proposal is not trying to replace prosody, but working altogether to improve the results so far obtained.Once the parameters selection is conducted, the VoQ modelling is raised (i. e. analysis and modification methodology), so each of them can be extracted from the voice signal and later on modified during the synthesis. Also, variations are proposed for the involved and traditionally used parameters, adjusting their definition to the expressive speech context. From here, we work on the existing relations with the expressive speech styles and, eventually we show the transformation methodology for these ones, by means of the modification of VoQ and prosody, for the ESS in a TTS system.

Page generated in 0.605 seconds