11 |
Analysis and synthesis of Lithuanian phoneme dynamic sound models / Lietuviškų fonemų dinaminių modelių analizė ir sintezėPyž, Gražina 25 November 2013 (has links)
Speech is the most natural way of human communication. Text-to-speech (TTS) problem arises in various applications: reading email aloud, reading text from e-book aloud, services for the people with speech disorders. Construction of speech synthesizer is a very complex task. Researchers are trying to automate speech synthesis. In order to solve the problem of Lithuanian speech synthesis, it is necessary to develop mathematical models for Lithuanian speech sounds. The research object of the dissertation is Lithuanian vowel and semivowel phoneme models. The proposed vowel and semivowel phoneme models can be used for developing a TTS formant synthesizer. Lithuanian vowel and semivowel phoneme modelling framework based on a vowel and semivowel phoneme mathematical model and an automatic procedure of estimation of the vowel phoneme fundamental frequency and input determining is proposed. Using this framework, the phoneme signal is described as the output of a linear multiple-input and single-output (MISO) system. The MISO system is a parallel connection of single-input and single-output (SISO) systems whose input impulse amplitudes vary in time. Within this framework two synthesis methods are proposed: harmonic and formant. Simulation has revealed that that the proposed framework gives sufficiently good vowel and semivowel synthesis quality. / Kalba yra natūralus žmonių bendravimo būdas. Teksto-į-šneką (TTS) problemos atsiranda įvairiose srityse: elektroninių laiškų skaitymas balsu, teksto iš elektroninių knygų skaitymas balsu, paslaugos kalbos sutrikimų turintiems žmonėms. Kalbos sintezatoriaus kūrimas yra be galo sudėtingas uždavinys. Įvairių šalių mokslininkai bando automatizuoti kalbos sintezę. Siekiant išspręsti lietuvių kalbos sintezės problemą, būtina kurti naujus lietuvių kalbos garsų matematinius modelius. Disertacijos tyrimo objektas yra dinaminiai lietuviškos šnekos balsių ir pusbalsių fonemų modeliai. Pasiūlyti balsių ir pusbalsių fonemų dinaminiai modeliai gali būti panaudoti kuriant formantinį kalbos sintezatorių. Garsams aprašyti pasiūlyta modeliavimo sistema pagrįsta balsių ir pusbalsių fonemų matematiniu modeliu bei pagrindinio tono ir įėjimų nustatymo automatine procedūra. Fonemos signalas yra gaunamas kai daugelio-įėjimų ir vieno-išėjimo (MISO) sistemos išėjimas. MISO sistema susideda iš lygiagrečiai sujungtų vieno-įėjimo ir vieno-išėjimo (SISO) sistemų, kurių įėjimų amplitudes kinta laike. Disertacijoje du sintezės metodai sukurti: harmoninis ir formantinis. Eksperimentiniai rezultatai parodė, kad balsiai ir pusbalsiai sintezuoti minėta sistema skamba pakankamai natūraliai.
|
12 |
Etude paramétrique avancée de canaux SISO et MIMO en environnements complexes : Application au système HiperLAN/2Chartois, Yannick 08 December 2005 (has links) (PDF)
Les télécommunications sans fil mobiles connaissent un intérêt croissant depuis plus d'une décennie. Elles se décomposent en deux types d'applications : la téléphonie et les réseaux informatiques. La complémentarité de ces deux technologies offre un potentiel énorme pour fournir aux usagers une mobilité sans interruption de service quand l'utilisateur passe du domaine public au domaine privé et réciproquement. <br /><br />Toutefois, quel que soit le système de communication sans fil envisagé, il est soumis à une contrainte forte associée au caractère multitrajets du canal de propagation. Celles-ci se traduisent par des évanouissements parfois profonds et rapides du niveau de réception et par la sélectivité en fréquence du canal. Ainsi, le phénomène de trajets multiples associé au canal radioélectrique engendre des perturbations lors de la transmission de signaux à un instant, une position et une fréquence donnée.<br /><br />L'objectif de cette thèse s'inscrit dans ce contexte puisqu'il porte sur la caractérisation spatio-temporelle du canal de propagation tenant compte d'une ou plusieurs antennes à l'émission comme à la réception.<br /><br />Ainsi, dans ce document sont définis les outils théoriques permettant le calcul des fonctions caractéristiques. Ce formalisme est alors intégré dans un logiciel de caractérisation spatio-temporelle, pouvant considérer en entrée des données issues de campagnes de mesures ou provenant de modèles de propagation. Enfin, il propose une ouverture vers l'utilisation des informations de caractérisation du canal dans un système HiperLAN/2.
|
13 |
Les Modulations à Phase Continue pour la Conception d'une Forme d'Onde Adaptative Application aux Futurs Systèmes Multimédia par Satellite en Bande KaChaggara, Ridha 12 1900 (has links) (PDF)
Dans le cadre de cette thèse nous nous intéressons à la liaison d'un terminal utilisateur vers un satellite géostationnaire pour les futurs systèmes d'applications multimédia en bande Ka. Le but est de concevoir une forme d'onde qui permet de s'adapter aux conditions de propagation. L'adaptation des performances en spectre et en puissance de la forme d'onde, notamment dans un contexte avec une forte fluctuation du niveau du signal, comme celui du canal satellite en bande Ka, permet à la fois d'augmenter la capacité et d'améliorer la disponibilité du système. Dans ces travaux, les formes d'onde basées sur les modulations CPM (Continuous Phase Modulation) ont été adoptées. L'enveloppe constante, les différents paramètres ayant un impact sur les performances de la forme d'onde, ainsi que les bonnes performances en puissance lors d'un processus de décodage itératif sont les principales motivations de notre choix. Concernant l'adaptativité nous montrons qu'une forme d'onde CPM basée sur la variation de l'indice de modulation (et éventuellement la réponse en fréquence) au sein d'une famille d'indices ayant un même dénominateur est une solution particulièrement attractive. Une telle solution ne nécessite pas une très grande complexité lors d'un passage d'un mode de transmission à un autre. Elle nécessite essentiellement le changement des coefficients des filtres adaptés. Cette technique permet aussi d'obtenir une marge de performance assez importante vu que l'indice de modulation est le paramètre qui affecte le plus les performances de la CPM. La CPM octale 2RC est un schéma particulièrement attractif d'un point de vue performance.
|
14 |
Power Control Mechanisms on WARP BoardsKandukuri, Somasekhar Reddy January 2013 (has links)
In recent years, a number of power control concepts have been studied and implementedeither in simulation or in practice for different communication systems. It is still the case that a great deal of research is being conducted within the area of energyefficient power control mechanisms for future wireless communication networksystems. However, only a limited amount of practical work has been implemented onreal test beds environment. The main goal of this thesis is to propose and develop newprototype Transmit Power Control Mechanisms (TPCM) on WARP (Wireless Open-Access Research Platform) boards for point-to-point communications, which are to bedeveloped and tested in an indoor environment. This work mainly focuses on the automaticpower control nodes, transmission and reception over-the-air. In this thesis, wehave designed and developed TPCM to adjust the power levels on a transmitter nodeby following the feedback (ACK) approach. In this case, the destination (receiver)node always sends the feedback (ACK) to transmitter node during every successfultransmission of message signal and the main focus is on a reduction in the packetloss rate (PLR), an increase in the packet reception rate (PRR) and the capacity ofthe nodes. In this real work, we have developed and measured the results based ontwo functions namely, with and without packet window function power control mechanisms. According to the measurements section, both with and without function powercontrol mechanisms proved to have better performances for different tunable parameters.If both functions are compared, then the with window function power controlmechanism was shown to produce better performances than the without windowpower control mechanism and it also converged faster than the without window function.If consideration was given to controlling a reduction in packet loss rate, thenthe with widnow function offered higher performances than those without the windowfunction. In this regard, it was found that the with window function has acheived amaximum packet reception rate than that for the without window function for differenttunable parameters. In relation to the power consumption scenario, it was determinedthat the without window fuction proved to produce energy saving performances thanthe with window function. There are several interesting aspects of the transmit powercontrol mechanisms highlighted in the results and discussion chapter.
|
15 |
Impact of MIMO Transmission on CAF-Based GeolocationOverfield, Jacob Ivan 27 August 2013 (has links)
The Cross Ambiguity Function (CAF) is often used for passive geolocation of an emitter based on the time difference of arrival (TDOA) and frequency difference of arrival (FDOA) of the received signals. CAF performance has been thoroughly investigated in regards to traditional single-input single-output (SISO) signals. Little is known about how the CAF will respond to signals from multiple-input multiple-output (MIMO) systems which utilize multiple antennas. This thesis focuses on characterizing the CAF's magnitude distribution in order to determine the probability of correctly determining the correct TDOA/FDOA bin, and the resulting impact on geolocation. The received signals are studied in the presence of additive white Gaussian noise (AWGN) as well as multi-channel propagation effects such as phase ambiguities and offsets due to multi-antenna transmission.
Two and four transmit antennas using either a form of spatial multiplexing or space-time block coding are the focus of this work because they are mostly commonly found in currently deployed communication systems. The effects of these transmit schemes are studied with respect to TDOA/FDOA error and the resulting position error. The analysis is performed using a detection theory framework as opposed to estimation theory in order to empha- size the impact of MIMO transmission on determining the correct TDOA/FDOA bin. A simple method using the CAF magnitude as a decision statistic is also presented so that TDOA/FDOA errors can be detected and filtered in an attempt to improve positioning estimates. / Master of Science
|
16 |
GPC mediante descomposición en valores singulares (SVD). Análisis de componentes principales (PCA) y criterios de selecciónSanchís Saez, Javier 03 June 2009 (has links)
El control predictivo basado en modelos o Model Predictive Control (MPC), no hace referencia al diseño concreto de un controlador sino más bien a un conjunto de ideas o características para el desarrollo de estrategias de control que, aplicadas en un mayor o menor grado, dan lugar a diferentes tipos de controladores con estructuras similares. El MPC es una de las técnicas de control que más se ha desarrollado en los ámbitos académico e industrial en las últimas décadas debido sobre todo a su simplicidad y eficiencia.
Sin embargo, no es fácil relacionar los parámetros de ajuste del controlador y las prestaciones del bucle cerrado. En este sentido, es importante diseñar algoritmos de control predictivo que garanticen la estabilidad nominal del bucle cerrado, con tiempos de cálculo pequeños y con un significado claro de sus parámetros sobre las prestaciones del sistema o sobre el esfuerzo de control.
La aportación fundamental de esta tesis está relacionada con la definición de un nuevo tipo de controlador predictivo, el PC-GPC, versión modificada de un GPC estándar. En este controlador se ha sustituido el factor de ponderación de la acción de control por un nuevo parámetro denominado número de componentes principales (NPC). La relación entre el nuevo parámetro (NPC) y algunos indicadores numéricos, como la norma del vector de acciones de control o el número de condición de la matriz dinámica G, hacen que su elección esté basada en criterios menos subjetivos que la ponderación de las acciones de control. Además, se ha analizado este tipo de controlador tanto en el ámbito de procesos SISO como MIMO, así como sus características de robustez y estabilidad. Por otro lado, se ha deducido un método de cálculo de un controlador PC-GPC para garantizar la estabilidad nominal de bucle cerrado, cuando el modelo conocido es exacto. / Sanchís Saez, J. (2002). GPC mediante descomposición en valores singulares (SVD). Análisis de componentes principales (PCA) y criterios de selección [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/4924
|
17 |
VLSI Implementation of Key Components in A Mobile Broadband ReceiverHuang, Yulin January 2009 (has links)
<p>Digital front-end and Turbo decoder are the two key components in the digital wireless communication system. This thesis will discuss the implementation issues of both digital front-end and Turbo decoder.The structure of digital front-end for multi-standard radio supporting wireless standards such as IEEE802.11n, WiMAX, 3GPP LTE is investigated in the thesis. A top-to-down design methods. 802.11n digital down-converter is designed from Matlab model to VHDL implementation. Both simulation and FPGA prototyping are carried out.As another significant part of the thesis, a parallel Turbo decoder is designed and implemented for 3GPPLTE. The block size supported ranges from 40 to 6144 and the maximum number of iteration is eight.The Turbo decoder will use eight parallel SISO units to reach a throughput up to 150Mits.</p>
|
18 |
Multidiffusion et diffusion dans les systèmes OFDM sans filSaavedra Navarrete, José Antonio 19 October 2012 (has links) (PDF)
Le système OFDM (Orthogonal Frequency Division Multiplexing) utilise plusieurs sous-porteuses pour transmettre de l'information. Comparé à un schéma mono-porteuse, la modulation multi-porteuses OFDM permet d'obtenir facilement des réglages optimaux (au sens de la capacité de Shannon) pour une transmission à haut débit sur un canal sélectif en fréquence. En ce sens, on peut alors garantir une transmission fiable et une meilleure gestion de l'énergie utilisée. Lors de la transmission avec une modulation OFDM, les sous-porteuses utilisent des canaux différents qui n'ont pas forcement la même atténuation. Allouer le même niveau de puissance à chaque sous-porteuse ne garantit pas une capacité optimale dans une liaison point à point. Une allocation dynamique de la puissance (c'est-à-dire attribuer différents niveaux de puissance aux sous-porteuses en fonction du canal) donne de meilleures performances. Par contre, dans une situation de diffusion (broadcast), l'émetteur ne connaît pas les canaux vers tous les utilisateurs, et la meilleure stratégie consiste à émettre avec la même puissance sur toutes les sous-porteuses. Cette thèse a pour objectif d'explorer les situations intermédiaires, et de proposer les outils d'allocation de puissance appropriés. Cette situation intermédiaire est appelée " multicast ", ou " multidiffusion " : l'émetteur envoie les signaux vers un nombre fini (pas trop grand) d'utilisateurs, dont il connaît les paramètres de canaux, et il peut adapter son émission à cette connaissance des canaux. On est donc dans une situation intermédiaire entre le " point à point " et la " diffusion ". L'objectif final de ce travail est d'évaluer le gain apporté par la connaissance des canaux en situation de multicast par rapport à la même communication effectuée comme si on était en diffusion. Bien évidemment, quand le nombre de destinataires est très grand, les gains seront négligeables, car le signal rencontre un nombre très élevé de canaux, et une allocation de puissance uniforme sera quasi optimale. Quand le nombre est très faible, on sera proche du point à point et les gains devraient être sensibles. Nous proposons des outils pour quantifier ces améliorations dans les cas de systèmes ayant une antenne à l'émission et une antenne à la réception, dit SISO (Single Input Single Output) et de systèmes avec plusieurs antennes, dits MIMO (Multiple Input Multiple Output). Les étapes nécessaires pour réaliser ce travail sont : 1) En supposant une connaissance préalable de l'état des canaux (entre station de base et terminaux), mettre en œuvre les outils de la théorie de l'information pour effectuer l'allocation de puissance et évaluer les capacités des systèmes étudiés. 2) Pour le système multi-utilisateur SISO-OFDM, nous proposons un algorithme d'allocation de puissance sur chaque sous porteuse dans une situation de multicast. 3) Pour le système multi-utilisateur MIMO-OFDM, nous proposons un algorithme qui exploite les caractéristiques du précodage "zero forcing". L'objectif est alors de partager la puissance disponible entre toutes les sous-porteuses et toutes les antennes. 4) Enfin, dans une dernière étape nous nous intéressons à une conception efficace de la situation de diffusion, afin de déterminer à l'aide d'outils de géométrie stochastique quelle zone peut être couverte afin qu'un pourcentage donné d'utilisateurs reçoivent une quantité d'information déterminée à l'avance. Ceci permet de déterminer la zone de couverture sans mettre en œuvre des simulations intensives. La combinaison de ces outils permet un choix efficace des situations qui relèvent de la " diffusion ", du " multicast " et du " point à point ".
|
19 |
Why only two ears? Some indicators from the study of source separation using two sensorsJoseph, Joby 08 1900 (has links)
In this thesis we develop algorithms for estimating broadband source signals from a mixture using only two sensors. This is motivated by what is known in the literature as cocktail party effect, the ability of human beings to listen to the desired source from a mixture of sources with at most two ears. Such a study lets us, achieve a better understanding of the auditory pathway in the brain and confirmation of the results from physiology and psychoacoustics, have a clue to search for an equivalent structure in the brain which corresponds to the modification which improves the algorithm, come up with a benchmark system to automate the evaluation of the systems like 'surround sound', perform speech recognition in noisy environments. Moreover, it is possible that, what we learn about the replication of the functional units in the brain may help us in replacing those using signal processing units for patients suffering due to the defects in these units.
There are two parts to the thesis. In the first part we assume the source signals to be broadband and having strong spectral overlap. Channel is assumed to have a few strong multipaths. We propose an algorithm to estimate all the strong multi-paths from each source to the sensors for more than two sources with measurement from two sensors. Because the channel matrix is not invertible when the number of sources is more than the number of sensors, we make use of the estimates of the multi-path delays for each source to improve the SIR of the sources. In the second part we look at a specific scenario of colored signals and channel being one with a prominent direct path. Speech signals as the sources in a weakly reverberant room and a pair of microphones as the sensors satisfy these conditions. We consider the case with and without a head like structure between the microphones. The head like structure we used was a cubical block of wood. We propose an algorithm for separating sources under such a scenario. We identify the features of speech and the channel which makes it possible for the human auditory system to solve the cocktail party problem. These properties are the same as that satisfied by our model. The algorithm works well in a partly acoustically treated room, (with three persons speaking and two microphones and data acquired using standard PC setup) and not so well in a heavily reverberant scenario.
We see that there are similarities in the processing steps involved in the algorithm and what we know of the way our auditory system works, especially so in the regions before the auditory cortex in the auditory pathway. Based on the above experiments we give reasons to support the hypothesis about why all the known organisms need to have only two ears and not more but may have more than two eyes to their advantage. Our results also indicate that part of pitch estimation for individual sources might be occurring in the brain after separating the individual source components. This might solve the dilemma of having to do multi-pitch estimation. Recent works suggest that there are parallel pathways in the brain up to the primary auditory cortex which deal with temporal cue based processing and spatial cue based processing. Our model seem to mimic the pathway which makes use of the spatial cues.
|
20 |
VLSI Implementation of Key Components in A Mobile Broadband ReceiverHuang, Yulin January 2009 (has links)
Digital front-end and Turbo decoder are the two key components in the digital wireless communication system. This thesis will discuss the implementation issues of both digital front-end and Turbo decoder.The structure of digital front-end for multi-standard radio supporting wireless standards such as IEEE802.11n, WiMAX, 3GPP LTE is investigated in the thesis. A top-to-down design methods. 802.11n digital down-converter is designed from Matlab model to VHDL implementation. Both simulation and FPGA prototyping are carried out.As another significant part of the thesis, a parallel Turbo decoder is designed and implemented for 3GPPLTE. The block size supported ranges from 40 to 6144 and the maximum number of iteration is eight.The Turbo decoder will use eight parallel SISO units to reach a throughput up to 150Mits.
|
Page generated in 0.0216 seconds