• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 234
  • 11
  • 7
  • 3
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 260
  • 202
  • 159
  • 125
  • 125
  • 124
  • 124
  • 124
  • 124
  • 124
  • 118
  • 52
  • 52
  • 45
  • 39
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
251

Transformer Models for Machine Translation and Streaming Automatic Speech Recognition

Baquero Arnal, Pau 29 May 2023 (has links)
[ES] El procesamiento del lenguaje natural (NLP) es un conjunto de problemas computacionales con aplicaciones de máxima relevancia, que junto con otras tecnologías informáticas se ha beneficiado de la revolución que ha significado el aprendizaje profundo. Esta tesis se centra en dos problemas fundamentales para el NLP: la traducción automática (MT) y el reconocimiento automático del habla o transcripción automática (ASR); así como en una arquitectura neuronal profunda, el Transformer, que pondremos en práctica para mejorar las soluciones de MT y ASR en algunas de sus aplicaciones. El ASR y MT pueden servir para obtener textos multilingües de alta calidad a un coste razonable para una diversidad de contenidos audiovisuales. Concre- tamente, esta tesis aborda problemas como el de traducción de noticias o el de subtitulación automática de televisión. El ASR y MT también se pueden com- binar entre sí, generando automáticamente subtítulos traducidos, o con otras soluciones de NLP: resumen de textos para producir resúmenes de discursos, o síntesis del habla para crear doblajes automáticos. Estas aplicaciones quedan fuera del alcance de esta tesis pero pueden aprovechar las contribuciones que contiene, en la meduda que ayudan a mejorar el rendimiento de los sistemas automáticos de los que dependen. Esta tesis contiene una aplicación de la arquitectura Transformer al MT tal y como fue concebida, mediante la que obtenemos resultados de primer nivel en traducción de lenguas semejantes. En capítulos subsecuentes, esta tesis aborda la adaptación del Transformer como modelo de lenguaje para sistemas híbri- dos de ASR en vivo. Posteriormente, describe la aplicación de este tipus de sistemas al caso de uso de subtitulación de televisión, participando en una com- petición pública de RTVE donde obtenemos la primera posición con un marge importante. También demostramos que la mejora se debe principalmenta a la tecnología desarrollada y no tanto a la parte de los datos. / [CA] El processament del llenguage natural (NLP) és un conjunt de problemes com- putacionals amb aplicacions de màxima rellevància, que juntament amb al- tres tecnologies informàtiques s'ha beneficiat de la revolució que ha significat l'impacte de l'aprenentatge profund. Aquesta tesi se centra en dos problemes fonamentals per al NLP: la traducció automàtica (MT) i el reconeixement automàtic de la parla o transcripció automàtica (ASR); així com en una ar- quitectura neuronal profunda, el Transformer, que posarem en pràctica per a millorar les solucions de MT i ASR en algunes de les seues aplicacions. l'ASR i MT poden servir per obtindre textos multilingües d'alta qualitat a un cost raonable per a un gran ventall de continguts audiovisuals. Concretament, aquesta tesi aborda problemes com el de traducció de notícies o el de subtitu- lació automàtica de televisió. l'ASR i MT també es poden combinar entre ells, generant automàticament subtítols traduïts, o amb altres solucions de NLP: amb resum de textos per produir resums de discursos, o amb síntesi de la parla per crear doblatges automàtics. Aquestes altres aplicacions es troben fora de l'abast d'aquesta tesi però poden aprofitar les contribucions que conté, en la mesura que ajuden a millorar els resultats dels sistemes automàtics dels quals depenen. Aquesta tesi conté una aplicació de l'arquitectura Transformer al MT tal com va ser concebuda, mitjançant la qual obtenim resultats de primer nivell en traducció de llengües semblants. En capítols subseqüents, aquesta tesi aborda l'adaptació del Transformer com a model de llenguatge per a sistemes híbrids d'ASR en viu. Posteriorment, descriu l'aplicació d'aquest tipus de sistemes al cas d'ús de subtitulació de continguts televisius, participant en una competició pública de RTVE on obtenim la primera posició amb un marge significant. També demostrem que la millora es deu principalment a la tecnologia desen- volupada i no tant a la part de les dades / [EN] Natural language processing (NLP) is a set of fundamental computing prob- lems with immense applicability, as language is the natural communication vehicle for people. NLP, along with many other computer technologies, has been revolutionized in recent years by the impact of deep learning. This thesis is centered around two keystone problems for NLP: machine translation (MT) and automatic speech recognition (ASR); and a common deep neural architec- ture, the Transformer, that is leveraged to improve the technical solutions for some MT and ASR applications. ASR and MT can be utilized to produce cost-effective, high-quality multilin- gual texts for a wide array of media. Particular applications pursued in this thesis are that of news translation or that of automatic live captioning of tele- vision broadcasts. ASR and MT can also be combined with each other, for instance generating automatic translated subtitles from audio, or augmented with other NLP solutions: text summarization to produce a summary of a speech, or speech synthesis to create an automatic translated dubbing, for in- stance. These other applications fall out of the scope of this thesis, but can profit from the contributions that it contains, as they help to improve the performance of the automatic systems on which they depend. This thesis contains an application of the Transformer architecture to MT as it was originally conceived, achieving state-of-the-art results in similar language translation. In successive chapters, this thesis covers the adaptation of the Transformer as a language model for streaming hybrid ASR systems. After- wards, it describes how we applied the developed technology for a specific use case in television captioning by participating in a competitive challenge and achieving the first position by a large margin. We also show that the gains came mostly from the improvement in technology capabilities over two years including that of the Transformer language model adapted for streaming, and the data component was minor. / Baquero Arnal, P. (2023). Transformer Models for Machine Translation and Streaming Automatic Speech Recognition [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/193680
252

Características de la producción del habla en niños de 6 y 7 años en una Institución Educativa Estatal de San Juan de Miraflores

Flores Zamora, Gina Zoraida, Rivera Taquiri, Noelia Marycela 01 April 2024 (has links)
El presente trabajo es un estudio descriptivo cuyo objetivo principal es determinar las características de la producción del habla en niños de 6 y 7 años en una institución educativa estatal de San Juan de Miraflores. Para la recolección de datos, se utilizó el Examen Miofuncional Orofacial– MBGR (2004) de Irene Marchesan traducida por Mónica Paredes y Lydia Fernández (2014) y la técnica de observación sistemática con el propósito de identificar las características de la producción del habla en los niños. Los resultados de este estudio demuestran que el 20% de los niños evidencia alteraciones en el habla de los cuales el 75% es de origen musculoesquelético. Así mismo la alteración de habla predominante es la omisión en los grupos consonánticos de [l] y [r], seguido por la alteración por sustitución de los grupos consonánticos de [r] por los grupos consonánticos de [l] tales como [kr] por [kl] y [br] por [bl]. Las distorsiones también están presentes principalmente en el fon alveolar [s]. De esta manera se concluye que existe presencia de alteraciones del habla en los niños de 6 y 7 años lo que evidencia la importancia de la intervención interdisciplinaria entre docentes y fonoaudiólogos en las instituciones educativas estatales. / The present investigation is a descriptive study whose principal objective is to determine the characteristics of speech production in children of 6 and 7 years old at state educational institution of San Juan de Miraflores. To recolect data we used the Myofunctional Orofacial Examination- MBGR (2004) of Irene Marchesan translated by Mónica Paredes and Lydia Fernández (2014), the technique of systematic observation was aplicated with the purpose of identifying the characteristics of speech production in the children. The results of this study show that 20% of children show alterations in speech, of which 75% are of musculoskeletal origin. Likewise, the predominant speech alteration is the omission in the consonant groups of [ l ] and [ r ], followed by the alteration by substitution of the consonant groups of [r] by the consonant groups of [l] such as [kr] by [kl] and [br] by [bl]. Distortions are also mainly present in the alveolar fon [s]. So that investigation is concluded that there is a presence of speech alterations in children of 6 and 7 years old, which shows the importance of interdisciplinary intervention between teachers and phonoaudiologists in state educational institutions.
253

Optimització perceptiva dels sistemes de síntesi de la parla basats en selecció d’unitats mitjançant algorismes genètics interactius actius

Formiga Fanals, Lluís 27 April 2011 (has links)
Els sistemes de conversió de text en parla (CTP-SU) s'encarreguen de produir veu sintètica a partir d'un text d'entrada. Els CTP basats en selecció d'unitats (CTP-SU) recuperen la millor seqüència d'unitats de veu enregistrades prèviament en una base de dades (corpus). La recuperació es realitza mitjançant algorismes de programació dinàmica i una funció de cost ponderada. La ponderació de la funció de cost es realitza típicament de forma manual per part d'un expert. No obstant, l'ajust manual resulta costós des d'un punt de vista de coneixement prèvi, i imprecís en la seva execució. Per tal d'ajustar els pesos de la funció de cost, aquesta tesi parteix de la prova de viabilitat d'ajust perceptiu presentada per Alías (2006) que empra algorismes genètics interactius actius (active interactive Genetic Algorithm - aiGA). Aquesta tesi doctoral investiga les diferents problemàtiques que es presenten en aplicar els aiGAs en l'ajust de pesos d'un CTP-SU en un context real de selecció d'unitats. Primerament la tesi realitza un estudi de l'estat de l'art en l'ajust de pesos. Tot seguit, repassa la idoneïtat de la computació evolutiva interactiva per realitzar l'ajust revisant amb profunditat el treball previ. Llavors es presenten i es validen les propostes de millora. Les quatre línies mestres que guien les contribucions d'aquesta tesi són: la precisió en l'ajust dels pesos, la robustesa dels pesos obtinguts, l'aplicabilitat de la metodologia per qualsevol funció de cost i el consens dels pesos obtinguts incorporant el criteri de diferents usuaris. En termes de precisió la tesi proposa realitzar l'ajust perceptiu per diferents tipus (clústers) d'unitats respectant les seves peculiaritats fonètiques i contextuals. En termes de robustesa la tesi incorpora diferents mètriques evolutives (indicadors) que avaluen aspectes com l'ambigüitat en la cerca, la convergència d'un usuari o el nivell de consens entre diferents usuaris. Posteriorment, per estudiar l'aplicabilitat de la metodologia proposada s'ajusten perceptivament diferents pesos que combinen informació lingüística i simbòlica. La última contribució d'aquesta tesi estudia l'idoneïtat dels models latents per modelar les preferències dels diferents usuaris i obtenir una solució de consens. Paral•lelament, per fer el pas d'una prova de viabilitat a un entorn real de selecció d'unitats es treballa amb un corpus d'extensió mitjana (1.9h) etiquetat automàticament. La tesi permet concloure que l'aiGA a nivell de clúster és una metodologia altament competitiva respecte les altres tècniques d'ajust presents en l'estat de l'art. / Los sistemas de conversión texto-habla (CTH-SU) se encargan de producir voz sintética a partir de un texto de entrada. Los CTH basados en selección de unidades (CTH-SU) recuperan la mejor secuencia de unidades de voz grabadas previamente en una base de datos (corpus). La recuperación se realitza mediante algoritmos de programación dinámica y una función de coste ponderada. La ponderación de la función de coste se realiza típicamente de forma manual por parte de un experto. Sin embargo, el ajuste manual resulta costoso desde un punto de vista de conocimiento previo e impreciso en su ejecución. Para ajustar los pesos de la función de coste, esta tesis parte de la prueba de viabilidad de ajuste perceptivo presentada por Alías (2006) que emplea algoritmos genéticos interactivos activos (active interactive Genetic Algorithm - aiGA). Esta tesis doctoral investiga las diferentes problemáticas que se presentan al aplicar los aiGAs en el ajuste de pesos de un CTH-SU en un contexto real de selección de unidades. Primeramente la tesis realiza un estudio del estado del arte en el ajuste de pesos, posteriormente repasa la idoneidad de la computación evolutiva interactiva para realizar el ajuste revisando en profundidad el trabajo previo. Entonces se presentan y se validan las propuestas de mejora. Las cuatro líneas maestras que guían las contribuciones de esta tesis son: la precisión en el ajuste de los pesos, la robustez de los pesos obtenidos, la aplicabilidad de la metodología para cualquier función de coste y el consenso de los pesos obtenidos incorporando el criterio de diferentes usuarios. En términos de precisión la tesis propone realizar el ajuste perceptivo por diferentes tipos (clusters) de unidades respetando sus peculiaridades fonéticas y contextuales. En términos de robustez la tesis incorpora diferentes métricas evolutivas (indicadores) que evalúan aspectos como la ambigüedad en la búsqueda, la convergencia de un usuario o el nivel de consenso entre diferentes usuarios. Posteriormente, para estudiar la aplicabilidad de la metodología propuesta se ajustan perceptivamente diferentes pesos que combinan información lingüística y simbólica. La última contribución de esta tesis estudia la idoneidad de los modelos latentes para modelar las preferencias de los diferentes usuarios y obtener una solución de consenso. Paralelamente, para dar el paso de una prueba de viabilidad a un entorno real de selección de unidades se trabaja con un corpus de extensión media (1.9h) etiquetado automáticamente. La tesis permite concluir que el aiGA a nivel de cluster es una metodología altamente competitiva respecto a las otras técnicas de ajuste presentes en el estado del arte. / Text-to-Speech Systems (TTS) produce synthetic speech from an input text. Unit Selection TTS (US-TTS) systems are based on the retrieval of the best sequence of recorded speech units previously recorded into a database (corpus). The retrieval is done by means of dynamic programming algorithm and a weighted cost function. An expert typically performs the weighting of the cost function by hand. However, hand tuning is costly from a standpoint of previous training and inaccurate in terms of methodology. In order to properly tune the weights of the cost function, this thesis continues the perceptual tuning proposal submitted by Alías(2006) which uses active interactive Genetic Algorithms (aiGAs). This thesis conducts an investigation to the various problems that arise in applying aiGAs to the weight tuning of the cost function. Firstly, the thesis makes a deep revision to the state-of-the-art in weight tuning. Afterwards, the thesis outlines the suitability of Interactive Evolutionary Computation (IEC) to perform the weight tuning making a thorough review of previous work. Then, the proposals of improvement are presented. The four major guidelines pursued by this thesis are: accuracy in adjusting the weights, robustness of the weights obtained, the applicability of the methodology to any subcost distance and the consensus of weights obtained by different users. In terms of precision cluster-level perceptual tuning is proposed in order to obtain weights for different types (clusters) of units considering their phonetic and contextual properties. In terms of robustness of the evolutionary process, the thesis presents different metrics (indicators) to assess aspects such as the ambiguity within the evolutionary search, the convergence of one user or the level of consensus among different users. Subsequently, to study the applicability of the proposed methodology different weights are perceptually tuned combining linguistic and symbolic information. The last contribution of this thesis examines the suitability of latent models for modeling the preferences of different users and obtains a consensus solution. In addition, the experimentation is carried out through a medium size corpus (1.9h) automatically labelled in order fill the gap between the proof-of-principle and a real unit selection scenario. The thesis concludes that aiGAs are highly competitive in comparison to other weight tuning techniques from the state-of-the-art.
254

Asimetrías en la percepción del habla: efectos de la notoriedad del estímulo en el procesamiento

Vera Constán, Fátima 15 July 2010 (has links)
En los estudios sobre la percepción de los sonidos del habla es fácil encontrar diversos ejemplos que muestran que algunas características de la señal resultan más notorias que otras. En general estas diferencias no han sido incorporadas en los modelos de reconocimiento de palabras. En este trabajo se muestran evidencias de los sesgos en la percepción de vocales en adultos utilizando la técnica de los potenciales evocados. Independientemente de la lengua materna de los participantes, el fonema /i/ resulta mejor discriminado (i.e. respecto a /e/). Además se estudia el papel que la notoriedad de los estímulos juega en la representación y el acceso léxico. El juicio léxico realizado sobre no-palabras se ve acelerado cuando estas contienen como vocal crítica la /i/ (vs. /e/). / In speech perception literature, it is easy to find examples of some characteristics in the signal hich are more salient than others. However, such differences have generally not been incorporated in word recognition models. In this dissertation, evidence of adult vowel perception biases is shown by means of the event-related potentials (ERP) technique. We show that, regardless of the participants' native language, the /i/ phoneme is recognised more easily (relative to the /e/ phoneme). In addition the role that salience plays in lexica representation and access is studied. We find that lexical judgement in non-words is speeded when these contain /i/ as a critical vowel (vs. /e/).
255

Spectral processing of the singing voice

Loscos, Àlex 02 May 2007 (has links)
Aquesta tesi doctoral versa sobre el processament digital de la veu cantada, més concretament, sobre l'anàlisi, transformació i síntesi d'aquets tipus de veu en el domini espectral, amb especial èmfasi en aquelles tècniques rellevants per al desenvolupament d'aplicacions musicals.La tesi presenta nous procediments i formulacions per a la descripció i transformació d'aquells atributs específicament vocals de la veu cantada. La tesis inclou, entre d'altres, algorismes per l'anàlisi i la generació de desordres vocals como ara rugositat, ronquera, o veu aspirada, detecció i modificació de la freqüència fonamental de la veu, detecció de nasalitat, conversió de veu cantada a melodia, detecció de cops de veu, mutació de veu cantada, i transformació de veu a instrument; exemplificant alguns d'aquests algorismes en aplicacions concretes. / Esta tesis doctoral versa sobre el procesado digital de la voz cantada, más concretamente, sobre el análisis, transformación y síntesis de este tipo de voz basándose e dominio espectral, con especial énfasis en aquellas técnicas relevantes para el desarrollo de aplicaciones musicales.La tesis presenta nuevos procedimientos y formulaciones para la descripción y transformación de aquellos atributos específicamente vocales de la voz cantada. La tesis incluye, entre otros, algoritmos para el análisis y la generación de desórdenes vocales como rugosidad, ronquera, o voz aspirada, detección y modificación de la frecuencia fundamental de la voz, detección de nasalidad, conversión de voz cantada a melodía, detección de los golpes de voz, mutación de voz cantada, y transformación de voz a instrumento; ejemplificando algunos de éstos en aplicaciones concretas. / This dissertation is centered on the digital processing of the singing voice, more concretely on the analysis, transformation and synthesis of this type of voice in the spectral domain, with special emphasis on those techniques relevant for music applications. The thesis presents new formulations and procedures for both describing and transforming those attributes of the singing voice that can be regarded as voice specific. The thesis includes, among others, algorithms for rough and growl analysis and transformation, breathiness estimation and emulation, pitch detection and modification, nasality identification, voice to melody conversion, voice beat onset detection, singing voice morphing, and voice to instrument transformation; being some of them exemplified with concrete applications.
256

Comunidad y sociedad en los márgenes del diluvio tecnológico.Impacto e interrupciones de las tecnologías de información y comunicación en las comunidades reales: cultura, lengua y emancipación

Barbedo Assis, Tiago 24 July 2013 (has links)
Este trabajo tiene como objeto el cuestionamiento de la ¿adaptación¿ del ser humano a sus propias invenciones tecnológicas, concretamente en relación a la Tecnologías de Información y Comunicación (TIC). En ese sentido, la primera parte del trabajo centra sus objetivos en los aspectos historiográ¿cos de cómo, y en qué contextos, esas invenciones fueron realizadas y evolucionaron. El trabajo de investigación se desarrolla en base a una re¿exión sobre la comunicación, su lenguaje y su política, algo que consideramos esencial para la comprensión de las TIC. Siempre desde el punto de vista de la globalización, en la primera parte del trabajo re¿exionamos sobre las éticas e ideologías que dominan el concepto de lo global (por ejemplo, la Netocracia). Analizamos con especial énfasis el trabajo de Kevin Kelly, concretamente sus re¿exiones sobre la tecnología y el concepto de Technium. Posteriormente, consideramos los estudios de Pekka Himanem sobre la ética hacker y su relación con el trabajo de Max Webber. La segunda parte del trabajo de investigación se aleja de la primera, basándose en conceptos relativos al pensamiento local (no-global). Las re¿exiones parten de las experiencias del propio investigador con las TIC, en entornos y culturas excluidas de la realidad tecnológica descrita en la primera parte. Estas experiencias que implican directamente al autor de este trabajo de investigación, transcurren fundamentalmente a partir del ¿movimiento intercultural ¿ Identidades¿, un colectivo que promueve relaciones humanas entre Mozambique, Brasil, Cabo-Verde y Portugal. En ese ¿movimiento¿ emergen laboratorios interculturales donde se comparten experiencias centradas en prácticas artísticas y culturales, utilizando varias tecnologías, de las más antiguas a las ahora emergentes. Artistas, estudiantes y profesores de arte, escuelas y comunidades Reales, se implican en prácticas que van desde la cerámica a la publicación en la web. En esta implicación emergen nuevas cuestiones éticas, teóricas y instrumentales acerca de las TIC. Una de las acciones creadas con la comunidad Quilombola de Conceição de las Crioulas, en el Nordeste del Brasil, plantea la cuestión fundamental que desarrollamos en esta tesis: ¿puede una comunidad utilizar las TIC al servicio de su cultura y de la lucha por su emancipación? Más allá de la lucha por su emancipación, esta comunidad se enfrenta a otras di¿cultades en la reivindicación por su autonomía, en la construcción de su identidad y por la posesión de su territorio. De la experiencia conjuntan con las TIC entre un grupo de jóvenes de la comunidad y el ¿movimiento intercultural ¿ Identidades¿, fue creado el ¿Crioulas Vídeo¿, la primera productora audiovisual Quilombola de Brasil. Una experiencia que nos aproxima a la problemática de las TIC en las comunidades info-excluidas. De hecho, son las propias TIC, por su con¿guración actual, las que gobiernan, regulan y ¿scalizan estas y otras comunidades. El debate y la investigación sobre este tema está contratado en un pretencioso universalismo ¿globalización¿ impidiendo la participación de las comunidades excluidas. Se retoma, así, el problema de la emancipación y se abre un debate por el interés en permitir que estas comunidades, a través de un plan inclusivo, puedan tener presencia legítima dentro de un entorno plural y global. Este plan, que se inicia en la tercera y última parte de la tesis, se confrontan los puntos de vista globales y locales, donde la primera y segunda parte del estudio se oponen, desarrollando un escenario teórico crítico a las direcciones hasta el momento hegemónicas. La fórmula de nuestra era `el medio es el mensaje¿, se traduce en simulacro al colocar a los netócratas en el poder. Más que una secularización del protestantismo, el capitalismo se de¿ende como fenómeno religioso que se extiende en el Ciberfordismo a través de la Ideología Californiana y el nuevo clero netócrata. La experiencia realizada con una comunidad Real, que aún no ha sucumbio a este tipo de simulacro, permite formular la hipótesis de suspensión, re¿exión y creación de alternativas para las TIC, al servicio de la cultura de las comunidades. Es necesario un (re) enraizamiento de las TIC en la cultura. Es claro que el Código que actualmente gobierna el Simulacro impide la experiencia de una comunidad con su lugar, con su territorio así como también impide la experimentum linguae [experiencia lingüística], vital para una comunidad Real en su respectiva emancipación. Esta problemática se argumenta con un cuerpo teórico apoyado en axiomas de Benjamin y Agamben, dando como resultado análisis basados en la acción/investigación de las TIC al servicio de la cultura y de la emancipación ciudadana. / Barbedo Assis, T. (2013). Comunidad y sociedad en los márgenes del diluvio tecnológico.Impacto e interrupciones de las tecnologías de información y comunicación en las comunidades reales: cultura, lengua y emancipación [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/31381 / TESIS
257

Descortesía en La Casa de Papel : Un estudio sociopragmático del diálogo televisivo / Impoliteness in Money Heist : A sociopragmatic study of television dialogue

Harila Blomqvist, Linnéa January 2021 (has links)
Las series de la televisión son una fuente importante para el entendimiento de las estructuras lingüísticas y socioculturales de una lengua. Según muchos investigadores, el habla televisiva no puede ser tratada como lengua hablada real; según algunos, sí es posible. Otros argumentan que existen muchas diferencias entre el habla auténtica y el habla televisiva, pero que también tienen mucho en común. El objetivo de este trabajo es contribuir a un mayor entendimiento de cómo se puede investigar fenómenos sociopragmáticos mediante el diálogo televisivo, lo que esperamos lograr a través analizar la serie televisiva La Casa de Papel por muestras de descortesía usada. Para llevar a cabo esta investigación, veinticuatro escenas de la primera temporada de La Casa de Papel fueron recogidas y analizadas. La descortesía expresada fue clasificada según cinco categorías de descortesía y cinco categorías de respuesta ante la descortesía. Los resultados muestran que existen en el corpus ejemplos de cada categoría de descortesía propuesta, algo que indica que el habla de la televisión podría tener las mismas estructuras sociopragmáticas que el habla real. Aunque se necesita más estudios en el área para comprobarlo, argumentamos que el diálogo televisivo podría ser una fuente adecuada por investigaciones sociopragmáticas de la lengua hablada. / Television series are an important source for the understanding of the linguistic and sociocultural structures of a language. While some claim that television speak can not be treated like real spoken language, others claim the opposite. This study positions itself in the latter category. The objective of the present study is to contribute to a greater understanding of how one could investigate sociopragmatic phenomenons by using television dialogue as a source. This we hope to achieve by analyzing the impoliteness used in the television series La Casa de Papel. To accomplish this investigation, twenty four scenes from the first season of La Casa de Papel were gathered and analyzed. The expressed impoliteness in these scenes were later classified according to five categories of impoliteness and five categories of impoliteness responses. The results show that the corpus contain examples of every category of impoliteness proposed, which strengthens the claim that television dialogue can possess the same sociopragmatic structures as real spoken language. Although more studies in the area is needed to ascertain this claim, we argue that television dialogue could be an adequate source for sociopragmatic studies of spoken language.
258

Deep Neural Networks for Automatic Speech-To-Speech Translation of Open Educational Resources

Pérez González de Martos, Alejandro Manuel 12 July 2022 (has links)
[ES] En los últimos años, el aprendizaje profundo ha cambiado significativamente el panorama en diversas áreas del campo de la inteligencia artificial, entre las que se incluyen la visión por computador, el procesamiento del lenguaje natural, robótica o teoría de juegos. En particular, el sorprendente éxito del aprendizaje profundo en múltiples aplicaciones del campo del procesamiento del lenguaje natural tales como el reconocimiento automático del habla (ASR), la traducción automática (MT) o la síntesis de voz (TTS), ha supuesto una mejora drástica en la precisión de estos sistemas, extendiendo así su implantación a un mayor rango de aplicaciones en la vida real. En este momento, es evidente que las tecnologías de reconocimiento automático del habla y traducción automática pueden ser empleadas para producir, de forma efectiva, subtítulos multilingües de alta calidad de contenidos audiovisuales. Esto es particularmente cierto en el contexto de los vídeos educativos, donde las condiciones acústicas son normalmente favorables para los sistemas de ASR y el discurso está gramaticalmente bien formado. Sin embargo, en el caso de TTS, aunque los sistemas basados en redes neuronales han demostrado ser capaces de sintetizar voz de un realismo y calidad sin precedentes, todavía debe comprobarse si esta tecnología está lo suficientemente madura como para mejorar la accesibilidad y la participación en el aprendizaje en línea. Además, existen diversas tareas en el campo de la síntesis de voz que todavía suponen un reto, como la clonación de voz inter-lingüe, la síntesis incremental o la adaptación zero-shot a nuevos locutores. Esta tesis aborda la mejora de las prestaciones de los sistemas actuales de síntesis de voz basados en redes neuronales, así como la extensión de su aplicación en diversos escenarios, en el contexto de mejorar la accesibilidad en el aprendizaje en línea. En este sentido, este trabajo presta especial atención a la adaptación a nuevos locutores y a la clonación de voz inter-lingüe, ya que los textos a sintetizar se corresponden, en este caso, a traducciones de intervenciones originalmente en otro idioma. / [CA] Durant aquests darrers anys, l'aprenentatge profund ha canviat significativament el panorama en diverses àrees del camp de la intel·ligència artificial, entre les quals s'inclouen la visió per computador, el processament del llenguatge natural, robòtica o la teoria de jocs. En particular, el sorprenent èxit de l'aprenentatge profund en múltiples aplicacions del camp del processament del llenguatge natural, com ara el reconeixement automàtic de la parla (ASR), la traducció automàtica (MT) o la síntesi de veu (TTS), ha suposat una millora dràstica en la precisió i qualitat d'aquests sistemes, estenent així la seva implantació a un ventall més ampli a la vida real. En aquest moment, és evident que les tecnologies de reconeixement automàtic de la parla i traducció automàtica poden ser emprades per a produir, de forma efectiva, subtítols multilingües d'alta qualitat de continguts audiovisuals. Això és particularment cert en el context dels vídeos educatius, on les condicions acústiques són normalment favorables per als sistemes d'ASR i el discurs està gramaticalment ben format. No obstant això, al cas de TTS, encara que els sistemes basats en xarxes neuronals han demostrat ser capaços de sintetitzar veu d'un realisme i qualitat sense precedents, encara s'ha de comprovar si aquesta tecnologia és ja prou madura com per millorar l'accessibilitat i la participació en l'aprenentatge en línia. A més, hi ha diverses tasques al camp de la síntesi de veu que encara suposen un repte, com ara la clonació de veu inter-lingüe, la síntesi incremental o l'adaptació zero-shot a nous locutors. Aquesta tesi aborda la millora de les prestacions dels sistemes actuals de síntesi de veu basats en xarxes neuronals, així com l'extensió de la seva aplicació en diversos escenaris, en el context de millorar l'accessibilitat en l'aprenentatge en línia. En aquest sentit, aquest treball presta especial atenció a l'adaptació a nous locutors i a la clonació de veu interlingüe, ja que els textos a sintetitzar es corresponen, en aquest cas, a traduccions d'intervencions originalment en un altre idioma. / [EN] In recent years, deep learning has fundamentally changed the landscapes of a number of areas in artificial intelligence, including computer vision, natural language processing, robotics, and game theory. In particular, the striking success of deep learning in a large variety of natural language processing (NLP) applications, including automatic speech recognition (ASR), machine translation (MT), and text-to-speech (TTS), has resulted in major accuracy improvements, thus widening the applicability of these technologies in real-life settings. At this point, it is clear that ASR and MT technologies can be utilized to produce cost-effective, high-quality multilingual subtitles of video contents of different kinds. This is particularly true in the case of transcription and translation of video lectures and other kinds of educational materials, in which the audio recording conditions are usually favorable for the ASR task, and there is a grammatically well-formed speech. However, although state-of-the-art neural approaches to TTS have shown to drastically improve the naturalness and quality of synthetic speech over conventional concatenative and parametric systems, it is still unclear whether this technology is already mature enough to improve accessibility and engagement in online learning, and particularly in the context of higher education. Furthermore, advanced topics in TTS such as cross-lingual voice cloning, incremental TTS or zero-shot speaker adaptation remain an open challenge in the field. This thesis is about enhancing the performance and widening the applicability of modern neural TTS technologies in real-life settings, both in offline and streaming conditions, in the context of improving accessibility and engagement in online learning. Thus, particular emphasis is placed on speaker adaptation and cross-lingual voice cloning, as the input text corresponds to a translated utterance in this context. / Pérez González De Martos, AM. (2022). Deep Neural Networks for Automatic Speech-To-Speech Translation of Open Educational Resources [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/184019 / TESIS / Premios Extraordinarios de tesis doctorales
259

The trial in literature. A study of the legal aspects in three emblematic novels: The Posthumous Papers of the Pickwick Club, by Dickens; Billy Budd, by Melville; and The Bonfire of the Vanities, by Tom Wolfe / El proceso en la literatura. Análisis de los aspectos jurídicos de tres obras emblemáticas: Los papeles póstumos del Club Pickwick, de Dickens; Billy Budd, de Melville; y La hoguera de las vanidades, de Tom Wolfe

Zolezzi Ibárcena, Lorenzo 10 April 2018 (has links)
The plots of Billy Budd and The Bonfire of the Vanities are organized entirely around a lawsuit. In The Pickwick Papers the trial is only a part, though an important one, of a series of related adventures in which the main characters of the novel participate. In the three novels there is a trial in which the accused is found guilty, although he is actually innocent. In The Posthumous Papers of the Club Pickwick, the author’s main purpose is to present the operation of the legal system, in which the modus operandi of unscrupulous lawyers, who rely only on cheating and deceiving methods, is atthe beginning of and determines the outcome of the lawsuit. In Billy Budd, an innocent is sentenced to death in order to preserve a supposed higher interest: the common good. In The Bonfire of the Vanities, political factors, personal interests, resentments and other worldly elements determine the outcome of the trial. In the three cases, the watchmaking mechanism that a lawsuit appears to be is completely overcome by factors outside it. / Las tramas de Billy Budd y La hoguera de las vanidades están organizadas íntegramente alrededor de un juicio. En Los papeles póstumos del Club Pickwick, el proceso es una parte importante de la obra, pero también existen aventuras relacionadas en las que participan los diversos personajes. En los tres juicios se juzga a un inocente. En Los papeles póstumos del Club Pickwick, el autor busca presentar el funcionamiento real del sistema legal, en el cual el modus operandi de abogados inescrupulosos, quienes emplean únicamente métodos tramposos y fraudulentos, determina el origen y el resultado del proceso. En Billy Budd, un inocente es condenado a muerte para preservar un supuesto interés mayor: el bien común. En La hoguera de las vanidades, factores políticos, intereses personales, resentimientos y otros elementos de carácter mundano determinan el resultado del proceso. En los tres casos, el mecanismo de relojería que parece ser el proceso es totalmente sobrepasado por factores externos al mismo.
260

Los aspectos pragmáticos en manuales suecos de español como lengua extranjera : Su contribución al desarrollo de la competencia pragmática en el bachillerato / Pragmatic aspects in Swedish textbooks for Spanish as a foreign language : Their contribution in the upper secondary school to learners’ development of a pragmatic competence in Spanish

De Matos Lundström, Anna January 2013 (has links)
El objetivo de esta monografía es tratar de determinar en qué medida y de qué manera cuatro manuales didácticos suecos de español como lengua extranjera (ELE), usados en la enseñanza en el nivel de bachillerato, tratan aspectos pragmáticos. Además, evaluaremos el potencial y la relevancia de la información metapragmática y las actividades relacionadas a los aspectos pragmáticos para el proceso de adquisición de una competencia tanto metapragmática como pragmática. En este estudio se parte de la noción de la competencia pragmática como una destreza orientada a saber crear y comprender significados en la interacción de manera eficaz (Thomas, 1995), que supone, más que los conocimientos lingüísticos en una interacción intercultural, los conocimientos extralingüísticos (cf. Bravo, 2005). La hipótesis de partida de este trabajo postula que los manuales no explican a fondo por qué cierto lenguaje se utiliza en ciertos contextos y que el contenido pragmático sería poco variado y difícil de asimilar y que los ejercicios no estarían diseñados principalmente para desarrollar la competencia pragmática. Hasta cierta medida se puede decir que los resultados de esta investigación confirman la hipótesis: los manuales podrían efectivamente ser más exhaustivos en cuanto a los temas que abarcan, asimismo podrían variar y explicar más a fondo aquellos temas. No obstante, parece haber un esfuerzo de incorporar actividades comunicativas e información extralingüística, sin embargo, hace falta una conceptualización y progresión en cuanto a cómo tratar estos temas como el propósito principal. Ni siquiera se ofrecen en las guías del profesor modelos didácticos o información adicional, y por lo general, no se combina la información metapragmática en los manuales con actividades complementarias que pretenden desarrollar las destrezas comunicativas. / The purpose of this paper is to try to determine to what extent and in what way four Swedish textbooks on Spanish as a foreign language (SFL) treat pragmatic aspects, as well as to evaluate the potential and relevance of the metapragmatic information and activities related to pragmatic aspects provided by the textbooks, for the development of pragmatic awareness and competence in Spanish. This study parts from the notion of pragmatic competence as a skill of knowing how to create and understand meanings in interaction effectively (Thomas, 1995), which in intercultural interaction probably requires extra-linguistic knowledge more than language skills (cf. Bravo, 2005). The hypothesis postulated at the beginning of the study was that the manuals would not fully explain why certain language is being used in certain contexts, that the pragmatic content would be scarcely varied and rather difficult to assimilate and that the exercises would not be designed primarily to develop a pragmatic competence. To some extent it can be said that the hypothesis is confirmed: the manuals could have been more comprehensive in terms of the topics covered, they could also have varied and explained those issues further. Despite the fact that there seems to be an effort to incorporate extra-linguistic information and communicative activities, the results indicate that there is a lack of emphasis on or progression on how to treat these issues. For example, there are no didactic models or suggestions in the teacher’s guide, nor is additional information provided elsewhere; usually the metapragmatic information is not combined with any activities, and the activities that aim to develop communicative skills are not combined with further metapragmatic information.

Page generated in 0.0241 seconds