461 |
Hipusinación del factor de traducción eIF5A dependiente de poliaminasBelda Palazón, Borja 30 March 2015 (has links)
RESUMEN
La hipusinación es una modificación post-traduccional dependiente de espermidina
que activa al factor de traducción eIF5A, y que es esencial en todos los eucariotas.
En los últimos años se ha sugerido un importante papel para eIF5A en los procesos
de senescencia y respuesta a estrés ambiental en plantas, en el establecimiento de la
polaridad celular en levadura y su implicación en enfermedades tales como
diabetes, VIH-1 o cáncer en humanos. Con el objetivo de caracterizar a nivel
molecular la actividad biológica de eIF5A en plantas, hemos establecido una
metodología basada en técnicas bioquímicas e inmunológicas para determinar el
patrón de hipusinación de eIF5A en A. thaliana. La puesta a punto de esta
metodología nos ha permitido demostrar que el tratamiento con ácido abscísico
inhibe la activación por hipusinación de la isoforma eIF5A1. Además, para tratar
de estudiar la función de eIF5A durante el desarrollo de A. thaliana, hemos
realizado estudios funcionales basados en la caracterización de plantas transgénicas
capaces de desactivar genéticamente la ruta dependiente de eIF5A mediante ARN
de interferencia, condicionado a la aplicación de dexametasona. La desactivación
condicional de la enzima de hipusinación desoxihipusina sintasa, produjo
alteraciones durante el desarrollo y en respuesta a condiciones adversas de
crecimiento, tales como floración temprana, inhibición del crecimiento de la raíz,
alteraciones en los pelos radiculares, ramificación exacerbada del tallo, presencia
de elementos traqueales completamente lignificados en hipocotilos, niveles
reducidos de óxido nítrico e hipersensibilidad al ácido abscísico, sal y glucosa.
Recientemente se ha demostrado que eIF5A es necesario para la traducción de
proteínas con más de 3 prolinas sucesivas en su secuencia. El análisis de ontología
realizado reveló un enriquecimiento de proteínas con poli-prolinas entre las
implicadas en la organización del citoesqueleto de actina. La alteración de la
actividad de eIF5A provocó defectos en la estructuración de los filamentos de
actina en A. thaliana, S. cerevisiae y H. sapiens. El estudio de mutantes
termosensibles de levadura demostró el requerimiento de eIF5A durante el proceso
de reproducción sexual a través de la traducción de la formina Bni1. Los
experimentos de regulación traduccional en células HeLa demostraron que el
silenciamiento vía ARN de interferencia de eIF5A1 provocaba un defecto en la tasa
de traducción de la formina FMNL1 y la proteína ezrina. Estos resultados
confirman que la actividad esencial de eIF5A en el ribosoma parece conservada en
organismos eucariotas, y afecta fundamentalmente a proteínas con poli-prolinas
implicadas en la organización del citoesqueleto de actina. / Belda Palazón, B. (2014). Hipusinación del factor de traducción eIF5A dependiente de poliaminas [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/48474
|
462 |
Paisajes y utopías. Traducción visual de imaginarios en contextos de migración e interculturalidad. Tres casos de estudioCorzo Morales, Maricely 21 March 2016 (has links)
[EN] Landscapes and Utopias.
Visual translation of imagery within migration and intercultural contexts.
Three case studies
(Summary)
Analysis of three projects run between 2010 and 2013 from an interdisciplinary perspective, including theories of Human Scale Development and the principles of post-development, as well as the evolution of hybrid artistic practices in line with new genre public art and community aesthetics, is the purpose of the current investigation. We make use of these theories since they represent an extension or expansion of the way they approach their subjects of study, which allows us to point towards a methodology where the processes of visual creation allow a broader look at research projects within the social sciences and development contexts.
This dialogic analysis of case studies enables us to point out the potentialities that these creative processes course, from the perspective of desire and resistance. All case studies have the city of Valencia as a starting place but the different phases of the methodology of visual translation extend the work and imagery references into the reality of several Latin American countries, primarily from Colombia and the Dominican Republic. / [ES] Paisajes y Utopías.
Traducción visual de imaginarios en contextos de migración e interculturalidad.
Tres casos de estudio
(Resumen)
El análisis de tres proyectos realizados entre 2010 y 2013 desde una perspectiva interdisciplinar, que incluye las teorías del Desarrollo a Escala Humana y los postulados del posdesarrollo, así como la evolución de las prácticas artísticas híbridas en la línea del arte público de nuevo género y las estéticas comunitarias, es el propósito de la presente investigación. Nos servimos de dichas teorías porque suponen una ampliación o expansión de la forma en la que abordan sus temas de estudio y esto nos permite apuntar hacia una metodología donde los procesos de creación visual posibiliten una mirada más extensa en proyectos de investigación en ciencias sociales y en contextos de desarrollo.
Este análisis dialógico de los casos de estudio nos permite señalar las potencialidades que desde el ámbito de los deseos y la resistencia, atraviesan estos procesos creativos. Todos los casos de estudio tienen como lugar de partida la ciudad de Valencia pero las distintas fases de la metodología de traducción visual extienden el trabajo y las referencias respecto a los imaginarios hasta realidades de varios países latinoamericanos, principalmente de Colombia y República Dominicana. / [CA] Paisatges i Utopies.
Traducció visual d'imaginaris en contextos de migració i interculturalitat.
Tres casos d'estudi
(Resum)
L'anàlisi de tres projectes realitzats entre 2010 i 2013 des d'una perspectiva interdisciplinària, que inclou les teories del Desenvolupament a Escala Humana i els postulats del postdesenvolupament, així com l'evolució de les pràctiques artístiques híbrides en la línia de l'art públic de nou gènere i de les estètiques comunitàries, és el propòsit de la present investigació. Ens servim d'aquestes teories perquè suposen una ampliació o expansió de la forma en què aborden els seus temes d'estudi i això ens permet apuntar cap a una metodologia on els processos de creació visual possibiliten una mirada més extensa en projectes d'investigació en ciències socials i en contextos de desenvolupament.
Aquesta anàlisi dialògica dels casos d'estudi ens permet assenyalar les potencialitats que des de l'àmbit dels desitjos i de la resistència, travessen aquests processos creatius. Tots els casos d'estudi tenen com a lloc de partida la ciutat de València però les diferents fases de la metodologia de traducció visual estenen el treball i les referències que fa als imaginaris fins realitats de diversos països llatinoamericans, principalment les de Colòmbia i República Dominicana. / Corzo Morales, M. (2016). Paisajes y utopías. Traducción visual de imaginarios en contextos de migración e interculturalidad. Tres casos de estudio [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61963
|
463 |
Interactivity, Adaptation and Multimodality in Neural Sequence-to-sequence LearningPeris Abril, Álvaro 07 January 2020 (has links)
[ES] El problema conocido como de secuencia a secuencia consiste en transformar una secuencia de entrada en una secuencia de salida. Bajo esta perspectiva se puede atacar una amplia cantidad de problemas, entre los cuales destacan la traducción automática o la descripción automática de objetos multimedia. La aplicación de redes neuronales profundas ha revolucionado esta disciplina, y se han logrado avances notables. Pero los sistemas automáticos todavía producen predicciones que distan mucho de ser perfectas. Para obtener predicciones de gran calidad, los sistemas automáticos se utilizan bajo la supervisión de un humano, quien corrige los errores. Esta tesis se centra principalmente en el problema de la traducción del lenguaje natural, usando modelos enteramente neuronales. Nuestro objetivo es desarrollar sistemas de traducción neuronal más eficientes. asentándonos sobre dos pilares fundamentales: cómo utilizar el sistema de una forma más eficiente y cómo aprovechar datos generados durante la fase de explotación del mismo.
En el primer caso, aplicamos el marco teórico conocido como predicción interactiva a la traducción automática neuronal. Este proceso consiste en integrar usuario y sistema en un proceso de corrección cooperativo, con el objetivo de reducir el esfuerzo humano empleado en obtener traducciones de alta calidad. Desarrollamos distintos protocolos de interacción para dicha tecnología, aplicando interacción basada en prefijos y en segmentos, implementados modificando el proceso de búsqueda del sistema. Además, ideamos mecanismos para obtener una interacción con el sistema más precisa, manteniendo la velocidad de generación del mismo. Llevamos a cabo una extensa experimentación, que muestra el potencial de estas técnicas: superamos el estado del arte anterior por un gran margen y observamos que nuestros sistemas reaccionan mejor a las interacciones humanas.
A continuación, estudiamos cómo mejorar un sistema neuronal mediante los datos generados como subproducto de este proceso de corrección. Para ello, nos basamos en dos paradigmas del aprendizaje automático: el aprendizaje muestra a muestra y el aprendizaje activo. En el primer caso, el sistema se actualiza inmediatamente después de que el usuario corrige una frase, aprendiendo de una manera continua a partir de correcciones, evitando cometer errores previos y especializándose en un usuario o dominio concretos. Evaluamos estos sistemas en una gran cantidad de situaciones y dominios diferentes, que demuestran el potencial que tienen los sistemas adaptativos. También llevamos a cabo una evaluación humana, con traductores profesionales. Éstos quedaron muy satisfechos con el sistema adaptativo. Además, fueron más eficientes cuando lo usaron, comparados con un sistema estático. El segundo paradigma lo aplicamos en un escenario en el que se deban traducir grandes cantidades de frases, siendo inviable la supervisión de todas. El sistema selecciona aquellas muestras que vale la pena supervisar, traduciendo el resto automáticamente. Aplicando este protocolo, redujimos de aproximadamente un cuarto el esfuerzo humano necesario para llegar a cierta calidad de traducción.
Finalmente, atacamos el complejo problema de la descripción de objetos multimedia. Este problema consiste en describir en lenguaje natural un objeto visual, una imagen o un vídeo. Comenzamos con la tarea de descripción de vídeos pertenecientes a un dominio general. A continuación, nos movemos a un caso más específico: la descripción de eventos a partir de imágenes egocéntricas, capturadas a lo largo de un día. Buscamos extraer relaciones entre eventos para generar descripciones más informadas, desarrollando un sistema capaz de analizar un mayor contexto. El modelo con contexto extendido genera descripciones de mayor calidad que un modelo básico. Por último, aplicamos la predicción interactiva a estas tareas multimedia, disminuyendo el esfuerzo necesa / [CA] El problema conegut com a de seqüència a seqüència consisteix en transformar una seqüència d'entrada en una seqüència d'eixida. Seguint aquesta perspectiva, es pot atacar una àmplia quantitat de problemes, entre els quals destaquen la traducció automàtica, el reconeixement automàtic de la parla o la descripció automàtica d'objectes multimèdia. L'aplicació de xarxes neuronals profundes ha revolucionat aquesta disciplina, i s'han aconseguit progressos notables. Però els sistemes automàtics encara produeixen prediccions que disten molt de ser perfectes. Per a obtindre prediccions de gran qualitat, els sistemes automàtics són utilitzats amb la supervisió d'un humà, qui corregeix els errors. Aquesta tesi se centra principalment en el problema de la traducció de llenguatge natural, el qual s'ataca emprant models enterament neuronals. El nostre objectiu principal és desenvolupar sistemes més eficients. Per a aquesta tasca, les nostres contribucions s'assenten sobre dos pilars fonamentals: com utilitzar el sistema d'una manera més eficient i com aprofitar dades generades durant la fase d'explotació d'aquest.
En el primer cas, apliquem el marc teòric conegut com a predicció interactiva a la traducció automàtica neuronal. Aquest procés consisteix en integrar usuari i sistema en un procés de correcció cooperatiu, amb l'objectiu de reduir l'esforç humà emprat per obtindre traduccions d'alta qualitat. Desenvolupem diferents protocols d'interacció per a aquesta tecnologia, aplicant interacció basada en prefixos i en segments, implementats modificant el procés de cerca del sistema. A més a més, busquem mecanismes per a obtindre una interacció amb el sistema més precisa, mantenint la velocitat de generació. Duem a terme una extensa experimentació, que mostra el potencial d'aquestes tècniques: superem l'estat de l'art anterior per un gran marge i observem que els nostres sistemes reaccionen millor a les interacciones humanes.
A continuació, estudiem com millorar un sistema neuronal mitjançant les dades generades com a subproducte d'aquest procés de correcció. Per a això, ens basem en dos paradigmes de l'aprenentatge automàtic: l'aprenentatge mostra a mostra i l'aprenentatge actiu. En el primer cas, el sistema s'actualitza immediatament després que l'usuari corregeix una frase. Per tant, el sistema aprén d'una manera contínua a partir de correccions, evitant cometre errors previs i especialitzant-se en un usuari o domini concrets. Avaluem aquests sistemes en una gran quantitat de situacions i per a dominis diferents, que demostren el potencial que tenen els sistemes adaptatius. També duem a terme una avaluació amb traductors professionals, qui varen quedar molt satisfets amb el sistema adaptatiu. A més, van ser més eficients quan ho van usar, si ho comparem amb el sistema estàtic. Pel que fa al segon paradigma, l'apliquem per a l'escenari en el qual han de traduir-se grans quantitats de frases, i la supervisió de totes elles és inviable. En aquest cas, el sistema selecciona les mostres que paga la pena supervisar, traduint la resta automàticament. Aplicant aquest protocol, reduírem en aproximadament un quart l'esforç necessari per a arribar a certa qualitat de traducció.
Finalment, ataquem el complex problema de la descripció d'objectes multimèdia. Aquest problema consisteix en descriure, en llenguatge natural, un objecte visual, una imatge o un vídeo. Comencem amb la tasca de descripció de vídeos d'un domini general. A continuació, ens movem a un cas més específic: la descripció d''esdeveniments a partir d'imatges egocèntriques, capturades al llarg d'un dia. Busquem extraure relacions entre ells per a generar descripcions més informades, desenvolupant un sistema capaç d'analitzar un major context. El model amb context estés genera descripcions de major qualitat que el model bàsic. Finalment, apliquem la predicció interactiva a aquestes tasques multimèdia, di / [EN] The sequence-to-sequence problem consists in transforming an input sequence into an output sequence. A variety of problems can be posed in these terms, including machine translation, speech recognition or multimedia captioning. In the last years, the application of deep neural networks has revolutionized these fields, achieving impressive advances. However and despite the improvements, the output of the automatic systems is still far to be perfect. For achieving high-quality predictions, fully-automatic systems require to be supervised by a human agent, who corrects the errors. This is a common procedure in the translation industry. This thesis is mainly framed into the machine translation problem, tackled using fully neural systems. Our main objective is to develop more efficient neural machine translation systems, that allow for a more productive usage and deployment of the technology. To this end, we base our contributions on two main cornerstones: how to better use of the system and how to better leverage the data generated along its usage.
First, we apply the so-called interactive-predictive framework to neural machine translation. This embeds the human agent and the system into a cooperative correction process, that seeks to reduce the human effort spent for obtaining high-quality translations. We develop different interactive protocols for the neural machine translation technology, namely, a prefix-based and a segment-based protocols. They are implemented by modifying the search space of the model. Moreover, we introduce mechanisms for achieving a fine-grained interaction while maintaining the decoding speed of the system. We carried out a wide experimentation that shows the potential of our contributions. The previous state of the art is overcame by a large margin and the current systems are able to react better to the human interactions.
Next, we study how to improve a neural system using the data generated as a byproduct of this correction process. To this end, we rely on two main learning paradigms: online and active learning. Under the first one, the system is updated on the fly, as soon as a sentence is corrected. Hence, the system is continuously learning from the corrections, avoiding previous errors and specializing towards a given user or domain. A large experimentation stressed the adaptive systems under different conditions and domains, demonstrating the capabilities of adaptive systems. Moreover, we also carried out a human evaluation of the system, involving professional users. They were very pleased with the adaptive system, and worked more efficiently using it. The second paradigm, active learning, is devised for the translation of huge amounts of data, that are infeasible to being completely supervised. In this scenario, the system selects samples that are worth to be supervised, and leaves the rest automatically translated. Applying this framework, we obtained reductions of approximately a quarter of the effort required for reaching a desired translation quality. The neural approach also obtained large improvements compared with previous translation technologies.
Finally, we address another challenging problem: visual captioning. It consists in generating a description in natural language from a visual object, namely an image or a video. We follow the sequence-to-sequence framework, under a a multimodal perspective. We start by tackling the task of generating captions of videos from a general domain. Next, we move on to a more specific case: describing events from egocentric images, acquired along the day. Since these events are consecutive, we aim to extract inter-eventual relationships, for generating more informed captions. The context-aware model improved the generation quality with respect to a regular one. As final point, we apply the intractive-predictive protocol to these multimodal captioning systems, reducing the effort required for correcting the outputs. / Section 5.4 describes an user evaluation of an adaptive translation system. This
was done in collaboration with Miguel Domingo and the company Pangeanic, with
funding from the Spanish Center for Technological and Industrial Development (Centro para el Desarrollo Tecnológico Industrial). [...]
Most of Chapter 6 is the result of a collaboration with Marc Bolaños, supervised
by Prof. Petia Radeva, from Universitat de Barcelona/CVC. This collaboration was
supported by the R-MIPRCV network, under grant TIN2014-54728-REDC. / Peris Abril, Á. (2019). Interactivity, Adaptation and Multimodality in Neural Sequence-to-sequence Learning [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/134058
|
464 |
Evaluación de la calidad de la traducción automática de reseñas turísticas en línea desde la perspectiva de la localizaciónRosa Sorlozano, Maria Carmen 21 June 2024 (has links)
[ES] Los usuarios de internet han pasado a ser contribuidores activos en la Web 2.0. Estudios recientes revelan que siete de cada 10 usuarios de internet en todo el mundo confían en la opinión y las reseñas publicadas en línea por otros usuarios. De la misma forma, según estadísticas recientes de las agencias españolas de turismo, el uso de internet ha crecido más de un 29 %: casi todos los usuarios (99,2 %) lo usan para buscar información, un 76,5 % lo usa para hacer reservas y el 52,4 % para el pago de servicios. A pesar del gran potencial y el volumen de negocio de este sector, las plataformas de reseñas (tanto de viajes como de reservas de restaurantes) solo utilizan la traducción automática (TA) de las opiniones que los consumidores dejan en dichas páginas sin procesamiento ni revisión. En paralelo, los estudios de traducción han concedido un papel clave durante los últimos 30 años a la subdisciplina de la localización, consistente en adaptar el mensaje a las preferencias lingüísticas y culturales específicas del usuario. Por este motivo, esta investigación se centra en el análisis de un corpus de reseñas traducidas automáticamente para identificar patrones de error y sus efectos en la calidad del texto según parámetros estudiados en la localización. Áreas como el turismo, las finanzas y el marketing podrían verse beneficiadas si mejoran sus procesos de traducción, puesto que un mejor entendimiento de los servicios anunciados facilita la interacción del consumidor con dichos productos y servicios. / [CA] Els usuaris d'internet han passat a ser contribuïdors actius en la Web 2.0. Estudis recents revelen que set de cada 10 usuaris d'internet a tot el món confien en l'opinió i les ressenyes publicades en línia per altres usuaris. De la mateixa forma, segons estadístiques recents de les agències espanyoles de turisme, l'ús d'internet ha crescut més d'un 29%: quasi tots els usuaris (99,2%) l'utilitzen per a buscar informació, un 76,5% l'usa per a fer reserves i el 52,4% per al pagament de servicis. Malgrat el gran potencial i el volum de negoci d'este sector, les plataformes de ressenyes (tant de viatges com de reserves de restaurants) només utilitzen la traducció automàtica (TA) de les opinions que els consumidors deixen en estes pàgines sense processament ni revisió. En paral·lel, els estudis de traducció han concedit un paper clau durant els últims 30 anys a la subdisciplina de la localització, consistent a adaptar el missatge a les preferències lingüístiques i culturals específiques de l'usuari. Per aquest motiu, esta investigació se centra en l'anàlisi d'un corpus de ressenyes traduïdes automàticament per a identificar patrons d'error i els seus efectes en la qualitat del text segons paràmetres estudiats en la localització. Àrees com el turisme, les finances i el màrqueting podrien veure's beneficiades si milloren els seus processos de traducció, ja que un millor enteniment dels servicis anunciats facilita la interacció del consumidor amb aquests productes i servicis. / [EN] Internet users have become active contributors to the Web 2.0. Recent studies reveal that seven out of 10 internet users worldwide rely on the opinions and reviews posted online by other users. Similarly, according to recent statistics from the main Spanish tourism agencies, Internet usage has grown by more than 29%: almost all users (99.2%) use it to search for information, 76.5% use it to make reservations and 52.4% use it to pay for services. Despite the great potential and turnover of this sector, review platforms (both for travel and restaurant reservations) only use machine translation (MT) of the reviews that consumers leave on these pages without processing or review. In parallel, translation studies have attributed a major role over the last 30 years to the sub-discipline of localization, which consists of adapting the message to the user's specific linguistic and cultural preferences. For this reason, this research focuses on the analysis of a corpus of machine-translated reviews to identify error patterns and their effects on text quality according to parameters studied in localization. Areas such as tourism, finance and marketing could benefit from improving their translation processes, since a better understanding of the advertised services facilitates consumer interaction with those services. / Rosa Sorlozano, MC. (2024). Evaluación de la calidad de la traducción automática de reseñas turísticas en línea desde la perspectiva de la localización [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/205487
|
465 |
El concepto de marcador estructural: su aplicación en el discurso poético de Phipil LarkinAlou Ramis, Damià 09 May 2008 (has links)
La presente tesis consta de dos partes principales. En la primera se pretende definir y delimitar el concepto de marcador estructural como herramienta de análisis textual aplicada a la traducción poética. Tras una aproximación a la especificidad del texto poético, y tras repasar las principales aportaciones teóricas a la traducción poética, identificamos los marcadores estructurales con los rasgos estilísticos que marcan el armazón semántico del texto.Posteriormente, se aplica el análisis basado en los marcadores estructurales a 21 poemas de Philip Larkin, seleccionados por temas. El producto práctico de este análisis es la traducción al castellano de cada poema, acompañada de un mapa donde figuran los rasgos que forman la estructura; y el producto teórico una caracterización estilística de la poesía de Larkin, representada en un mapa donde figuran sus principales rasgos estilístico. También se aporta un esbozo de crítica de la traducción basado en dicha herramienta. / This dissertation consists of two parts. The first one is an attempt to define and delimit the concept of structural marker as a tool of text analysis applied to poetic translation. After dealing with the specificity of the poetic text and re-examining the main theories about poetic translation, structural markers are identified with the stylistic features that mark the semantic frame of the text.Afterwards, we apply the analysis based on the structural markers to 21 poems by Philip Larkin, put into groups by themes. The practical outcome of this analysis the translation to Spanish of this poems, accompanied with a map where the main structural features can be seen; and the theoretical outcome is a stylistic characterisation of Larkin's poetry, which we represent in a stylistic map.We also find an outline of translation criticism based in this tool called structural marker.
|
466 |
Deep Neural Networks for Automatic Speech-To-Speech Translation of Open Educational ResourcesPérez González de Martos, Alejandro Manuel 12 July 2022 (has links)
[ES] En los últimos años, el aprendizaje profundo ha cambiado significativamente el panorama en diversas áreas del campo de la inteligencia artificial, entre las que se incluyen la visión por computador, el procesamiento del lenguaje natural, robótica o teoría de juegos. En particular, el sorprendente éxito del aprendizaje profundo en múltiples aplicaciones del campo del procesamiento del lenguaje natural tales como el reconocimiento automático del habla (ASR), la traducción automática (MT) o la síntesis de voz (TTS), ha supuesto una mejora drástica en la precisión de estos sistemas, extendiendo así su implantación a un mayor rango de aplicaciones en la vida real. En este momento, es evidente que las tecnologías de reconocimiento automático del habla y traducción automática pueden ser empleadas para producir, de forma efectiva, subtítulos multilingües de alta calidad de contenidos audiovisuales. Esto es particularmente cierto en el contexto de los vídeos educativos, donde las condiciones acústicas son normalmente favorables para los sistemas de ASR y el discurso está gramaticalmente bien formado. Sin embargo, en el caso de TTS, aunque los sistemas basados en redes neuronales han demostrado ser capaces de sintetizar voz de un realismo y calidad sin precedentes, todavía debe comprobarse si esta tecnología está lo suficientemente madura como para mejorar la accesibilidad y la participación en el aprendizaje en línea. Además, existen diversas tareas en el campo de la síntesis de voz que todavía suponen un reto, como la clonación de voz inter-lingüe, la síntesis incremental o la adaptación zero-shot a nuevos locutores. Esta tesis aborda la mejora de las prestaciones de los sistemas actuales de síntesis de voz basados en redes neuronales, así como la extensión de su aplicación en diversos escenarios, en el contexto de mejorar la accesibilidad en el aprendizaje en línea. En este sentido, este trabajo presta especial atención a la adaptación a nuevos locutores y a la clonación de voz inter-lingüe, ya que los textos a sintetizar se corresponden, en este caso, a traducciones de intervenciones originalmente en otro idioma. / [CA] Durant aquests darrers anys, l'aprenentatge profund ha canviat significativament el panorama en diverses àrees del camp de la intel·ligència artificial, entre les quals s'inclouen la visió per computador, el processament del llenguatge natural, robòtica o la teoria de jocs. En particular, el sorprenent èxit de l'aprenentatge profund en múltiples aplicacions del camp del processament del llenguatge natural, com ara el reconeixement automàtic de la parla (ASR), la traducció automàtica (MT) o la síntesi de veu (TTS), ha suposat una millora dràstica en la precisió i qualitat d'aquests sistemes, estenent així la seva implantació a un ventall més ampli a la vida real. En aquest moment, és evident que les tecnologies de reconeixement automàtic de la parla i traducció automàtica poden ser emprades per a produir, de forma efectiva, subtítols multilingües d'alta qualitat de continguts audiovisuals. Això és particularment cert en el context dels vídeos educatius, on les condicions acústiques són normalment favorables per als sistemes d'ASR i el discurs està gramaticalment ben format. No obstant això, al cas de TTS, encara que els sistemes basats en xarxes neuronals han demostrat ser capaços de sintetitzar veu d'un realisme i qualitat sense precedents, encara s'ha de comprovar si aquesta tecnologia és ja prou madura com per millorar l'accessibilitat i la participació en l'aprenentatge en línia. A més, hi ha diverses tasques al camp de la síntesi de veu que encara suposen un repte, com ara la clonació de veu inter-lingüe, la síntesi incremental o l'adaptació zero-shot a nous locutors. Aquesta tesi aborda la millora de les prestacions dels sistemes actuals de síntesi de veu basats en xarxes neuronals, així com l'extensió de la seva aplicació en diversos escenaris, en el context de millorar l'accessibilitat en l'aprenentatge en línia. En aquest sentit, aquest treball presta especial atenció a l'adaptació a nous locutors i a la clonació de veu interlingüe, ja que els textos a sintetitzar es corresponen, en aquest cas, a traduccions d'intervencions originalment en un altre idioma. / [EN] In recent years, deep learning has fundamentally changed the landscapes of a number of areas in artificial intelligence, including computer vision, natural language processing, robotics, and game theory. In particular, the striking success of deep learning in a large variety of natural language processing (NLP) applications, including automatic speech recognition (ASR), machine translation (MT), and text-to-speech (TTS), has resulted in major accuracy improvements, thus widening the applicability of these technologies in real-life settings. At this point, it is clear that ASR and MT technologies can be utilized to produce cost-effective, high-quality multilingual subtitles of video contents of different kinds. This is particularly true in the case of transcription and translation of video lectures and other kinds of educational materials, in which the audio recording conditions are usually favorable for the ASR task, and there is a grammatically well-formed speech. However, although state-of-the-art neural approaches to TTS have shown to drastically improve the naturalness and quality of synthetic speech over conventional concatenative and parametric systems, it is still unclear whether this technology is already mature enough to improve accessibility and engagement in online learning, and particularly in the context of higher education. Furthermore, advanced topics in TTS such as cross-lingual voice cloning, incremental TTS or zero-shot speaker adaptation remain an open challenge in the field. This thesis is about enhancing the performance and widening the applicability of modern neural TTS technologies in real-life settings, both in offline and streaming conditions, in the context of improving accessibility and engagement in online learning. Thus, particular emphasis is placed on speaker adaptation and cross-lingual voice cloning, as the input text corresponds to a translated utterance in this context. / Pérez González De Martos, AM. (2022). Deep Neural Networks for Automatic Speech-To-Speech Translation of Open Educational Resources [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/184019 / Premios Extraordinarios de tesis doctorales
|
467 |
Streaming Neural Speech TranslationIranzo Sánchez, Javier 03 November 2023 (has links)
Tesis por compendio / [ES] Gracias a avances significativos en aprendizaje profundo, la traducción del habla (ST) se ha convertido en un campo consolidado, lo que permite la utilización de la tecnología ST en soluciones para entornos de producción. Como consecuencia del aumento constante del número de horas de contenido audiovisual generado cada año, así como una mayor sensibilización sobre la importancia de la accesibilidad, la ST está preparada para convertirse en un elemento clave para la producción de contenidos audiovisuales, tanto de ocio como educativos.
A pesar de que se ha progresado significativamente en ST, la mayor parte de la investigación se ha centrado en el escenario en diferido (offline), en el cual todo el audio de entrada está disponible. En cambio, la ST en directo (online) es una temática en la que falta mucho por investigar. En concreto, existe un caso de traducción en directo, la traducción continua (streaming), que traduce un flujo continuo de palabras en tiempo real y bajo unas estrictas condiciones de latencia. Este es un problema mucho más realista, que es necesario resolver para que sea posible aplicar la ST a una variedad de tareas de la vida real.
Esta tesis está centrada en investigar y desarrollar las técnicas claves que son necesarias para una solución de ST continua. En primer lugar, de cara a permitir el desarrollo y la evaluación de sistemas de ST, se ha recopilado un nuevo conjunto de datos para ST multilingüe, que expande significativamente el número de horas disponibles para ST. A continuación se ha desarrollado un segmentador preparado para la condición continua, que se utiliza para segmentar las transcripciones intermedias de nuestra solución por etapas, que consiste en un sistema de reconocimiento automático del habla (ASR), seguido de un sistema de traducción automática (MT) encargado de traducir las transcripciones intermedias al idioma de destino elegido. Diversas investigaciones han concluido que la calidad de la segmentación es un factor muy influyente es la calidad del sistema MT, por lo que el desarrollo de un segmentador efectivo es un paso fundamental en el proceso de ST continua. Este segmentador se ha integrado en la solución por etapas, y estas se optimizan de manera conjunta para alcanzar el equilibrio óptimo entre calidad y latencia.
La ST continua tiene unas restricciones de latencia mucho más estrictas que la ST en directo, ya que el nivel deseado de latencia tiene que mantenerse durante todo el proceso de traducción. Por tanto, es crucial ser capaz de medir de manera precisa esta latencia, pero las métricas estándar de ST en directo no se adaptan bien a esta tarea. Como consecuencia de esto, se proponen nuevos métodos para la evaluación de ST continua, que garantizan unos resultados precisos a la vez que interpretables.
Por último, se presenta un nuevo método para mejorar la calidad de la traducción continua mediante el uso de información contextual. Mientras que los sistemas tradicionales de ST en directo traducen audios de manera aislada, existe abundante información contextual que está disponible para mejorar los sistemas de ST continua. Nuestra propuesta introduce el concepto de historia continua, que consiste en el almacenamiento de la información más reciente del proceso de traducción, que se utiliza más adelante por el modelo para mejorar la calidad de la traducción. / [CA] Gràcies a avanços significatius en aprenentatge profund, la traducció de la parla (ST) s'ha convertit en un camp consolidat, la qual cosa permet la utilització de la tecnologia ST en solucions per a entorns de producció. A conseqüència de l'augment constant del nombre d'hores de contingut audiovisual generat cada any, així com una major sensibilització sobre la importància de l'accessibilitat, la ST està preparada per a convertir-se en un element clau per a la producció de continguts audiovisuals, tant d'oci com educatius.
A pesar que s'ha progressat significativament en ST, la major part de la recerca s'ha centrat en l'escenari en diferit, en el qual tot l'àudio d'entrada està disponible. En canvi, la ST en directe és una temàtica en la qual falta molt per investigar. En concret, existeix un cas de traducció en directe, la traducció contínua, que tradueix un flux continu de paraules en temps real i sota unes estrictes condicions de latència. Aquest és un problema molt més realista, que és necessari resoldre perquè sigui possible aplicar la ST a una varietat de tasques de la vida real.
Aquesta tesi està centrada en investigar i desenvolupar les tècniques claus que són necessàries per a una solució de ST contínua. En primer lloc, de cara a permetre el desenvolupament i l'avaluació de sistemes de ST, s'ha recopilat un nou conjunt de dades per a ST multilingüe, que expandeix significativament la quantitat de dades disponibles per a ST. A continuació s'ha desenvolupat un segmentador preparat per a la condició contínua, que s'utilitza per a segmentar les transcripcions intermèdies de la nostra solució per etapes, que consisteix en un sistema de reconeixement automàtic de la parla (ASR), seguit d'un sistema de traducció automàtica (MT) encarregat de traduir les transcripcions intermèdies a l'idioma de destí triat. Diveros treballs de recerca han conclòs que la qualitat de la segmentació és un factor molt important en la qualitat del sistema MT, per la qual cosa el desenvolupament d'un segmentador efectiu és un pas fonamental en el procés de ST contínua. Aquest segmentador s'ha integrat en la solució per etapes, i aquestes s'optimitzen de manera conjunta per a aconseguir l'equilibri òptim entre qualitat i latència.
La ST contínua té unes restriccions de latència molt més estrictes que la ST en directe, ja que el nivell desitjat de latència ha de mantindre's durant tot el procés de traducció. Per tant, és crucial ser capaç de mesurar de manera precisa aquesta latència, però les mètriques estàndard de ST en directe no s'adapten bé a aquesta tasca. A conseqüència d'això, es proposen nous mètodes per a l'avaluació de ST contínua, que garanteixen uns resultats precisos alhora que interpretables.
Finalment, es presenta un nou mètode per a millorar la qualitat de la traducció contínua mitjançant l'ús d'informació contextual. Mentre que els sistemes tradicionals de ST en directe tradueixen àudios de manera aïllada, existeix abundant informació contextual que està disponible per a millorar els sistemes de ST contínua. La nostra proposta introdueix el concepte d'història contínua, que consisteix en l'emmagatzematge de la informació més recent del procés de traducció, que s'utilitza més endavant pel model per a millorar la qualitat de la traducció. / [EN] Thanks to significant advances in Deep Learning, Speech Translation (ST) has become a mature field that enables the use of ST technology in production-ready solutions. Due to the ever-increasing hours of audio-visual content produced each year, as well as higher awareness of the importance of media accessibility, ST is poised to become a key element for the production of entertainment and educational media.
Although significant advances have been made in ST, most research has focused on the offline scenario, where the entire input audio is available. In contrast, online ST remains an under-researched topic. A special case of online ST, streaming ST, translates an unbounded input stream in a real-time fashion under strict latency constraints. This is a much more realistic problem that needs to be solved in order to apply ST to a variety of real-life tasks.
The focus of this thesis is on researching and developing key techniques necessary for a successful streaming ST solution. First, in order to enable ST system development and evaluation, a new multilingual ST dataset is collected, which significantly expands the amount of hours available for ST. Then, a streaming-ready segmenter component is developed to segment the intermediate transcriptions of our proposed cascade solution, which consists in an Automatic Speech Recognition (ASR) system that transcribes the audio, followed by a Machine Translation (MT) system that translates the intermediate transcriptions into the desired language. Research has shown that segmentation quality plays a significant role in downstream MT performance, so the development of an effective streaming segmenter is a critical step in the streaming ST process. This segmenter is then integrated and the components of the cascade are jointly optimized to achieve an appropriate quality-latency trade-off.
Streaming ST has much more strict latency constraints than standard online ST, as the desired latency level must be maintained during the whole translation process. Therefore, it is crucial to be able to accurately measure this latency, but the standard online ST metrics are not well suited for this task. As a consequence, new evaluation methods are proposed for streaming ST evaluation, which ensure realistic, yet interpretable results.
Lastly, a novel method is presented for improving translation quality through the use of contextual information. Whereas standard online ST systems translate audios in isolation, there is a wealth of contextual information available for improving streaming ST systems. Our approach introduces the concept of streaming history by storing the most recent information of the translation process, which is then used by the model in order to improve translation quality. / The research leading to these results has received funding from the European
Union’s Horizon 2020 research and innovation programme under grant agreements no. 761758 (X5Gon) and 952215 (TAILOR), and Erasmus+ Educa-
tion programme under grant agreement no. 20-226-093604-SCH (EXPERT);
the Government of Spain’s grant RTI2018-094879-B-I00 (Multisub) funded by
MCIN/AEI/10.13039/501100011033 & “ERDF A way of making Europe”, and
FPU scholarships FPU18/04135; and the Generalitat Valenciana’s research
project Classroom Activity Recognition (ref. PROMETEO/2019/111) and predoctoral research
scholarship ACIF/2017/055. / Iranzo Sánchez, J. (2023). Streaming Neural Speech Translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/199170 / Compendio
|
468 |
Transexotic : worse than dengue, better than LDSNylund, Carolina January 2013 (has links)
Transexotic. "Come as you are as you were as I want you to be" Menu Starter: Nachos with Mexican sauce. Main course: Chilli con carne in Santa María taco shells, Fish in pasilla chilli and Rajas con crema y queso. Dessert: seasonal delicacies. Hostess: Rosinha Transexotic, a familiar figure to everyone from Evert Taubes The Girl from Havana and Lill Lindfors Teresa . "The project Transexotic by the artist Carolina Nylund addresses international stereotypes, specifically the idea of " the other " as it may be projected or manifested through one's own personality. To what extent do we allow and accept that our personalities, our identities are formed in part by the limited two-dimensional caricatures invented and maintained by forces and phenomena external to us? Nationalism, patriotism, politics, ethnicity, subcultural affiliation, gender, sexuality, career, family: there are countless factors that may play a role in shaping an identity and which can also affect how we are perceived by others. And when we feel that gaze, how does that affect us? " - Finbar Krook Rosato, Curator, Atelier 123.
|
469 |
Análise crítica multilíngue da terminologia anatomomédica: proposições para uso.Werneck, Alexandre Lins 28 February 2012 (has links)
Made available in DSpace on 2016-01-26T12:51:38Z (GMT). No. of bitstreams: 1
alexandrewernwck_tese.pdf: 85668 bytes, checksum: 54cd7f1c01e9a5cf6d0cf320d8d2f738 (MD5)
Previous issue date: 2012-02-28 / Terminology and Lexicography have been especially addressed to the Allied Health Sciences regarding discussion of case reports or concerning publication of scientific articles. The knowledge of Human Anatomy enables the understanding of medical terms and the refinement of Medical Terminology makes possible a better anatomicomedical communication in a highly technical level. Most of the scientific publications in both Anatomy and Medicine are found only in English and most of dictionaries or search resources available do not have specificity enough to explain anatomicomedical, terminological, or lexicographical occurrences. Objective: To design and produce a Multilingual (English-Portuguese-Spanish, derived from Greek or Latin roots), Terminological Dictionary in Cardiological Anatomy expressed by a list of English anatomicomedical terms in common usage in Cardiology subspecialties addressed to medical students or other allied health sciences professionals, and to translators working in this specific field. Material and Methods: Terms, semantical and grammatical components were carefully selected to compose an anatomicocardiological corpus from the inclusion of words present in the Official Anatomical Terminologies (English-Portuguese-Spanish), as well as the alternative official terms commonly used, which lead to terminology or translation misunderstanding often being a source of anatomicomedical confusion. The adequacy to the thematic terminological research requests and the translation reliability level were settled from the Terminology specificity in contrast to the Semantics, as well as from a peer survey of the main terms used by national and international experts in specialized journals, Internet sites, and from text-books on Human Anatomy, Cardiology, and Thoracic Surgery (Pediatric and Adult). Results: A list with 508 anatomicocardiological terms in English, Portuguese, and Spanish language was composed. It was also determined the number of official terms, alternative official versus non-official terms quoted in the selected sources. Conclusions: The working up of a Multilingual Terminological Dictionary reduces the risk of ambiguities, inconsistencies, inutilities, and repetitions concerning the Nomenclature addressed to the Allied Health Sciences by prioritizing the inclusion of official technical terms and a judicious selection of commonly used terms from Greek or Latin roots. Efforts to put together and standardize lists of terms used in text-books, medical journals and Internet sites regarding Human Anatomy provide opportunities of scientific debate, conceptual enlightenment, and scientific update to students or professionals of the Allied Health Sciences or translators. / A Terminologia é aplicada em Ciências da Saúde na discussão de relatos de casos ou na publicação de artigos científicos. O conhecimento da Anatomia Humana permite compreender termos médicos, e o refinamento da Terminologia Médica possibilita melhor comunicação anatomomédica em nível altamente técnico. Grande parte das publicações científicas em Anatomia e Medicina encontra-se somente em língua inglesa, e a maioria dos dicionários ou dos recursos de busca disponíveis não apresenta especificidade para explicitar ocorrências anatomomédicas, terminológicas ou anatomolinguísticas. Objetivo: Analisar a linguagem anatomédica e a abordagem anatomolinguística das inadequações da Tradução, com base nas Terminologias Anatomicas Internacionais multilíngues (inglês-português-espanhol, a partir de radicais grecolatinos), compilando uma lista de termos anatômicos usualmente empregados em todas as especialidades e subespecialidades da Área da Saúde. Analisar os Epônimos, sua inadequações e imprecisões, bem como sua importância para a Historia da Medicina. Material e Método: Todos os termos foram cuidadosamente selecionados, assim como seus equivalentes linguísticos-semânticos para a compilação de um corpus anatômico, a partir da inclusão de vocábulos presentes nas Terminologias Anatômicas Oficiais em línguas inglesa, portuguesa e espanhola, bem como termos oficiais alternativos que ocasionem erros de terminologia ou de tradução anatomomédicas. A adequação às necessidades da pesquisa terminológica temática e o grau de confiabilidade tradutológica foram determinados a partir da especificidade da Terminologia frente à Semântica, e por levantamento criterioso extenso de todos os termos utilizados por especialistas em periódicos, sites e compêndios em Anatomia Humana. Resultados: Duas listas referenciais, uma com 7.683 termos anatômicos oficiais e oficiais alternativos em línguas inglesa, portuguesa e espanhola, bem como seus radicais grecolatinos foram compiladas. A segunda lista é composta de 424 Epônimos oficiais reconhecidos pelas Terminologias Anatômicas Internacionais. Para facilitar a compreensão do leitor, colocamos os Epônimos em inglês, português e espanhol e logo a seguir, as estruturas relacionadas, usando para tanto os radicais grecolatinos e as respectivas estruturas anatômicas em inglês-português-espanhol. Conclusões: A compilação anatômica multilíngue de termos oficiais e oficiais alternativos, assim como a compilação dos epônimos usados nas Terminologias Anatomicas Internacionais em comparação com a Terminologia Anatômica Brasileira, visa reduzir o risco de ambiguidades, incoerências, inutilidades e repetições, assim como a tradução de equivalentes linguísticos em Nomenclatura direcionada às Ciências da Saúde, ao priorizar a inclusão de termos oficiais e oficiais alternativos comumente utilizados, a partir de radicais grecolatinos. Esforços em compilar, interpretar, adequar e padronizar listas de termos utilizados em livros, periódicos e sites sobre Anatomia Humana promovem oportunidades de discussão acadêmica, esclarecimento conceitual e atualização científica a estudantes ou profissionais das áreas da Saúde ou da Tradução.
|
470 |
Traducción literaria de cinco obras menores de Agustín MoretoBlanc, Clara January 2009 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
Page generated in 0.0598 seconds