Global ETD Search

21	Attention-based Approaches for Text Analytics in Social Media and Automatic Summarization González Barba, José Ángel 02 September 2021 (has links) [ES] Hoy en día, la sociedad tiene acceso y posibilidad de contribuir a grandes cantidades de contenidos presentes en Internet, como redes sociales, periódicos online, foros, blogs o plataformas de contenido multimedia. Todo este tipo de medios han tenido, durante los últimos años, un impacto abrumador en el día a día de individuos y organizaciones, siendo actualmente medios predominantes para compartir, debatir y analizar contenidos online. Por este motivo, resulta de interés trabajar sobre este tipo de plataformas, desde diferentes puntos de vista, bajo el paraguas del Procesamiento del Lenguaje Natural. En esta tesis nos centramos en dos áreas amplias dentro de este campo, aplicadas al análisis de contenido en línea: análisis de texto en redes sociales y resumen automático. En paralelo, las redes neuronales también son un tema central de esta tesis, donde toda la experimentación se ha realizado utilizando enfoques de aprendizaje profundo, principalmente basados en mecanismos de atención. Además, trabajamos mayoritariamente con el idioma español, por ser un idioma poco explorado y de gran interés para los proyectos de investigación en los que participamos. Por un lado, para el análisis de texto en redes sociales, nos enfocamos en tareas de análisis afectivo, incluyendo análisis de sentimientos y detección de emociones, junto con el análisis de la ironía. En este sentido, se presenta un enfoque basado en Transformer Encoders, que consiste en contextualizar \textit{word embeddings} pre-entrenados con tweets en español, para abordar tareas de análisis de sentimiento y detección de ironía. También proponemos el uso de métricas de evaluación como funciones de pérdida, con el fin de entrenar redes neuronales, para reducir el impacto del desequilibrio de clases en tareas \textit{multi-class} y \textit{multi-label} de detección de emociones. Adicionalmente, se presenta una especialización de BERT tanto para el idioma español como para el dominio de Twitter, que tiene en cuenta la coherencia entre tweets en conversaciones de Twitter. El desempeño de todos estos enfoques ha sido probado con diferentes corpus, a partir de varios \textit{benchmarks} de referencia, mostrando resultados muy competitivos en todas las tareas abordadas. Por otro lado, nos centramos en el resumen extractivo de artículos periodísticos y de programas televisivos de debate. Con respecto al resumen de artículos, se presenta un marco teórico para el resumen extractivo, basado en redes jerárquicas siamesas con mecanismos de atención. También presentamos dos instancias de este marco: \textit{Siamese Hierarchical Attention Networks} y \textit{Siamese Hierarchical Transformer Encoders}. Estos sistemas han sido evaluados en los corpora CNN/DailyMail y NewsRoom, obteniendo resultados competitivos en comparación con otros enfoques extractivos coetáneos. Con respecto a los programas de debate, se ha propuesto una tarea que consiste en resumir las intervenciones transcritas de los ponentes, sobre un tema determinado, en el programa "La Noche en 24 Horas". Además, se propone un corpus de artículos periodísticos, recogidos de varios periódicos españoles en línea, con el fin de estudiar la transferibilidad de los enfoques propuestos, entre artículos e intervenciones de los participantes en los debates. Este enfoque muestra mejores resultados que otras técnicas extractivas, junto con una transferibilidad de dominio muy prometedora. / [CA] Avui en dia, la societat té accés i possibilitat de contribuir a grans quantitats de continguts presents a Internet, com xarxes socials, diaris online, fòrums, blocs o plataformes de contingut multimèdia. Tot aquest tipus de mitjans han tingut, durant els darrers anys, un impacte aclaparador en el dia a dia d'individus i organitzacions, sent actualment mitjans predominants per compartir, debatre i analitzar continguts en línia. Per aquest motiu, resulta d'interès treballar sobre aquest tipus de plataformes, des de diferents punts de vista, sota el paraigua de l'Processament de el Llenguatge Natural. En aquesta tesi ens centrem en dues àrees àmplies dins d'aquest camp, aplicades a l'anàlisi de contingut en línia: anàlisi de text en xarxes socials i resum automàtic. En paral·lel, les xarxes neuronals també són un tema central d'aquesta tesi, on tota l'experimentació s'ha realitzat utilitzant enfocaments d'aprenentatge profund, principalment basats en mecanismes d'atenció. A més, treballem majoritàriament amb l'idioma espanyol, per ser un idioma poc explorat i de gran interès per als projectes de recerca en els que participem. D'una banda, per a l'anàlisi de text en xarxes socials, ens enfoquem en tasques d'anàlisi afectiu, incloent anàlisi de sentiments i detecció d'emocions, juntament amb l'anàlisi de la ironia. En aquest sentit, es presenta una aproximació basada en Transformer Encoders, que consisteix en contextualitzar \textit{word embeddings} pre-entrenats amb tweets en espanyol, per abordar tasques d'anàlisi de sentiment i detecció d'ironia. També proposem l'ús de mètriques d'avaluació com a funcions de pèrdua, per tal d'entrenar xarxes neuronals, per reduir l'impacte de l'desequilibri de classes en tasques \textit{multi-class} i \textit{multi-label} de detecció d'emocions. Addicionalment, es presenta una especialització de BERT tant per l'idioma espanyol com per al domini de Twitter, que té en compte la coherència entre tweets en converses de Twitter. El comportament de tots aquests enfocaments s'ha provat amb diferents corpus, a partir de diversos \textit{benchmarks} de referència, mostrant resultats molt competitius en totes les tasques abordades. D'altra banda, ens centrem en el resum extractiu d'articles periodístics i de programes televisius de debat. Pel que fa a l'resum d'articles, es presenta un marc teòric per al resum extractiu, basat en xarxes jeràrquiques siameses amb mecanismes d'atenció. També presentem dues instàncies d'aquest marc: \textit{Siamese Hierarchical Attention Networks} i \textit{Siamese Hierarchical Transformer Encoders}. Aquests sistemes s'han avaluat en els corpora CNN/DailyMail i Newsroom, obtenint resultats competitius en comparació amb altres enfocaments extractius coetanis. Pel que fa als programes de debat, s'ha proposat una tasca que consisteix a resumir les intervencions transcrites dels ponents, sobre un tema determinat, al programa "La Noche en 24 Horas". A més, es proposa un corpus d'articles periodístics, recollits de diversos diaris espanyols en línia, per tal d'estudiar la transferibilitat dels enfocaments proposats, entre articles i intervencions dels participants en els debats. Aquesta aproximació mostra millors resultats que altres tècniques extractives, juntament amb una transferibilitat de domini molt prometedora. / [EN] Nowadays, society has access, and the possibility to contribute, to large amounts of the content present on the internet, such as social networks, online newspapers, forums, blogs, or multimedia content platforms. These platforms have had, during the last years, an overwhelming impact on the daily life of individuals and organizations, becoming the predominant ways for sharing, discussing, and analyzing online content. Therefore, it is very interesting to work with these platforms, from different points of view, under the umbrella of Natural Language Processing. In this thesis, we focus on two broad areas inside this field, applied to analyze online content: text analytics in social media and automatic summarization. Neural networks are also a central topic in this thesis, where all the experimentation has been performed by using deep learning approaches, mainly based on attention mechanisms. Besides, we mostly work with the Spanish language, due to it is an interesting and underexplored language with a great interest in the research projects we participated in. On the one hand, for text analytics in social media, we focused on affective analysis tasks, including sentiment analysis and emotion detection, along with the analysis of the irony. In this regard, an approach based on Transformer Encoders, based on contextualizing pretrained Spanish word embeddings from Twitter, to address sentiment analysis and irony detection tasks, is presented. We also propose the use of evaluation metrics as loss functions, in order to train neural networks for reducing the impact of the class imbalance in multi-class and multi-label emotion detection tasks. Additionally, a specialization of BERT both for the Spanish language and the Twitter domain, that takes into account inter-sentence coherence in Twitter conversation flows, is presented. The performance of all these approaches has been tested with different corpora, from several reference evaluation benchmarks, showing very competitive results in all the tasks addressed. On the other hand, we focused on extractive summarization of news articles and TV talk shows. Regarding the summarization of news articles, a theoretical framework for extractive summarization, based on siamese hierarchical networks with attention mechanisms, is presented. Also, we present two instantiations of this framework: Siamese Hierarchical Attention Networks and Siamese Hierarchical Transformer Encoders. These systems were evaluated on the CNN/DailyMail and the NewsRoom corpora, obtaining competitive results in comparison to other contemporary extractive approaches. Concerning the TV talk shows, we proposed a text summarization task, for summarizing the transcribed interventions of the speakers, about a given topic, in the Spanish TV talk shows of the ``La Noche en 24 Horas" program. In addition, a corpus of news articles, collected from several Spanish online newspapers, is proposed, in order to study the domain transferability of siamese hierarchical approaches, between news articles and interventions of debate participants. This approach shows better results than other extractive techniques, along with a very promising domain transferability. / González Barba, JÁ. (2021). Attention-based Approaches for Text Analytics in Social Media and Automatic Summarization [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/172245 / TESIS Resumen automático Analítica de textos Medios de comunicación social Aprendizaje profundo Enfoques basados en la atención Text analytics Automatic summarization Social media Deep learning Attention-based approaches Resumen au LENGUAJES Y SISTEMAS INFORMATICOS
22	Coordinated management of urban wastewater systems by means of advanced environmental decision support systems Murlà Tuyls, Damián 17 May 2013 (has links) In the last decades and due to the Water Framework Directive implementation, the urban wastewater cycle management has become more complex. The concept of integrated urban wastewater system management is introduced, and it becomes necessary to consider some new data as the sewer system characteristics or the receiving body. In this sense, environmental decision support systems (EDSS) are very useful and powerful tools to support during the decision making process. A new EDSS for the integrated urban wastewater system management has been developed integrating data from several sources (bibliographic, theoretical or historical) and a real case-based virtual system able to perform simulations. Results demonstrate the benefits of using this kind of systems in comparison with a standard approach, which do not use the expert knowledge and encourages continuing with this research in order to improve the quality and efficiency of this type of EDSSs / En les darreres dècades, i degut a la implementació de la Directiva Marc de l’Aigua, la gestió del cicle urbà de l’aigua ha esdevingut més complexa. S’introdueix el concepte de gestió integrada de conca, i és necessari considerar certa informació, com les característiques de la xarxa de clavegueram o del medi receptor. D’aquesta manera, els sistemes de suport a la decisió ambiental (EDSS) són eines potentíssimes que faciliten la presa de decisions en aquest camp. S’ha desenvolupat un nou EDSS per a la gestió integrada de conca que utilitza una base sòlida de coneixement expert, integrant informació de diverses fonts (bibliogràfiques, teòriques o històriques) i dos sistemes virtuals basats en dades reals sobre els quals és possible realitzar simulacions. Els resultats demostren que aquest sistema presenta beneficis importants respecte a una gestió estàndard sense sistema expert, i esperona a prosseguir amb la recerca i el desenvolupament per a millorar-lo Coordinated management Gestió coordinada Gestión coordinada EDSS Environmental decision support systems Urban wastewater systems Sistemes urbans d'aigües residuals Sistemas urbanos de aguas residuales Combined sewer overflow Clavegueram combinat Alcantarillado combinado Knowledge-based system Sistemes basats en el coneixement Sistemes basados en el conocimiento Wastewater modelling Tractament d'aigües residuals Tratamiento de aguas residuales 628
23	A Contrastive Structural and Lexical Study of Shakespeare's Hamlet and Sumarokov's Gamlet: A Corpus-Based Approach to Literature. Estudio contrastivo de la estructura y del léxico en Hamlet de Shakespeare versus Gamlet de Sumarokov: una aproximación a la literatura desde la perspectiva basada en corpus Keshabyan Ivanova, Irina 29 June 2010 (has links) La presente Tesis Doctoral se encuadra dentro la línea de investigación del lenguaje mediante los métodos basados en corpus, es decir, mediante análisis computacional y cuantitativo. El esencial objetivo ha sido llevar a cabo una comparación y análisis cuantitativo estructural y del léxico de dos textos específicos del género dramático: la cuarta edición en el infolio de Hamlet (1685) de Shakespeare, y la traducción al inglés de Gamlet (1787) [1748], del dramaturgo ruso Aleksandr Sumarokov, traducida del ruso por Richard Fortune en 1970. El análisis, comparación e interpretación de los resultados de los patrones estructurales y temáticos se ha dispuesto por actos, tanto en aquello que se refiere a la intra-obra (en Hamlet y Gamlet, separado), como inter-obras (entre Hamlet y Gamlet) a lo largo de los Capítulos 3º, 4º, 5º y 6º. Para desvelar los propósitos reales de Shakespeare y Sumarokov, especialmente en lo referido a las configuraciones sociales y organizativas estructurales de Hamlet y Gamlet, se utilizaron diversas aplicaciones informáticas e estadísticas. Para ello se administró el análisis cuantitativo de la distribución de los patrones de la presencia, intervención e interacción de todos los personajes, tanto los principales, como los secundarios. Para analizar y comparar las alteraciones temáticas, es decir, las diferencias cualitativas, no simplemente cuantitativas, con respecto a la conceptualización sociopolítica, religiosa, moral, familiar, filosófica y artística, entre Shakespeare y Sumarokov, se aplicaron los métodos cuantitativos y analíticos basados en la lingüística del corpus. A tal fin, se implantó la investigación de los patrones de distribución de las palabras de contenido (open-class ítems), es decir, las palabras con significado léxico, tales como sustantivos, verbos, adjetivos y adverbios, más frecuentes entre ambas obras. Los principales resultados obtenidos revelan importantes disimilitudes entre las estructuras de las obras por actos, es decir, percepciones marcadamente distintas de todos los personajes, de su relevancia en las obras y de complejidad de las relaciones sociales entre ellos. Los resultados de los patrones temáticos señalan las divergencias significativas en los contenidos básicos de ambos textos en relación con los temas más prominentes. Así pues, los resultados confirman diferencias sustanciales en los patrones estructurales y temáticos entre versión original de Hamlet y Gamlet. Resumen: / The main area of research of this PhD dissertation is the study of language by means of corpus-based techniques -in other words, by means of a computational and quantitative analysis. The aim was to carry out quantitative and qualitative structural and lexical analysis and comparison of two specific texts in the genre of drama -The Fourth Folio Edition of The Tragedy of Hamlet Prince of Denmark (1685) by Shakespeare and the English translation of Gamlet (1787) [1748] by the Russian playwright Sumarokov, translated from Russian by Richard Fortune in 1970. The analysis, comparison and interpretation of data related to the structural and thematic patterns were carried out per act: intra-play (in each play, separately) and inter-plays (between Hamlet and Gamlet). Accordingly, various computational tools were applied to reveal the differences in the social and organisational structures of the plays through quantitative and qualitative analysis of the distribution patterns of the presence, intervention and interaction variables of all the characters, both main and secondary. Quantitative and analytical corpus-based methodologies were used to analyse and compare thematic alterations between the two plays -in other words, the (dis)similarities in the authors' religious, socio-political, family, moral, philosophical and artistic conceptions- identified on the basis of the most frequent content words (open-class items), particularly nouns, verbs, adjectives and adverbs. The key findings indicate important differences between the structures of the plays per acts, that is, significant divergences in the authors' perceptions of the characters and the complexity of their relationships. Another essential finding suggests obvious distinctions between both texts' basic contents per act: intra-play and inter-plays. In general, the findings uncover wide-ranging dissimilarities in the structural and thematic patterns in Hamlet versus Gamlet. palabras de contenido interacción intervención presencia patrones estructurales y temáticos análisis cualitativo inter-plays intra-play open-class items content words variables interaction intervention presence structural and thematic patterns corpus-based methodologies qualitative analysis quantitative analysis open-class ítems intra-obra inter-obras diferencias Filología Inglesa 80 81
24	Modelización y simulación de dispositivos micrométricos basados en estructuras espaciales de solitones ópticos García March, Miguel Ángel 07 May 2008 (has links) En la presente Tesis se utilizan las herramientas de la teoría de grupos discretos, de la física del estado sólido y de la dinámica no lineal para estudiar los nuevos fenómenos que se pueden obtener al combinar la periodicidad y la no linealidad para controlar el comportamiento de la luz. Los modelos matemáticos obtenidos consisten en ecuaciones diferenciales no lineales en derivadas parciales tipo Schrödinger que presentan variaciones periódicas en la parte lineal y no lineal. En los sistemas con simetría rotacional discreta el estudio de estos modelos se ha centrado en el concepto clave de pseudomomento angular mientras que en los sistemas periódicos se ha explotado la analogía conlos sistemas estudiados en la física del estado sólido. Adicionalmente, se han desarrollado métodos de resolución numérica capaces de simular la propagación electromagnética en sistemas no lineales periódicosbidimensionales. Además se han simulado anipulaciones de propiedades de la luz que sirvan como base a dispositivos micrométricos pasivos (como memorias netamente ópticas) o activos (capaces de realizar operaciones booleanas) basadas en estructuras solitónicas sobre las que se pueden definir propiedades y dinámica magnética. El objetivo último es la simulación de dispositivos capaces de ser fabricados experimentalmente. / García March, MÁ. (2008). Modelización y simulación de dispositivos micrométricos basados en estructuras espaciales de solitones ópticos [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2011 / Palancia Ecuación de Schrödinger no lineal Óptica no lineal Solitones espaciales Vórtices ópticos Óptica singular Condensación de Bose-einstein 12 - Matemáticas 1202 - Análisis y análisis funcional
25	Sensores virtuales para procesos con medidas escasas y retardos temporales Peñarrocha Alós, Ignacio 22 December 2008 (has links) En este trabajo se aborda el problema de controlar un proceso cuya salida se muestrea de forma irregular. Para ello se propone utilizar un predictor que estima las salidas del proceso en instantes regulares de tiempo más un controlador convencional que calcula la acción de control a partir de las estimaciones del predictor (técnica conocida como control inferencial). La predicción consiste en estimar las variables de salida que se desean controlar a partir de las mediciones realizadas con diversos sensores utilizando para ello un modelo matemático del proceso. El filtro de Kalman permite hacer la predicción de forma óptima si las perturbaciones tienen una distribución gaussiana de media cero, pero con el inconveniente de requerir un elevado coste computacional cuando se utilizan diferentes sensores con retardos temporales variantes. En este trabajo se propone una estrategia de predicción alternativa de bajo coste computacional cuyo diseño se basa en el conocimiento de la disponibilidad de mediciones y de los retardos (del proceso, del sistema de medición o del sistema de transmisión de datos) y de la naturaleza de las perturbaciones. Los predictores propuestos minimizan el error de predicción frente al muestreo aleatorio con retardos variantes, perturbaciones, ruido de medida, error de modelado, retardos en la acción de control e incertidumbre en los tiempos de medición. Las diferentes estrategias de diseño que se proponen se clasifican según el tipo de información que se dispone de las perturbaciones y del coste computacional requerido. Se han planteado los diseños para sistemas monovariables, multivariables, lineales y no lineales. Asimismo, también se ha elaborado una forma más eficiente de incluir mediciones escasas con retardo en el filtro de Kalman, con el objetivo de reducir el coste computacional de la predicción. En este trabajo se demuestra que los sistemas de control inferencial que utilizan los predictores propuestos cumplen con el principio de sep / Peñarrocha Alós, I. (2006). Sensores virtuales para procesos con medidas escasas y retardos temporales [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/3882 / Palancia Medidas escasas Muestreo aleatorio Muestreo no convencional Pérdida de datos Convergencia de lyapunov Retardos variantes en el tiempo Postproceado de muestras Predicción de salidas Sensores virtuales Sistemas de control basados en red Mediciones distribuidas Fusión sensorial Observadores Scarce measurements Random sampling Unconventional sampling Missing-data Sensor fusion Time-varying sampling period Observers Networked control systems Virtual sensors Distributed measurements Output prediction Sample post-processing Time-varying delays Minear matrix inequalities Lyapunov convergence INGENIERIA DE SISTEMAS Y AUTOMATICA 331102 - Ingeniería de control

Page generated in 0.028 seconds