• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 219
  • 197
  • 4
  • 2
  • Tagged with
  • 419
  • 359
  • 358
  • 232
  • 117
  • 53
  • 50
  • 45
  • 43
  • 42
  • 41
  • 40
  • 37
  • 37
  • 36
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
271

Inference and Learning with Planning Models

Aineto García, Diego 02 September 2022 (has links)
[ES] Inferencia y aprendizaje son los actos de razonar sobre evidencia recogida con el fin de alcanzar conclusiones lógicas sobre el proceso que la originó. En el contexto de un modelo de espacio de estados, inferencia y aprendizaje se refieren normalmente a explicar el comportamiento pasado de un agente, predecir sus acciones futuras, o identificar su modelo. En esta tesis, presentamos un marco para inferencia y aprendizaje en el modelo de espacio de estados subyacente al modelo de planificación clásica, y formulamos una paleta de problemas de inferencia y aprendizaje bajo este paraguas unificador. También desarrollamos métodos efectivos basados en planificación que nos permiten resolver estos problemas utilizando algoritmos de planificación genéricos del estado del arte. Mostraremos que un gran número de problemas de inferencia y aprendizaje claves que han sido tratados como desconectados se pueden formular de forma cohesiva y resolver siguiendo procedimientos homogéneos usando nuestro marco. Además, nuestro trabajo abre las puertas a nuevas aplicaciones para tecnología de planificación ya que resalta las características que hacen que el modelo de espacio de estados de planificación clásica sea diferente a los demás modelos. / [CA] Inferència i aprenentatge són els actes de raonar sobre evidència arreplegada a fi d'aconseguir conclusions lògiques sobre el procés que la va originar. En el context d'un model d'espai d'estats, inferència i aprenentatge es referixen normalment a explicar el comportament passat d'un agent, predir les seues accions futures, o identificar el seu model. En esta tesi, presentem un marc per a inferència i aprenentatge en el model d'espai d'estats subjacent al model de planificació clàssica, i formulem una paleta de problemes d'inferència i aprenentatge davall este paraigua unificador. També desenrotllem mètodes efectius basats en planificació que ens permeten resoldre estos problemes utilitzant algoritmes de planificació genèrics de l'estat de l'art. Mostrarem que un gran nombre de problemes d'inferència i aprenentatge claus que han sigut tractats com desconnectats es poden formular de forma cohesiva i resoldre seguint procediments homogenis usant el nostre marc. A més, el nostre treball obri les portes a noves aplicacions per a tecnologia de planificació ja que ressalta les característiques que fan que el model d'espai d'estats de planificació clàssica siga diferent dels altres models. / [EN] Inference and learning are the acts of reasoning about some collected evidence in order to reach a logical conclusion regarding the process that originated it. In the context of a state-space model, inference and learning are usually concerned with explaining an agent's past behaviour, predicting its future actions or identifying its model. In this thesis, we present a framework for inference and learning in the state-space model underlying the classical planning model, and formulate a palette of inference and learning problems under this unifying umbrella. We also develop effective planning-based approaches to solve these problems using off-the-shelf, state-of-the-art planning algorithms. We will show that several core inference and learning problems that previous research has treated as disconnected can be formulated in a cohesive way and solved following homogeneous procedures using the proposed framework. Further, our work opens the way for new applications of planning technology as it highlights the features that make the state-space model of classical planning different from other models. / The work developed in this doctoral thesis has been possible thanks to the FPU16/03184 fellowship that I have enjoyed for the duration of my PhD studies. I have also been supported by my advisors’ grants TIN2017-88476-C2-1-R, TIN2014-55637-C2-2-R-AR, and RYC-2015-18009. / Aineto García, D. (2022). Inference and Learning with Planning Models [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/185355 / TESIS
272

Construcción de un editor de mapas para el juego "1814: la rebelión del Cuzco"

Landa Torrejón, Luis Ignacio 17 July 2017 (has links)
En el 2014, el grupo de investigación AVATAR lanzó su juego de estrategia en tiempo real “1814: La rebelión del Cuzco”, y ahora desean expandir el contenido del juego con nuevos mapas y niveles. Sin embargo, crear contenido de este tipo requiere iniciar un ciclo de desarrollo extenso y costoso, el cual produce una cantidad limitada de mapas. Frente a esta necesidad, se propone un editor de mapas para el juego. Una herramienta que permite crear una cantidad ilimitada de mapas y, a diferencia de un algoritmo de generación de niveles, aprovecha la creatividad de los jugadores para generar nuevo contenido e interés en el juego. El editor se construyó siguiendo la estructura de un compilador que recibe como entrada un lenguaje visual. Se elaboró primero una interfaz gráfica donde se edita el mapa de forma intuitiva, el cual luego es procesado por el compilador y traducido a una estructura de datos interpretable por el motor de juego. Por último, se realizó una prueba con usuarios para validar la usabilidad del editor y el correcto funcionamiento de los mapas editados. Al finalizar el proyecto de fin de carrera se logró construir satisfactoriamente un editor de mapas para “1814: La rebelión del Cuzco”, capaz de ser utilizado, tanto por jugadores expertos como casuales, para crear fácilmente nuevos mapas y luego integrarlos al juego.
273

Modelos predictivos basados en redes neuronales recurrentes de tiempo discreto

Pérez-Ortiz, Juan Antonio 06 September 2002 (has links)
No description available.
274

OntoFIS: tecnología ontológica en el dominio farmacoterapéutico

Romá-Ferri, María Teresa 13 November 2009 (has links)
En la actualidad, en el ámbito sanitario y, en concreto, en el dominio farmacoterapéutico existen múltiples sistemas de información (SI). Cada uno de estos SI representan el conocimiento sobre los medicamentos de formas diversas. Pero, en la práctica, para poder utilizarlos, los profesionales de la salud (médicos, enfermeras y farmacéuticos) deben de conocer el contenido y la forma de acceder a cada uno de estos SI, para obtener la información que apoye su toma de decisión sobre la terapéutica farmacológica. Para ello, los profesionales deben de invertir un tiempo, del que muchas veces no disponen, y demorar la atención directa. El reto está en que los SI sean capaces de compartir la información entre ellos, es decir, en resolver los problemas de interoperabilidad semántica. Para conseguir la interoperabilidad entre SI se han propuesto, como una opción, las tecnologías semánticas y, entre ellas, las ontologías. Las ontologías son un tipo de representación del conocimiento, basado en conceptos, que facilita la compresión del significado y del contexto de la información. A partir de estas premisas y del vacío detectado en la representación de los medicamentos, el trabajo presentado, en esta Tesis doctoral, aborda la definición de una propuesta metodológica y tecnológica para la construcción de la Ontología Farmacoterapéutica e Información para el Seguimiento, OntoFIS. La propuesta metodológica aplicada emplea el modelo de datos UML y OWL DL para el modelado de OntoFIS. La propuesta tecnológica se fundamenta en el uso de un plug-in para las transformaciones directas entre el diagrama de clases UML y el modelo de datos OWL DL. Estas propuestas pueden ser aplicadas a cualquier otro escenario y facilitan la reutilización de los diseños de aplicaciones Web para la obtención de ontologías. La aportación más significativa es que, la ontología construida, contribuye a resolver el problema de la carencia de una fuente de conocimiento específica en lengua castellana. La ontología OntoFIS está poblada con casi 55.000 instancias. Entre éstas destacan, por su valor terminológico, las correspondientes a las denominaciones de los medicamentos comercializados en España (17.204), los componentes farmacológicos (19.627), los nombres genéricos de principios activos (4.456), las denominaciones de grupos químicos (3.200) y las denominaciones de uso terapéutico (1.380). Asimismo, el modelo de conocimiento representado en OntoFIS, a partir de los resultados de la evaluación obtenidos, permite hacer inferencias, respecto al conocimiento del dominio farmacoterapéutico, válidas, consistentes y ajustadas a las necesidades de los profesionales de la salud.
275

Efficient finite-state algorithms for the application of local grammars / Algorithmes performants à états finis pour l'application de grammaires locales / Algoritmos eficientes de estados finitos para la aplicación de gramáticas locales

Sastre Martínez, Javier Miguel 16 July 2011 (has links)
No description available.
276

L’escola com una conversa entre desconeguts: Recercar amb infants a través de llenguatges artístics

Duran Salvadó, Noemí 03 May 2012 (has links)
Aquesta tesi es planteja com un intent d’assajar altres formes d’habitar la institució escolar actual, dissenyada segons la legislació educativa vigent i que, en la majoria dels casos, es tradueix encara en la posada en escena d’una escola tradicional fruit de l’època de la industrialització. A través d’una narrativa personal, l’autora entra a l’escola, recordant experiències pròpies com a alumna, com a mestra i com a recercadora, i interroga els dispositius que regulen les maneres d’estar i ser en el context escolar, posant en evidència les formes que es privilegien d’acord amb els discursos educatius hegemònics. Focalitzada en com es configura l’experiència de la subjectivitat a l’escola, la recercadora opta per realitzar el treball de camp en un centre educatiu d’Educació Primària que el 2007 va ser reconegut pel Govern Espanyol com a centre de referència en estratègies per a la Resolució de Conflictes i la Mediació. En aquest centre dur a terme una primera fase d’observació etnogràfica en què indaga sobre com circulen els relats personals dels infants a l’escola, explorant les possibilitats que el context escolar brinda perquè un infant esdevingui autor de sí mateix. El gruix de la recerca recau en una segona fase en què la recercadora proposa a un grup d’infants explorar junts ‘què i com podem aprendre del que passa entre nosaltres a l’escola’. Es tracta d’una recerca compartida on tant la recercadora com els infants assagen altres formes de posar-se en joc en l’espai escolar, des de la inquietud d’explorar nous llenguatges per a l’educació, que ens facin més sensibles a la relació amb l’altre sense pensar-la de forma predeterminada. És en aquest sentit que es proposa la metàfora de l’escola com una conversa entre desconeguts, on la impossibilitat de conèixer l’altre es considera una oportunitat pedagògica ja que ens impulsa a explorar l’espai de la diferència de manera imaginativa i creativa. / ‘The school as a conversation with strangers: Researching with children through artistic languages’ This thesis pretends to rehearse alternative ways of inhabiting today's educational institutions. These centres have been designed in relation to current educational legislation, the majority of which is interpreted in a way that results in the enactment of traditional schools, which still bear the mark of the Industrial Revolution. Through personal narrative, the author goes back to school, recuperating her own experiences as a student, as a teacher, and as a researcher. She interrogates the structures that regulate ways of acting and being in the school context, bringing to light what forms are privileged by hegemonic educational discourses. Focussed on how the experience of subjectivity is configured in school, the researcher develops her fieldwork in a primary school in Catalonia, which in 2007 won a national prize from the Spanish government in honour of their Conflict Resolution and Mediation strategies and practices. In this centre, the first phase of the thesis (ethnographic observation) takes place, during which the researcher questions how children's personal stories circulate through the school environment, exploring the possibilities provided by the school for a child to become the author of his/her self. The bulk of the research takes place during a second phase, in which the researcher initiates an enquiry, together a group of children, into 'what and how we can learn from what happens between us in school'. This project is a shared research process, where both the researcher and the children rehearse other ways of getting involved in the school environment. This work stems from an interest in exploring new languages in education that can make us more sensitive to our relationships with each other, without defaulting to a predetermined mindset. It is in this regard that the metaphor of school as a conversation between strangers emerges, where the impossibility of knowing the other is seen as a pedagogical opportunity that drives us to explore the space of difference through our imagination and creativity.
277

Contribution to an Architecture for Multimedia Information Management and Protection Based on Open Standards

Torres Padrosa, Víctor 27 October 2008 (has links)
El principal objetivo de éste proyecto de investigación es la definición de una arquitectura que permita la protección y gestión de los derechos digitales en un entorno de gestión de contenido multimedia, siguiendo estándares abiertos siempre que sea posible. A fin de conseguir dicho objetivo, se analizarán y considerarán múltiples estándares e iniciativas relacionados.En primer lugar se aborda la definición de una arquitectura preliminar basada en MPEG-21 que permite la protección y gestión de los derechos digitales (DRM) aplicables a contenido multimedia. Más adelante, se presenta una arquitectura genérica y se describen diferentes implementaciones desarrolladas en proyectos nacionales y europeos, como AXMEDIS, VISNET II, Linked-Work y GILDDA. El análisis incluye casos de uso, aspectos de seguridad y la propuesta de una metodología de prueba o test. En el caso de Linked-Work, se detalla una implementación específica, resaltando los conceptos clave que la hacen diferente de otros sistemas de DRM. / The main goal of this research project is to define a generic architecture for the protection and management of digital rights in a multimedia content management scenario following open standards as much as possible. In order to achieve this goal, several standards and initiatives will be analysed and taken into account.First, a MPEG-21-based preliminary architecture for the protection and management of digital rights for multimedia content is tackled. Later on, a more general architecture is defined. Several implementations are described such as those in several Spanish and European projects such as AXMEDIS, VISNET II, Linked-Work and GILDDA. The focus in made on use cases, security features and a testing methodology. Linked-Work details a specific implementation, emphasising on the key concepts that make it different from other kind of DRM systems.
278

Memórias, desafios e experiências de um professor: a linguagem teatral como um caminho para o ensino/aprendizagem em arte

Santos, Willian Dias dos 08 October 2016 (has links)
Este estudo trata de uma autorreflexão sobre aspectos de minha vida, que vão desde os primeiros contatos com a arte até as afetações desta relação em minha prática docente, focando o teatro como linguagem privilegiada. Os desafios que travo em minha rotina como professor de Arte na educação básica e os caminhos trilhados como possíveis formas de transpor esses obstáculos também ocupam espaço significante nesta pesquisa. Para tanto, o embasamento teórico se deu através de autores e assuntos relacionados à educação, arte, teatro e experiências docentes. Também utilizo, para justificar o formato narrativo deste trabalho, autores que abordam em suas pesquisas as escritas autobiográficas e narrativas em torno do professor. Quanto à metodologia, por razão do caráter subjetivo dos aspectos investigados, a coleta e a análise dos dados se deram nos princípios da pesquisa qualitativa. Os dados foram analisados através de resgates memoriais, da experiência acadêmica e profissional e das relações que fiz junto aos referenciais bibliográficos. / Este estudio trata de una autoreflexión sobre los aspectos de mi vida, que van desde los primeros contactos con el arte hasta las afectaciones de este enlace en mi práctica docente, centrándose en el teatro como lenguaje privilegiado. Los desafíos con que lucho en mi rutina como profesor de arte en la educación básica y los caminos como posibles formas de superar estos obstáculos también ocupan un espacio importante en esta investigación. Por lo tanto, la base teórica está dada por autores y temas relacionados con la educación, el arte, el teatro, la enseñanza de las experiencias. También utilizo, para justificar el formato narrativo de este trabajo, los autores que abordan en sus investigaciones las escritas autobiográficas y narrativas sobre los maestros. En cuanto a la metodología, en razón del carácter subjetivo de los aspectos investigados, la recolección y la análisis de datos se da en los principios de la investigación cualitativa. Los datos fueron analizados a través de memoriales reembolsos, de experiencia académica y profesional y de las relaciones que he hecho con las referencias bibliográficas. / Dissertação (Mestrado)
279

Arabic Text Recognition and Machine Translation

Alkhoury, Ihab 13 July 2015 (has links)
[EN] Research on Arabic Handwritten Text Recognition (HTR) and Arabic-English Machine Translation (MT) has been usually approached as two independent areas of study. However, the idea of creating one system that combines both areas together, in order to generate English translation out of images containing Arabic text, is still a very challenging task. This process can be interpreted as the translation of Arabic images. In this thesis, we propose a system that recognizes Arabic handwritten text images, and translates the recognized text into English. This system is built from the combination of an HTR system and an MT system. Regarding the HTR system, our work focuses on the use of Bernoulli Hidden Markov Models (BHMMs). BHMMs had proven to work very well with Latin script. Indeed, empirical results based on it were reported on well-known corpora, such as IAM and RIMES. In this thesis, these results are extended to Arabic script, in particular, to the well-known IfN/ENIT and NIST OpenHaRT databases for Arabic handwritten text. The need for transcribing Arabic text is not only limited to handwritten text, but also to printed text. Arabic printed text might be considered as a simple form of handwritten text version. Thus, for this kind of text, we also propose Bernoulli HMMs. In addition, we propose to compare BHMMs with state-of-the-art technology based on neural networks. A key idea that has proven to be very effective in this application of Bernoulli HMMs is the use of a sliding window of adequate width for feature extraction. This idea has allowed us to obtain very competitive results in the recognition of both Arabic handwriting and printed text. Indeed, a system based on it ranked first at the ICDAR 2011 Arabic recognition competition on the Arabic Printed Text Image (APTI) database. Moreover, this idea has been refined by using repositioning techniques for extracted windows, leading to further improvements in Arabic text recognition. In the case of handwritten text, this refinement improved our system which ranked first at the ICFHR 2010 Arabic handwriting recognition competition on IfN/ENIT. In the case of printed text, this refinement led to an improved system which ranked second at the ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text on APTI. Furthermore, this refinement was used with neural networks-based technology, which led to state-of-the-art results. For machine translation, the system was based on the combination of three state-of-the-art statistical models: the standard phrase-based models, the hierarchical phrase-based models, and the N-gram phrase-based models. This combination was done using the Recognizer Output Voting Error Reduction (ROVER) method. Finally, we propose three methods of combining HTR and MT to develop an Arabic image translation system. The system was evaluated on the NIST OpenHaRT database, where competitive results were obtained. / [ES] El reconocimiento de texto manuscrito (HTR) en árabe y la traducción automática (MT) del árabe al inglés se han tratado habitualmente como dos áreas de estudio independientes. De hecho, la idea de crear un sistema que combine las dos áreas, que directamente genere texto en inglés a partir de imágenes que contienen texto en árabe, sigue siendo una tarea difícil. Este proceso se puede interpretar como la traducción de imágenes de texto en árabe. En esta tesis, se propone un sistema que reconoce las imágenes de texto manuscrito en árabe, y que traduce el texto reconocido al inglés. Este sistema está construido a partir de la combinación de un sistema HTR y un sistema MT. En cuanto al sistema HTR, nuestro trabajo se enfoca en el uso de los Bernoulli Hidden Markov Models (BHMMs). Los modelos BHMMs ya han sido probados anteriormente en tareas con alfabeto latino obteniendo buenos resultados. De hecho, existen resultados empíricos publicados usando corpus conocidos, tales como IAM o RIMES. En esta tesis, estos resultados se han extendido al texto manuscrito en árabe, en particular, a las bases de datos IfN/ENIT y NIST OpenHaRT. En aplicaciones reales, la transcripción del texto en árabe no se limita únicamente al texto manuscrito, sino también al texto impreso. El texto impreso se puede interpretar como una forma simplificada de texto manuscrito. Por lo tanto, para este tipo de texto, también proponemos el uso de modelos BHMMs. Además, estos modelos se han comparado con tecnología del estado del arte basada en redes neuronales. Una idea clave que ha demostrado ser muy eficaz en la aplicación de modelos BHMMs es el uso de una ventana deslizante (sliding window) de anchura adecuada durante la extracción de características. Esta idea ha permitido obtener resultados muy competitivos tanto en el reconocimiento de texto manuscrito en árabe como en el de texto impreso. De hecho, un sistema basado en este tipo de extracción de características quedó en la primera posición en el concurso ICDAR 2011 Arabic recognition competition usando la base de datos Arabic Printed Text Image (APTI). Además, esta idea se ha perfeccionado mediante el uso de técnicas de reposicionamiento aplicadas a las ventanas extraídas, dando lugar a nuevas mejoras en el reconocimiento de texto árabe. En el caso de texto manuscrito, este refinamiento ha conseguido mejorar el sistema que ocupó el primer lugar en el concurso ICFHR 2010 Arabic handwriting recognition competition usando IfN/ENIT. En el caso del texto impreso, este refinamiento condujo a un sistema mejor que ocupó el segundo lugar en el concurso ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text en el que se usaba APTI. Por otro lado, esta técnica se ha evaluado también en tecnología basada en redes neuronales, lo que ha llevado a resultados del estado del arte. Respecto a la traducción automática, el sistema se ha basado en la combinación de tres tipos de modelos estadísticos del estado del arte: los modelos standard phrase-based, los modelos hierarchical phrase-based y los modelos N-gram phrase-based. Esta combinación se hizo utilizando el método Recognizer Output Voting Error Reduction (ROVER). Por último, se han propuesto tres métodos para combinar los sistemas HTR y MT con el fin de desarrollar un sistema de traducción de imágenes de texto árabe a inglés. El sistema se ha evaluado sobre la base de datos NIST OpenHaRT, donde se han obtenido resultados competitivos. / [CAT] El reconeixement de text manuscrit (HTR) en àrab i la traducció automàtica (MT) de l'àrab a l'anglès s'han tractat habitualment com dues àrees d'estudi independents. De fet, la idea de crear un sistema que combine les dues àrees, que directament genere text en anglès a partir d'imatges que contenen text en àrab, continua sent una tasca difícil. Aquest procés es pot interpretar com la traducció d'imatges de text en àrab. En aquesta tesi, es proposa un sistema que reconeix les imatges de text manuscrit en àrab, i que tradueix el text reconegut a l'anglès. Aquest sistema està construït a partir de la combinació d'un sistema HTR i d'un sistema MT. Pel que fa al sistema HTR, el nostre treball s'enfoca en l'ús dels Bernoulli Hidden Markov Models (BHMMs). Els models BHMMs ja han estat provats anteriorment en tasques amb alfabet llatí obtenint bons resultats. De fet, existeixen resultats empírics publicats emprant corpus coneguts, tals com IAM o RIMES. En aquesta tesi, aquests resultats s'han estès a la escriptura manuscrita en àrab, en particular, a les bases de dades IfN/ENIT i NIST OpenHaRT. En aplicacions reals, la transcripció de text en àrab no es limita únicament al text manuscrit, sinó també al text imprès. El text imprès es pot interpretar com una forma simplificada de text manuscrit. Per tant, per a aquest tipus de text, també proposem l'ús de models BHMMs. A més a més, aquests models s'han comparat amb tecnologia de l'estat de l'art basada en xarxes neuronals. Una idea clau que ha demostrat ser molt eficaç en l'aplicació de models BHMMs és l'ús d'una finestra lliscant (sliding window) d'amplària adequada durant l'extracció de característiques. Aquesta idea ha permès obtenir resultats molt competitius tant en el reconeixement de text àrab manuscrit com en el de text imprès. De fet, un sistema basat en aquest tipus d'extracció de característiques va quedar en primera posició en el concurs ICDAR 2011 Arabic recognition competition emprant la base de dades Arabic Printed Text Image (APTI). A més a més, aquesta idea s'ha perfeccionat mitjançant l'ús de tècniques de reposicionament aplicades a les finestres extretes, donant lloc a noves millores en el reconeixement de text en àrab. En el cas de text manuscrit, aquest refinament ha aconseguit millorar el sistema que va ocupar el primer lloc en el concurs ICFHR 2010 Arabic handwriting recognition competition usant IfN/ENIT. En el cas del text imprès, aquest refinament va conduir a un sistema millor que va ocupar el segon lloc en el concurs ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text en el qual s'usava APTI. D'altra banda, aquesta tècnica s'ha avaluat també en tecnologia basada en xarxes neuronals, el que ha portat a resultats de l'estat de l'art. Respecte a la traducció automàtica, el sistema s'ha basat en la combinació de tres tipus de models estadístics de l'estat de l'art: els models standard phrase-based, els models hierarchical phrase-based i els models N-gram phrase-based. Aquesta combinació es va fer utilitzant el mètode Recognizer Output Voting Errada Reduction (ROVER). Finalment, s'han proposat tres mètodes per combinar els sistemes HTR i MT amb la finalitat de desenvolupar un sistema de traducció d'imatges de text àrab a anglès. El sistema s'ha avaluat sobre la base de dades NIST OpenHaRT, on s'han obtingut resultats competitius. / Alkhoury, I. (2015). Arabic Text Recognition and Machine Translation [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/53029 / TESIS
280

Detección de opinion spam usando PU-learning

Hernández Fusilier, Donato 20 July 2016 (has links)
[EN] Abstract The detection of false or true opinions about a product or service has become nowadays a very important problem. Recent studies show that up to 80% of people have changed their final decision on the basis of opinions checked on the web. Some of these opinions may be false, positive in order to promote a product/service or negative to discredit it. To help solving this problem in this thesis is proposed a new method for detection of false opinions, called PU-Learning*, which increases the precision by an iterative algorithm. It also solves the problem of lack of labeled opinions. To operate the method proposed only a small set of opinions labeled as positive and another large set of opinions unlabeled are needed. From this last set, missing negative opinions are extracted and used to achieve a two classes binary classification. This scenario has become a very common situation in the available corpora. As a second contribution, we propose a representation based on n-grams of characters. This representation has the advantage of capturing both the content and the writing style, allowing for improving the effectiveness of the proposed method for the detection of false opinions. The experimental evaluation of the method was carried out by conducting three experiments classification of opinions, using two different collections. The results obtained in each experiment allow seeing the effectiveness of proposed method as well as differences between the use of several types of attributes. Because the veracity or falsity of the reviews expressed by users becomes a very important parameter in decision making, the method presented here, can be used in any corpus where you have the above characteristics. / [ES] Resumen La detección de opiniones falsas o verdaderas acerca de un producto o servicio, se ha convertido en un problema muy relevante de nuestra 'época. Según estudios recientes hasta el 80% de las personas han cambiado su decisión final basados en las opiniones revisadas en la web. Algunas de estas opiniones pueden ser falsas positivas, con la finalidad de promover un producto, o falsas negativas para desacreditarlo. Para ayudar a resolver este problema se propone en esta tesis un nuevo método para la detección de opiniones falsas, llamado PU-Learning modificado. Este método aumenta la precisión mediante un algoritmo iterativo y resuelve el problema de la falta de opiniones etiquetadas. Para el funcionamiento del método propuesto se utilizan un conjunto pequeño de opiniones etiquetadas como falsas y otro conjunto grande de opiniones no etiquetadas, del cual se extraen las opiniones faltantes y así lograr una clasificación de dos clases. Este tipo de escenario se ha convertido en una situación muy común en los corpus de opiniones disponibles. Como una segunda contribución se propone una representación basada en n-gramas de caracteres. Esta representación tiene la ventaja de capturar tanto elementos de contenido como del estilo de escritura, permitiendo con ello mejorar la efectividad del método propuesto en la detección de opiniones falsas. La evaluación experimental del método se llevó a cabo mediante tres experimentos de clasificación de opiniones utilizando dos colecciones diferentes. Los resultados obtenidos en cada experimento permiten ver la efectividad del método propuesto así como también las diferencias entre la utilización de varios tipos de atributos. Dado que la falsedad o veracidad de las opiniones vertidas por los usuarios, se convierte en un parámetro muy importante en la toma de decisiones, el método que aquí se presenta, puede ser utilizado en cualquier corpus donde se tengan las características mencionadas antes. / [CAT] Resum La detecció d'opinions falses o vertaderes al voltant d'un producte o servei s'ha convertit en un problema força rellevant de la nostra època. Segons estudis recents, fins el 80\% de les persones han canviat la seua decisió final en base a les opinions revisades en la web. Algunes d'aquestes opinions poden ser falses positives, amb la finalitat de promoure un producte, o falses negatives per tal de desacreditarlo. Per a ajudar a resoldre aquest problema es proposa en aquesta tesi un nou mètode de detecció d'opinions falses, anomenat PU-Learning*. Aquest mètode augmenta la precisió mitjançant un algoritme iteratiu i resol el problema de la falta d'opinions etiquetades. Per al funcionament del mètode proposat, s'utilitzen un conjunt reduït d'opinions etiquetades com a falses i un altre conjunt gran d'opinions no etiquetades, del qual se n'extrauen les opinions que faltaven i, així, aconseguir una classificació de dues classes. Aquest tipus d'escenari s'ha convertit en una situació molt comuna en els corpus d'opinions de què es disposa. Com una segona contribució es proposa una representació basada en n-gramas de caràcters. Aquesta representació té l'avantatge de capturar tant elements de contingut com a d'estil d'escriptura, permetent amb això millorar l'efectivitat del mètode proposat en la detecció d'opinions falses. L'avaluació experimental del mètode es va dur a terme mitjançant tres experiments de classificació d'opinions utilitzant dues coleccions diferents. Els resultats obtingut en cada experiment permeten veure l'efectivitat del mètode proposat, així com també les diferències entre la utilització de varis tipus d'atributs. Ja que la falsedat o veracitat de les opinions vessades pels usuaris es converteix en un paràmetre molt important en la presa de decisions, el mètode que ací es presenta pot ser utilitzat en qualsevol corpus on es troben les característiques abans esmentades. / Hernández Fusilier, D. (2016). Detección de opinion spam usando PU-learning [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61990 / TESIS

Page generated in 0.0364 seconds