Spelling suggestions: "subject:"procesamiento dde lenguaje natural"" "subject:"procesamiento dee lenguaje natural""
21 |
Implementación de chatbots, migraciones y lago de datos en AWSÁvila Flores, Patricio José 13 February 2024 (has links)
Desde el momento del egreso en julio del 2020, se ha ejercido labores en
dos consultoras de servicios informáticos. Primero, en una consultora
canadiense llamada Rules Cube que se enfoca en el desarrollo de aplicaciones
en Pega. Segundo, en una consultora peruana llamada Tuxpas, que se
especializa en proyectos de implementación de chatbots en la plataforma
Workplace, y construcción de lagos de datos y migraciones en AWS.
En Rules Cube con el rol de practicante profesional de TI se apoyó en el
desarrollo de una aplicación móvil de reconocimiento de tickets y boletas de
compra por un período de cuatro meses. El objetivo de esta aplicación era
poder obtener con fotos rápidamente todos los gastos en los que se incurre día
a día. Como parte de las herramientas se utilizó Pega, Sharepoint, y diversos
aplicativos de la misma empresa.
En Tuxpas es donde se ha ejercido la gran mayoría del tiempo desde el
egreso. En el primer año en la compañía con el rol de desarrollador de software
se formó parte de un equipo que implementó y desplegó chatbots en la red
social para empresas Workplace para reconocer a colaboradores y conocer el
estado del clima laboral, en un cliente de venta de productos de beleza,
información que resultaba vital para la gerencia para conocer la
retroalimentación de trabajadores de primera línea.
En el segundo y tercer año, ahora con el rol de arquitecto de software y con
la responsabilidad de liderar proyectos, es que se han llevado a cabo diseños y
desarrollos de diversos lagos de datos y migraciones. Una de las migraciones
más resaltantes fue realizada para un cliente del sector salud y que implicó el
movimiento de toda su infraestructura y aplicaciones hacia la nube de AWS.
Esto incrementó enormemente la disponibilidad de las aplicaciones y gracias a
ello se redujo el tiempo de baja. Asimismo, se pudieron refactorizar las
aplicaciones para que puedan ser alojadas en servicios auto-escalables.
Más adelante, se llevó a cabo un lago de datos que centralizaba toda la
información generada en las diversas fuentes del cliente, perteneciente al
sector educativo. Esto permitió poder tener una misma estructura para todos
los datos, que en el origen se encontraba con distintas nomenclaturas que
hacían más difícil una visión completa de los datos generados. Además,
permitió agilizar la creación y ejecución de procesos analíticos para toda el
área de Inteligencia de Negocios.
|
22 |
Método de extracción e identificación de lugares del mundo real en textos en español del género literarioZevallos Franco, Melissa 04 June 2015 (has links)
En este proyecto de fin de carrera se ha escogido abarcar el tema de Turismo
Literario, resaltando principalmente la integración de una herramienta que ha existido
durante años, el libro, con las nuevas tecnologías de Reconocimiento de Entidades
Mencionadas (REM). Se propone implementar un método de extracción de lugares
que se encargue de procesar las obras literarias con la finalidad de identificar los
nombres de los lugares mencionados en dichos textos; para que éstos, finalmente,
sean validados en el mundo real con el apoyo de una librería de información
geográfica. Con el método implementado se va a obtener información, la cual puede
ser utilizada para la construcción de herramientas que permitan difundir y aprovechar
el Turismo Literario. Esta clase de turismo busca difundir los lugares reales que son
mencionados en las obras literarias Estos escenarios pueden ser parques,
restaurantes, pasajes, avenidas, entre otros lugares.
|
23 |
Interactive Pattern Recognition applied to Natural Language ProcessingRodríguez Ruiz, Luis 26 July 2010 (has links)
This thesis is about Pattern Recognition. In the last decades, huge efforts have been
made to develop automatic systems able to rival human capabilities in this field. Although
these systems achieve high productivity rates, they are not precise enough in
most situations. Humans, on the contrary, are very accurate but comparatively quite
slower. This poses an interesting question: the possibility of benefiting from both
worlds by constructing cooperative systems.
This thesis presents diverse contributions to this kind of collaborative approach.
The point is to improve the Pattern Recognition systems by properly introducing a
human operator into the system. We call this Interactive Pattern Recognition (IPR).
Firstly, a general proposal for IPR will be stated. The aim is to develop a framework
to easily derive new applications in this area. Some interesting IPR issues are
also introduced. Multi-modality or adaptive learning are examples of extensions that
can naturally fit into IPR.
In the second place, we will focus on a specific application. A novel method to
obtain high quality speech transcriptions (CAST, Computer Assisted Speech Transcription).
We will start by proposing a CAST formalization and, next, we will cope
with different implementation alternatives. Practical issues, as the system response
time, will be also taken into account, in order to allow for a practical implementation
of CAST. Word graphs and probabilistic error correcting parsing are tools that will
be used to reach an alternative formulation that allows for the use of CAST in a real
scenario.
Afterwards, a special application within the general IPR framework will be discussed.
This is intended to test the IPR capabilities in an extreme environment, where
no input pattern is available and the system only has access to the user actions to produce
a hypothesis. Specifically, we will focus here on providing assistance in the
problem of text generation. / Rodríguez Ruiz, L. (2010). Interactive Pattern Recognition applied to Natural Language Processing [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8479
|
24 |
Advances in Fully-Automatic and Interactive Phrase-Based Statistical Machine TranslationOrtiz Martínez, Daniel 14 October 2011 (has links)
This thesis presents different contributions in the fields of fully-automatic statistical machine
translation and interactive statistical machine translation.
In the field of statistical machine translation there are three problems that are to be addressed,
namely, the modelling problem, the training problem and the search problem. In this
thesis we present contributions regarding these three problems.
Regarding the modelling problem, an alternative derivation of phrase-based statistical
translation models is proposed. Such derivation introduces a set of statistical submodels governing
different aspects of the translation process. In addition to this, the resulting submodels
can be introduced as components of a log-linear model.
Regarding the training problem, an alternative estimation technique for phrase-based
models that tries to reduce the strong heuristic component of the standard estimation technique
is proposed. The proposed estimation technique considers the phrase pairs that compose
the phrase model as part of complete bisegmentations of the source and target sentences.
We theoretically and empirically demonstrate that the proposed estimation technique can be
efficiently executed. Experimental results obtained with the open-source THOT toolkit also
presented in this thesis, show that the alternative estimation technique obtains phrase models
with lower perplexity than those obtained by means of the standard estimation technique.
However, the reduction in the perplexity of the model did not allow us to obtain improvements
in the translation quality.
To deal with the search problem, we propose a search algorithm which is based on the
branch-and-bound search paradigm. The proposed algorithm generalises different search
strategies that can be accessed bymodifying the input parameters. We carried out experiments
to evaluate the performance of the proposed search algorithm. / Ortiz Martínez, D. (2011). Advances in Fully-Automatic and Interactive Phrase-Based Statistical Machine Translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/12127
|
25 |
Analítica de datos en información pública de medios periodísticos y redes sociales para el análisis de sentimiento: una revisión de literaturaZárate Calderón, Gabriel Hélard 02 February 2021 (has links)
El análisis de sentimiento es un área de investigación importante en el procesamiento de lenguaje natural, la cual está en constante crecimiento especialmente por la generación de grandes volúmenes de información textual, y el avance tecnológico en lo que se refiere al almacenamiento y los algoritmos inteligentes para el análisis de esta. Esta tarea cada vez va tomando más fuerza su uso en diferentes aplicaciones computacionales dado el crecimiento exponencial del uso de medios digitales y redes sociales, las cuales, gracias a la información debidamente procesada, pueden ser muy valiosas para los negocios.
Actualmente existen procedimientos ambiguos para la realización de dicha tarea y sobre todo para textos en español y de manera específica para notas periodísticas y publicaciones realizadas en redes sociales, todo ello por el hecho de la escasa cantidad de herramientas existentes para la presente tarea, por ende el proceso de clasificación de las polaridades de los sentimientos expresadas en los textos se realiza de manera manual por expertos en el tema, generándose así resultados ambiguos y sesgados según la experiencia del encargado, lo cual generaba resultados que no eran del todo fiables retándole valor a dicha tarea, además del hecho de que realizarlo de manera totalmente manual resultaba muy pesado y se realizaba en un periodo largo de tiempo.
Para la realización de dicha tarea existen múltiples técnicas de aprendizaje de máquina y de aprendizaje profundo que son adecuadas para este, pero en el último año uno de los modelos que va siendo reconocido cada vez más para ser aplicado a resolver problemas de procesamiento de lenguaje natural son los modelos basados en transformers dadas sus buenas capacidades y los resultados que se obtienen con estos. Ante dicha problemática surge la necesidad de investigar más acerca de cómo se vienen implementando soluciones para la realización de análisis de sentimiento para hacer una comparativa sobre los modelos usados y además dadas las buenas capacidades de los modelos basados en transformers investigar más a fondo la utilidad de estos y las aplicaciones que tiene para así comprobar sus buenas capacidades.
|
26 |
Agrupamiento de textos basado en la generación de EmbeddingsCachay Guivin, Anthony Wainer 19 August 2022 (has links)
Actualmente, gracias a los avances tecnológicos, principalmente en el mundo de la
informática se logra disponer de una gran cantidad de información, que en su mayoría son
una composición de signos codificados a nivel computacional que forman una unidad de
sentido, como son los textos. Debido a la variabilidad y alta volumetría de información
navegable en internet hace que poder agrupar información veraz sea una tarea complicada.
El avance computacional del lenguaje de procesamiento natural está creciendo cada día
para solucionar estos problemas.
El presente trabajo de investigación estudia la forma como se agrupan los textos con
la generación de Embeddings. En particular, se centra en usar diferentes métodos para
aplicar modelos supervisados y no supervisados para que se puedan obtener resultados
eficientes al momento de toparse con tareas de agrupamiento automático.
Se trabajó con cinco Datasets, y como resultado de la implementación de los modelos
supervisados se pudo determinar que el mejor Embedding es FastText implementado con
Gensim y aplicado en modelos basados en boosting. Para los modelos no supervisados el
mejor Embedding es Glove aplicado en modelos de redes neuronales con AutoEncoder y
capa K-means. / Nowadays, thanks to technological advances, mainly in the world of information
technology, a large amount of information is available, most of which is a composition of
signs encoded at a computational level that form a unit of meaning, such as texts. Due to
the variability and high volume of navigable information on the Internet, grouping truthful
information is a complicated task. The computational advance of natural language
processing is growing every day to solve these problems.
The present research work studies the way texts are clustered with the generation of
Embeddings. In particular, it focuses on using different methods to apply supervised and
unsupervised models so that efficient results can be obtained when encountering automatic
clustering tasks.
Five Datasets were worked with, and as a result of the implementation of the
supervised models it was determined that the best Embedding is FastText implemented
with Gensim and applied in models based on boosting. For the unsupervised models the
best Embedding is Glove applied in neural network models with AutoEncoder and K-means
layer.
|
27 |
Identificación del sentimiento de entidades en notas periodísticas basado en técnicas de procesamiento de lenguaje natural: una revisión de literaturaLau Li, Julio Ka Jau 15 March 2021 (has links)
El análisis de sentimiento a nivel de entidades sobre notas periodísticas es una tarea de una
complejidad no trivial, lo que genera interés por parte de diferentes sectores, ya que esos tipos
de fuentes de datos causa que los sentimientos identificados no convergen hacia un objetivo
por su longitud extensa y variedad de temas. Sin embargo, no se sabe a ciencia cierta su
dificultad, por lo que el objetivo principal es poder identificar los conocimientos e información
disponible y existente en la actualidad para responder las preguntas formuladas. Por eso, se
define una revisión de literatura tomando en consideración la base de datos Scopus y el empleo
de palabras claves definidas por el método PICOC, donde se obtuvieron en total siete
documentos, cuatro artículos y tres revisiones sistemáticas que evidencian una disponibilidad
de espacio para experimentar y explorar, dado que principalmente se ha trabajado en medios
con mayor cantidad de datos y menor complejidad como las redes sociales o encuestas de
servicios. Esto se reafirmó al revisar los documentos de tesis asociados a este tema, donde
inclusive su demanda ha superado a paradigmas de análisis de sentimientos más clásicos. Es
por ello, que se concluye la necesidad de explotar esta área de conocimientos para poder
satisfacer la demanda de información cada vez más granulada, relevante y compleja,
aprovechando los recursos lingüísticos más óptimos para facilitar las labores que puedan
presentarse.
|
28 |
Diseño de un modelo explicativo basado en ontologías aplicado a un chatbot conversacionalArteaga Meléndez, Daniel Martin 15 January 2024 (has links)
Actualmente, la inteligencia artificial es una de las áreas de investigación más importantes para el desarrollo de tecnología en múltiples disciplinas. Aunque ha tenido un crecimiento exponencial en los últimos años, el entendimiento de cómo funciona es mínimo para la mayoría de las personas. En consecuencia de ello, su uso en actividades que implican una toma de decisiones es limitado, lo cual se evidencia en el Reporte 2023 de Artificial Intelligence Index [1]. Según este reporte, el cambio porcentual en las respuestas de adopción de la inteligencia artificial por industria y actividad entre el 2021 y 2022 ha sido de -15% y -13% para las actividades de marketing y ventas, y desarrollo de productos y/o servicios, respectivamente. Frente a esto se propone el diseño de un modelo que permita explicar los componentes básicos de un sistema basado en inteligencia artificial a través de un chatbot conversacional en idioma inglés. De este modo, la explicación se brinda en un formato sencillo (texto) y a través de un medio interactivo (conversación). El modelo explicativo se basa en la ontología XAIO, propuesta en este estudio y desarrollada a partir de dos ontologías de aprendizaje de máquina e inteligencia artificial explicable. Haciendo uso de un modelo de generación de lenguaje natural a partir de datos estructurados, el modelo explicativo genera explicaciones en lenguaje natural basadas en el conocimiento descrito en las tripletas de la ontología XAIO. Para evaluar el modelo se implementó un chatbot conversacional que utiliza un modelo de entendimiento de lenguaje natural para identificar intenciones y entidades, a partir de las cuales se realizan las consultas en la ontología que permiten obtener las tripletas. En la evaluación cuantitativa se obtuvo un BLEU promedio de 76.97, lo cual indica un buen desempeño en la tarea de generación de lenguaje natural a partir de datos estructurados. Asimismo, se desarrollaron sistemas de inteligencia artificial explicable con chatbot para la prueba con usuarios y se obtuvo un SUS de 69, indicando una usabilidad por encima del promedio. Finalmente, también se realizó una evaluación cualitativa para obtener las apreciaciones de los participantes acerca de los sistemas, las cuales señalan la coherencia al momento de responder, la sencillez de las respuestas y la interacción amigable con el chatbot. / Nowadays, artificial intelligence is one of the most important research areas for the technological development of many disciplines. Although it has grown exponentially in recent years, understanding of how it works is minimal for most people. Consequently, its use in decision making activities is limited, as evidenced in the Artificial Intelligence Index Report 2023 [1]. According to this report, the percentage change in the response of artificial intelligence assimilation by industry and activity between 2021 and 2022 has been -15% and -13% for marketing and sales activities, and product and/or service development, respectively. In view of this, we propose the design of a model to explain the basic components of a system based on artificial intelligence through a conversational chatbot developed in English. Thus, the explanation is provided in a simple format (text) and through an interactive manner (conversation). The explanatory model is based on the XAIO ontology, proposed in this study, and developed from two ontologies of machine learning and explainable artificial intelligence. Using a natural language generation model from structured data, the explanatory model generates natural language explanations based on the knowledge described in the triplets of the XAIO ontology. For evaluation purposes, a conversational chatbot was implemented. This chatbot uses a natural language understanding model to identify intentions and entities. Then it uses ontology queries build from the intentions and entities to get the ontology triplets. Regarding quantitative evaluation, an average BLEU of 76.97 was obtained, which indicates a good performance in the task of natural language generation from structured data. Likewise, explainable artificial intelligence systems were developed with chatbot for user testing and a SUS of 69 was obtained, indicating above-average usability. Finally, a qualitative evaluation was also carried out to obtain the participants' feedback about the systems. They mainly pointed out the coherence at the time of answering, the simplicity of the answers and the friendly interaction with the chatbot.
|
29 |
Revisión sistemática sobre la aplicación de ontologías de dominio en el análisis de sentimientoOlivares Poggi, César Augusto 26 November 2016 (has links)
El análisis de sentimiento es un área de creciente investigación en los campos
del procesamiento de lenguaje natural y la recuperación de información. En
los últimos años ha habido un aumento en la aplicación de técnicas semánticas
en el análisis de sentimiento, en particular con el apoyo de la aplicación de
ontologías de dominio. Sin embargo, en la literatura actual no se cuenta con
un estudio que reporte de manera sistemática los beneficios alcanzados con la
aplicación de ontologías de dominio al análisis de sentimiento. Esta revisión
sistemática tiene por objetivos realizar dicha síntesis, reportar el grado de
generalización de las investigaciones realizadas, verificar el aprovechamiento
de la riqueza expresiva de las ontologías de dominio y señalar el estado del
arte actual en la representación de las emociones humanas por medio de
ontologías de dominio en su aplicación al análisis de sentimiento.
Se identificó 9 distintos problemas del análisis del sentimiento a los que se
aplicó ontologías de dominio y un total de 22 beneficios de dicha aplicación.
Los beneficios más reportados son: (1) el soporte para una representación
estructurada de las opiniones y la vinculación de datos; (2) mayor precisión
y exhaustividad en la clasificación de la polaridad; y (3) soporte para la
representación de modelos emocionales.
Como investigación futura se sugiere profundizar en el empleo de ontologías
de dominios para analizar el sentimiento a nivel de conceptos, modelar el
proceso de análisis de sentimiento, estandarizar la elaboración de ontologías
de productos e integrar diversos modelos emocionales, así como aprovechar
mejor la expresividad semántica y capacidad de razonamiento de las ontologías
de dominio. / Tesis
|
30 |
Una aproximación a la desambiguación del sentido de las palabras basada en clases semánticas y aprendizaje automáticoIzquierdo Beviá, Rubén 17 September 2010 (has links)
No description available.
|
Page generated in 0.1189 seconds