Return to search

Análise de medidas de similaridade semântica na tarefa de reconhecimento de implicação textual / Analysis of Semantic Similarity Measures in the Textual Implication Recognition Task (Inglês)

Made available in DSpace on 2019-03-30T00:08:54Z (GMT). No. of bitstreams: 0
Previous issue date: 2017-12-19 / Textual Entailment is one of the topics treated by Natural Language Processing, a
subarea of computer science, artifical intelligence and linguistics. The focus of the textual entailment is the directional verification of the similarity relation between two fragments of text that can include syntatic and semantic aspects. Many automated methods for the recognition task have been advanced by virtue of the research and competitions conducted by the community in order to advance the quality of RTE (Recognizing Text Entailment). Challenges have become increasingly complex because of applications where textual entailment is used as Questions and Answers, Information Extraction, Summarization, Machine Translation Evaluation, and so on. This dissertation explores a range of approaches applied to the RTE task, starting with the recent methodologies used in the competitions for the task and proposes a framework with a hybrid approach to introduce semantic knowledge based on textual semantic similarity, ie, application of semantic similarity metrics between terms, generating semantic components - features - for an automatic learning process. In addition to textit framework, this paper analyzes the overlap of terms in two corpus, ASSIN and SNLI, showing the impact of the overlap in the RTE task.

Keywords: Computational Linguistics. Artificial Intelligence. Natural Language Process-
ing. Textual Entailment. Recognizing Text Entailment Task. Portuguese Language. / Implicação Textual é um dos temas tratados pelo Processamento de Linguagem Natural,
uma subárea da ciência da computação, inteligência artificial e da linguística. O foco
da implicação textual é a verificação direcional da relação de similaridade entre dois
fragmentos de texto que podem incluir aspectos sintáticos e semânticos. Muitos métodos
automatizados para a tarefa de reconhecimento tem avançado em virtude das pesquisas e
competições realizadas pela comunidade com o intuito de fomentar o avanço qualitativo
de RTE (Recognizing Textual Entailment). Os desafios têm se tornado cada vez mais
complexos em virtude das aplicações em que a implicação textual é usada como Resposta
a Perguntas, Extração de Informação, Sumarização, Avaliação de Tradução por Máquina
etc. Esta dissertação explora uma faixa de abordagens aplicada à tarefa de RTE, iniciando
com as metodologias recentes utilizadas nas competições para a tarefa, assim como
propõe um framework com abordagem híbrida para introduzir conhecimento semântico
baseado em similaridade semântica textual, ou seja, aplicação de métricas de similaridade
semântica entre os termos, gerando componentes semânticos - features - como entrada
para um processo de aprendizagem automática. Além do framework, este trabalho analisa
a sobreposição dos termos em dois corpus, ASSIN e SNLI, evidenciando o impacto da
sobreposição na tarefa de RTE.

Palavras-chave: Linguística Computacional. Inteligência Artificial. Processamento de
Linguagem Natural. Implicação Textual. Tarefa de Reconhecimento de Implicação Textual.
Língua Portuguesa.

Identiferoai:union.ndltd.org:IBICT/oai:dspace.unifor.br:tede/104542
Date19 December 2017
CreatorsFeitosa, David Barbosa
ContributorsPinheiro, Vladia Celia Monteiro, Furtado, João José Vasco Peixoto, Pinheiro, Vladia Celia Monteiro, Claro, Daniela Barreiro
PublisherUniversidade de Fortaleza, Mestrado Em Informática Aplicada, UNIFOR, Brasil, Centro de Ciências Tecnológicas
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UNIFOR, instname:Universidade de Fortaleza, instacron:UNIFOR
Rightsinfo:eu-repo/semantics/openAccess
Relation5443571202788449035, 500, 500, -7645770940771915222

Page generated in 0.0021 seconds