Uma sentença em linguagem natural em formato textual é uma representação sucinta de um conjunto maior de informações contida numa mensagem que um ser humano deseja transmitir a outro. O entendimento de uma sentença pressupõe a obtenção dessas informações a partir da cadeia de caracteres que forma a sentença. Um dos objetivos do processamento computacional de linguagem natural é organizar e armazenar informações para utilizá-las na recuperação das informações subjacentes codificadas em texto. Esta tese apresenta um método para realizar este processo de decodificação de uma sentença, levantando um grafo que simultaneamente descreve a sua estrutura sintática dada por uma gramática e as relações de dependência entre seus elementos constituintes. A decodificação é realizada por um parser gerado automaticamente a partir da especificação de suas regras, permitindo a sua alteração de forma incremental. São apresentados técnicas de projeto e aspectos de implementação. / A sentence in natural language in text format is a reduced representation of a larger set of information contained in a message that a human wishes to transmit to another. The understanding of a sentence assumes that this information is obtained from the characters that form the sentence. One of the goals of natural language computational processing is to organize and store information for use in retrieving the underlying information encoded in text. This thesis presents a method to decode a sentence, obtaining a graph that simultaneously describes its grammatical phrase structure and the dependency relations between its constituents. The parser is automatically generated from the specification of its rules, allowing it to be incrementally modified. Project techniques and implementation aspects are presented.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-15042019-135251 |
Date | 07 December 2018 |
Creators | Miura, Newton Kiyotaka |
Contributors | José Neto, João |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Tese de Doutorado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.002 seconds