Return to search

Uma gramática LFG-XLE para o processamento sintático profundo da frase do português brasileiro / Chemical knowledge and principles agroecological in formation of young and adults farmers of the Course Technician of Agriculture of Proeja - IFPA - Campus Castanhal

SANTOS, Andréa Feitosa dos. Uma gramática LFG-XLE para o processamento sintático profundo da frase do português brasileiro. 2014. 181f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2014. / Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2015-04-14T14:40:19Z
No. of bitstreams: 1
2014_tese_afsantos.pdf: 4829005 bytes, checksum: ec110a9d0e7e0a67af100a1ae610369c (MD5) / Approved for entry into archive by Márcia Araújo(marcia_m_bezerra@yahoo.com.br) on 2015-04-15T14:54:22Z (GMT) No. of bitstreams: 1
2014_tese_afsantos.pdf: 4829005 bytes, checksum: ec110a9d0e7e0a67af100a1ae610369c (MD5) / Made available in DSpace on 2015-04-15T14:54:22Z (GMT). No. of bitstreams: 1
2014_tese_afsantos.pdf: 4829005 bytes, checksum: ec110a9d0e7e0a67af100a1ae610369c (MD5)
Previous issue date: 2014 / The present thesis describes the development of a Brazilian Portuguese sentence grammar, developed in the framework of a sophisticated computational formalism, named Lexical Functional Grammar, and implemented on a system that is state of the art in deep parsing environment in LFG generative model, the robust XLE. The main feature of the grammar is that it adopts the ParGram annotation system and the methodology agreed by XLE grammar developers. In the grammar fragment are modeled diverse elements of phrasal syntax. In our grammar were modeled constituents as IP and CP, elements that are head the sentences of the Portuguese. Also were modeled certain aspects of verbal subcategorization and argument structure. In terms of verbal elements, our grammar includes some cases of verbal complex made up of modal verbs and control verbs. The nominal elements treated in grammar, centrally, were the expletives and reflexive pronouns, and cases of nominal and determiners phrases with demonstrative pronouns and interrogative. The other aspects modeled in the grammar are PPs, whose complexity is given the distinction between semantic and nonstandard prepositions; the adjectival phrases, whose projection in the sentence can occur from attributive adjectival forms of ordinal or cardinal forms and as intensifiers; and adverbial phrases, whose internal structure was modeled taking into account both adverbs as intransitive and as transitive, with PP complement. Our evaluation shows that of the 40 tested sentences, our grammar assigns, for all of them, consistent and well-founded analysis, while the parser Palavras, the current state of the art in deep syntactic processing of Portuguese, assigns incorrect analysis for 9 sentences. Another evaluation shows that, of the 20 ungrammatical sentences tested both in our grammar, as in Palavras, only 2 received analysis by our grammar, while the Palavras provides analysis to 19 sentences. The work has essentially the goal of making a formal and grounded description in a broad range of phenomena in Brazilian Portuguese, but mainly aims to collaborate with a not trivial grammar of the sentence in the LFG-XLE formalism, effectively contributing to a grammatical resource turned to the natural language processing. / A presente tese descreve a elaboração de uma gramática da frase do Português Brasileiro, desenvolvida no quadro de um modelo teórico de sofisticado formalismo computacional, a Lexical Functional Grammar (LFG) e implementada no sistema que constitui o estado da arte em ambiente de processamento sintático profundo no modelo gerativo da LFG, o robusto Xerox Linguistic Environment (XLE). A principal característica da gramática é que adota o sistema de anotação do ParGram e a metodologia convencionada por desenvolvedores de gramática XLE. No fragmento de gramática estão modelados diversificados elementos da sintaxe frasal. Em nossa gramática, foram modelados constituintes oracionais como IP e CP, elementos que encabeçam as sentenças do português. Também foram modelados determinados aspectos da subcategorização verbal e da estrutura argumental. Dos elementos verbais, nossa gramática contempla alguns casos de complexos verbais constituídos de verbos modais e verbos de controle. Os elementos nominais tratados na gramática, de modo central, foram os pronomes expletivos e reflexivos, e os casos de sintagmas nominais e determinantes com pronomes demonstrativos e interrogativos. Os demais aspectos modelados na gramática são os sintagmas preposicionados, cuja complexidade se dá na distinção entre preposições semânticas e não semânticas; os sintagmas adjetivais, cuja projeção na sentença pode ocorrer a partir de formas adjetivais atributivas, de formas ordinais ou cardinais e na forma de intensificadores; e os sintagmas adverbiais, cuja estrutura interna foi modelada levando-se em consideração tanto advérbios intransitivos quanto transitivos com complemento PP. A nossa avaliação demonstra que das 40 sentenças testadas, a nossa gramática atribui, para todas elas, análises consistentes e bem fundamentadas, ao passo que o parser Palavras, o atual estado da arte em processamento sintático profundo do português, atribui, a 9 sentenças, análises incorretas. Uma outra avaliação demonstra que, das 20 sentenças agramaticais testadas tanto em nossa gramática, quanto no Palavras, somente 2 receberam análises por parte de nossa gramática, enquanto o Palavras fornece análises para 19 sentenças. O trabalho tem, essencialmente, o objetivo de fazer uma descrição formal e fundamentada de um amplo leque de fenômenos do português brasileiro, mas, sobretudo, tem o objetivo de contribuir com uma gramática não trivial da frase do português no formalismo LFG-XLE, disponibilizando efetivamente um recurso gramatical do português voltado para o processamento de linguagem natural.

Identiferoai:union.ndltd.org:IBICT/oai:www.repositorio.ufc.br:riufc/11367
Date January 2014
CreatorsSantos, Andréa Feitosa dos
ContributorsAraripe, Leonel Figueiredo de Alencar
Publisherwww.teses.ufc.br
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UFC, instname:Universidade Federal do Ceará, instacron:UFC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0817 seconds