CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior / Esse trabalho possui um recorte teÃrico-metodolÃgico que se decompÃe em dois domÃnios complementares: o LinguÃstico e o Computacional/Implementacional. Pelo seu cunho computacional, o escopo primeiro desse trabalho està diretamente ligado ao processamento de lÃngua natural (PLN). Desse modo, implementa-se uma anÃlise sintÃtica automÃtica (parsing) de expressÃes de lÃngua portuguesa em programas da biblioteca em Python do NLTK, cujas anÃlises sÃo representadas em forma de configuraÃÃes arbÃreas que demonstram categorias vazias de sentenÃas finitas do portuguÃs. Ainda pelo cunho computacional, esse trabalho elabora um fragmento de gramÃtica, modelado para capturar traÃos especÃficos da estrutura linguÃstica do portuguÃs, com base no modelo formal de descriÃÃo linguÃstica conhecido como GramÃtica Livre de Contexto (CFG) Baseada em TraÃos, com a finalidade de demonstrar como a biblioteca de programas do NLTK dà suporte à realizaÃÃo dos analisadores sintÃticos na anÃlise da estrutura de traÃos. Pelo seu cunho lingÃÃstico, analisa-se, de acordo com a Teoria X-barra e o Programa Minimalista, frases nas variantes europeia e brasileira da lÃngua portuguesa, obtidas de pesquisas em corpora eletrÃnicos disponÃveis na web. E ainda nesse trabalho, descreve-se e discute-se a categoria IP (sintagma flexional) dentro da sua estrutura hierÃrquica de constituintes, de acordo com a hipÃtese da operaÃÃo sintÃtica de movimento visÃvel e nÃo visÃvel dos elementos linguÃsticos, especificamente o movimento do verbo / This work has a theoretical and methodological framework that is divided into two complementary areas: the Language and Computational/Implementacional. For its computational stamp, the first scope of this work is directly linked to the processing of natural language (PNL). Thus, it implements an automatic syntactic analysis (parsing) of expressions of Portuguese in a computational program from the Python library of NLTK, whose tests are represented in tree configurations that show slash categories of finite sentences of Portuguese. Although the stamp computing, this research elaborates a grammar fragment, modeled to capture specific features of linguistic structure of Portuguese, based on the formal model of description linguistic known as Context Free Grammar (CFG) Based on Features, with the purpose of demonstrate how the library of NLTK programs supports the implementation of parsers for analyzing the feature structure. For its stamp of language, it analyzes, according to X-bar Theory and the Minimalist Program, sentences in European and Brazilian variants of Portuguese, obtained from surveys in electronic corpora available on the web. And this work describes and discusses the category IP (inflectional phrase) within the hierarchical structure of constituents, according to the hypothesis of syntactic operation of visible and invisible movement of elements of language, specifically the movement of the verb
Identifer | oai:union.ndltd.org:IBICT/oai:www.teses.ufc.br:3050 |
Date | 10 November 2009 |
Creators | AndrÃa Feitosa dos Santos |
Contributors | Leonel Figueiredo de Alencar Araripe, AntÃnio Luciano Pontes, Rosemeire Selma Monteiro |
Publisher | Universidade Federal do CearÃ, Programa de PÃs-GraduaÃÃo em LingÃÃstica, UFC, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFC, instname:Universidade Federal do Ceará, instacron:UFC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds