1 |
[pt] CLASSES DE PALAVRAS - DA GRÉCIA ANTIGA AO GOOGLE: UM ESTUDO MOTIVADO PELA CONVERSÃO DE TAGSETS / [en] PART OF SPEECH - FROM ANCIENT GREECE TO GOOGLE: A STUDY MOTIVATED BY TAGSET CONVERSIONLUIZA FRIZZO TRUGO 10 November 2016 (has links)
[pt] A dissertação Classes de palavras — da Grécia Antiga ao Google:
um estudo motivado pela conversão de tagsets consiste em um estudo
linguístico sobre classes gramaticais. A pesquisa tem como motivação uma
tarefa específica da Linguística Computacional: a anotação de classes
gramaticais (POS, do inglês part of speech ). Especificamente, a
dissertação relata desafios e opções linguísticas decorrentes da tarefa de
alinhamento entre dois tagsets: o tagset utilizado na anotação do corpus
Mac-Morpho, um corpus brasileiro de 1.1 milhão de palavras, e o tagset
proposto por uma equipe dos laboratórios Google e que vem sendo utilizado
no âmbito do projeto Universal Dependencies (UD). A dissertação tem
como metodologia a investigação por meio da anotação de grandes corpora
e tematiza sobretudo o alinhamento entre as formas participiais. Como
resultado, além do estudo e da documentação das opções linguísticas, a
presente pesquisa também propiciou um cenário que viabiliza o estudo do
impacto de diferentes tagsets em sistemas de Processamento de Linguagem
Natural (PLN) e possibilitou a criação e a disponibilização de mais um
recurso para a área de processamento de linguagem natural do português: o
corpus Mac-Morpho anotado com o tagset e a filosofia de anotação do
projeto UD, viabilizando assim estudos futuros sobre o impacto de
diferentes tagsets no processamento automático de uma língua. / [en] The present dissertation, Part of speech — from Ancient Greece to
Google: a study motivated by tagset conversion, is a linguistic study
regarding gramatical word classes. This research is motivated by a specific
task from Computational Linguistics: the annotation of part of speech
(POS). Specifically, this dissertation reports the challenges and linguistic
options arising from the task of aligning two tagsets: the first used in the
annotation of the Mac-Morpho corpus — a Brazilian corpus with 1.1
million words — and the second proposed by Google research lab, which
has been used in the context of the Universal Dependencies (UD) project.
The present work adopts the annotation of large corpora as methodology
and focuses mainly on the alignment of the past participle forms. As a
result, in addition to the study and the documentation of the linguistic
choices, this research provides a scenario which enables the study of the
impact different tagsets have on Natural Language Processing (NLP)
systems and presents another Portuguese NLP resource: the Mac-Morpho
corpus annotated with project UD s tagset and consistent with its annotation
philosophy, thus enabling future studies regarding the impact of different
tagsets in the automatic processing of a language.
|
2 |
[en] THE ADJETIVE/NOUN CONVERSION IN X-DO TYPE DEVERBAL CONSTRUCTIONS IN BRAZILIAN PORTUGUESE / [pt] A CONVERSÃO ADJETIVO/SUBSTANTIVO EM FORMAÇÕES DEVERBAIS X-DO NO PORTUGUÊS DO BRASILFABIO FLORES 03 February 2014 (has links)
[pt] Este trabalho investiga as formações deverbais X-do, com o objetivo de
determinar até que ponto tais formações estariam circunscritas à classe dos
adjetivos ou, ao contrário, apresentariam propriedades também de substantivos.
Inicialmente discorre-se sobre o problema da classificação de palavras segundo
diferentes perspectivas, tais como as da gramática tradicional e a do
Estruturalismo. A seguir, trata-se da questão da conversão categorial e do
tratamento dado pela gramática tradicional (como derivação imprópria) e pela
Morfologia Lexicalista com respeito às categorias lexicais. Ademais, trata-se da
questão da relação entre o adjetivo em –do e a função gramatical do particípio
passado. Também se aborda o papel da metonímia ao lado do processo
morfológico de formação de nomes de afetado do tipo X-do. Finalmente, discorrese
acerca de casos específicos, coletados a partir do jornal O Globo durante dois
meses. O apêndice constitui-se de testes elaborados a fim de identificar quais
formações ocorrem como substantivos convertidos, quais ocorrem como
substantivos apenas em contextos restritos a ocorrências genéricas e quais
ocorrem apenas como adjetivos. As conclusões são apresentadas a partir dos
resultados verificados mediante a aplicação dos testes. / [en] This work investigates X-do type deverbal constructions, in order to
determine whether such constructions are restricted to the class of adjectives or,
on the contrary, they would also present properties that are also typical of nouns.
Firstly, we consider the problem regarding word classes according to different
perspectives, such as Traditional Grammar and Structuralism. Then, we discuss
categorial conversion and its treatment in Traditional Grammar and Lexicalist
Morphology. Also, we discuss the relation between the X-do type adjective and
the past participle grammatical function. We approach the role of metonymy as
well, in connection with X-do formations corresponding to patient or affected
roles. Finally, we analyze specific cases, collected from O Globo newspaper for
the period of two months. The appendix consists of tests elaborated in order to
identify which formations occur as nouns formed by conversion and which occur
only as adjectives. Conclusions are presented according to the results obtained
through the application of the tests.
|
Page generated in 0.0368 seconds