• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 27
  • 5
  • 5
  • 5
  • 5
  • 5
  • 2
  • 2
  • 1
  • Tagged with
  • 27
  • 27
  • 27
  • 15
  • 12
  • 11
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Ambiente web de suporte à transcrição fonética automática de lemas em verbetes de dicionários do português do Brasil

Serrani, Vanessa Marquiafável [UNESP] 25 March 2015 (has links) (PDF)
Made available in DSpace on 2016-05-17T16:51:07Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-03-25. Added 1 bitstream(s) on 2016-05-17T16:54:38Z : No. of bitstreams: 1 000864228.pdf: 2383164 bytes, checksum: fad718fe09e30afea88a3e631be8664d (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / A transcrição fonética automática é uma tarefa essencial para muitas aplicações de diferentes áreas. Além de sistemas de síntese de fala que necessitam de transcrições de alta qualidade para obter um bom desempenho, sistemas de transcrição fonética automática podem ser utilizados em muitas outras áreas (fonética, fonologia, ensino-aprendizagem de língua, e assim por diante) com o objetivo de se obter transcrições preliminares de grandes córpus. Esse tipo de sistema frequentemente gera uma transcrição fonética a partir da forma ortográfica. Considerando o esforço despendido por lexicógrafos no desenvolvimento de transcrições fonéticas manuais para obras lexicográficas, este estudo teve como objetivo principal a criação de um ambiente computacional para transcrever foneticamente unidades lexicais que fazem parte da cabeça do verbete de dicionários mono ou multilíngues, do Português Brasileiro, com disponibilização gratuita, via Web, denominado PETRUS - PhonEtic TRanscriber for User Support. O propósito deste trabalho é contribuir, mesmo que modestamente, para que lexicógrafos, nosso principal público-alvo, possam desfrutar dos benefícios da automatização da transcrição fonética, diminuindo o tempo e as dificuldades de inserção desse tipo de informação em suas obras lexicográficas. Os resultados preliminares indicam uma taxa de acerto de 97.5% ao fone, com possibilidade de aumento / Automatic Phonetic Transcription is a crucial task for many applications of different areas. Besides Text-to-Speech systems, which need high quality transcriptions in order to have a good performance, automatic phonetic transcription tools can be useful in many areas (phonetics, phonology, language learning, and so on) in order to obtain preliminary transcriptions of large corpora. This kind of system often generate a phonetic transcription directly from the orthographic form. Considering the effort expended by lexicographers in the development of manual phonetic transcriptions to be added in their dictionaries, this study aimed the creation of a computational environment to support automatic phonetic transcription of lemmas, from mono or multilingual Brazilian dictionaries entries, to be available free of charge, via the Web, called PETRUS - PhonEtic TRanscriber for User Support. We intend to contribute, even modestly, so that lexicographers, our main target audience, can enjoy the benefits of automating the phonetic transcription, reducing the time and difficulty in integrating this kind of information in their lexicographical works. Preliminary results indicate a phone error rate accuracy of 97.5%, with the possibility of increase / FAPESP: 2011/01299-4
22

Propriedades das línguas naturais e o processo de aquisição = reflexões a partir da implementação do modelo em Berwick (1985) / Properties of natural languages and the acquisitions process : reflections based on an implementation of the model in Berwick (1985)

Faria, Pablo, 1978- 12 March 2009 (has links)
Orientador: Ruth Elisabeth Vasconcellos Lopes / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-16T06:36:14Z (GMT). No. of bitstreams: 1 Faria_Pablo_M.pdf: 1248984 bytes, checksum: 9609dfcb9ddec33250dfdefdb367fb5a (MD5) Previous issue date: 2009 / Resumo: Nesta dissertação de mestrado, o objetivo principal é refletir sobre algumas propriedades da linguagem e do processo de aquisição, tomando como ponto de partida questões que surgiram durante o processo de implementação do modelo proposto em Berwick (1985). O quadro teórico geral em que esta pesquisa se situa é o da Gramática Gerativa - na linha chomskiana - e, em particular, o modelo implementado aqui tem como principal base teórica a Gramática Transformacional (Cf. CHOMSKY, 1965). Entre as propriedades da linguagem que discutimos estão: os traços distintivos dos itens lexicais, a assimetria entre especificadores e complementos, categorias vazias e o papel da informação temática na sintaxe. A idéia subjacente que permeia as reflexões é a busca por um olhar mais abstrato sobre o conhecimento gramatical, procurando rever ou até eliminar dispositivos que, em primeiro lugar, aparecem como obstáculos significativos para o analisador e, em segundo lugar, resistem à identificação de evidências para sua aquisição, do ponto de vista do aprendiz da língua. Para atingir estes objetivos, a primeira metade do trabalho faz uma breve discussão teórica, para em seguida trazer uma apresentação razoavelmente detalhada do modelo de Berwick, incluindo exemplos de funcionamento. A segunda metade inclui a discussão dos resultados juntamente com as reflexões sobre a linguagem, procurando apontar caminhos que não apenas possam tornar o modelo de aquisição mais robusto, mas que levantem questões para investigação em teoria gramatical. Neste sentido, este trabalho - por se situar numa área multidisciplinar, a saber, a lingüística computacional - procura tornar explícitas as contribuições que esse tipo de investigação pode fazer à teoria lingüística. / Abstract: The main goal of this MA thesis is to discuss some properties of language and its acquisition process, taking as a starting point some issues that emerged during the implementation of the acquisition model proposed by Berwick (1985). Our general theoretical framework is the Generative Grammar - as proposed in Chomsky's works - and, in particular, the Transformational Grammar model (Cf. CHOMSKY, 1965). Some of the language properties discussed here involve: the set of distinctive features for lexical items, the asymmetry between specifiers and complements, empty categories and the role of thematic information in syntax. The subjacent idea surrounding the reections on language is the search for a more abstract view of the grammatical knowledge such that some of the theoretical devices can be revised or even abandoned. Two main goals drive this effort: first, the elimination of some significant obstacles in the parser's task to analyze sentences. Second, the elimination of those devices for which we cannot find proper evidence for their acquisition, considering the learner's perspective. In order to pursue these goals, in the first part of this work we set out the theoretical background for the whole discussion and give a somewhat detailed presentation of Berwick's acquisition model and examples of its functioning. In the second part we include a discussion of the results upon which the reection is built, whereby we point out some ways not only to increase the robustness of the acquisition model, but also to raise questions for further research in grammatical theory. In this sense, this work - which pertains to an interdisciplinary field, i.e, computational linguistics - tries to make explicit the contributions that this kind of investigation can offer to linguistic theory. / Mestrado / Linguistica / Mestre em Linguística
23

A linguística de corpos e o seriado Friends como base para o ensino de chunks em sala de aula de língua inglesa

Vicentini, Giseli Previdente Martins 18 May 2006 (has links)
Made available in DSpace on 2016-04-28T18:23:13Z (GMT). No. of bitstreams: 1 Giseli Previdente Martins Vicentini.pdf: 1229296 bytes, checksum: 846a1f274d842f51aa6d02bc8be3fcb9 (MD5) Previous issue date: 2006-05-18 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / The aim of this study was to suggest a complementation of an activity from the coursebook InsideOut Upper Intermediate (Kay e Jones, 2001), through Corpus Linguistic analysis. The main theoretical underpinning for the research is provided by Corpus Linguistics, which is an area that is concerned with the collection and analysis of corpora, which are collections of texts that have been carefully collected for linguistic research. Although the literature in the area is extensive, there is a shortage of research dealing with the areas of Corpus Linguistics and English Language Teaching the way this research attempts to do. Two corpora have been used in this research. The main corpus, which is a collection of all the episodes of the sitcom Friends, is made up of 883,453 words; the other corpus was a reference corpus containing 4.,35,731 words from the oral component of the British National Corpus (BNC). The research questions investigated in this study aimed at the identification, in the corpora, of the most frequent lexicogrammatical patterns of the words and expressions focused by the activity in the coursebook. The analysis made it possible to select lexicogrammatical patterns for inclusion in activities that were designed to complement activities in the coursebook. These were detailed in the third chapter of the disseertation. The study presented here will hopefully make an original contribution to the existing body of corpus-based research, more specifically in the area of Corpus Linguistics and English Language Teaching, by detailing an attempt at bringing together DDL and Sociointeractionism in practical activities for the EFL classroom / O trabalho teve como objetivo geral sugerir a complementação de uma atividade proposta pelo material didático InsideOut Upper Intermediate (Kay e Jones, 2001), tomando-se como ponto de partida, a investigação lingüística por meio de corpora. Para tanto, o trabalho encontrou suporte teórico na Lingüística de Corpus, que pode ser definida como a área da Lingüística que se ocupa da coleta e exploração de corpora, ou conjunto de dados lingüísticos textuais, em formato legível por computador, que foram coletados criteriosamente com o propósito de servirem para a pesquisa de uma língua ou variedade lingüística (Berber Sardinha, 2004:3). Além da Lingüística de Corpus, a pesquisa também inspirou-se na teoria socionteracionista de Vygotsky (1933/1989), mais especificamente, adotando critérios para a elaboração de material didático com características de mediação, descritos por Feuerstein (1990). Dois corpora foram empregados na pesquisa. O corpus de estudo é composto por todos os episódios das dez temporadas do seriado Friends, totalizando 883.453 palavras. O corpus de referência é composto pela parte oral do British National Corpus (BNC) 4.335.731 palavras. As questões de pesquisa propostas foram as seguintes: (1) Quais são os padrões léxico-gramaticais mais freqüentes das palavras e expressões propostas pela atividade do livro didático a ser complementado? (2) Os padrões encontrados no corpus de estudo também estão presentes no corpus de referência? (3) Como o resultado da análise pode ser transformado em atividades que promovam a conscientização desses padrões? (4) As atividades elaboradas colocaram em prática os princípios teóricos e metodológicos propostos em relação aos critérios de elaboração estabelecidos? Os resultados das análises permitiram a escolha criteriosa dos itens a serem utilizados na elaboração das atividades sugeridas no final do capítulo três. A pesquisa pretende ter contribuído para a área de Lingüística de Corpus mais especificamente para a área de Lingüística de Corpus e Ensino, na medida em que proporciona uma aplicação da Lingüística de Corpus e de seus procedimentos e ferramentas no ensino de Língua Inglesa. Além disso, ao fazer uso de critérios do DDL e da EAM conjuntamente, para a elaboração e sugestão de atividades didáticas, por meio de um corpus de linguagem oral, audiovisual, espera-se ter mostrado alguns possíveis caminhos para a aproximação entre DDL e alguns princípios do Sociointeracionismo, visando a preencher uma lacuna importante na literatura
24

A conversão sob a luz da linguistica de corpus

Costa, Roberto Diniz 27 October 2006 (has links)
Made available in DSpace on 2016-04-28T18:23:25Z (GMT). No. of bitstreams: 1 LAEL - Roberto Diniz Costa.pdf: 2645130 bytes, checksum: 0562e01165b5b50b5bb28a5ead342e23 (MD5) Previous issue date: 2006-10-27 / The main purpose of this study was to outline, describe what is widely called conversion and show, in an empirical way, how frequent this process is in order to point out which word classes are more converted in the English language. In order to achieve this objective, this study has found support in Corpus Linguistics, which is a Linguistics field that is concerned about analyzing any language empirically through corpora, which can be defined as authentic text compilations stored in computer files. Besides being supported by Corpus Linguistics, this dissertation has focused on the study of conversion, which is also called improper derivation in the prescriptive grammar. There is a great range of studies on the conversion process; however, very few of them has demonstrated empirically how frequent conversion is and they have seldom used authentic texts in their analysis. Therefore, this study has tried to fill this gap by being able to show empirically the limits towards conversion through the use of an authentic corpus, the British National Corpus. In order to achieve the objective of this study, the following questions have been stated: 1. What are the word classes that are most and least likely to be converted? 2. What is the conversion rate, in the selected corpus, between the words that are and are not involved in the conversion process? 3. In the selected corpus, what words show the widest array of grammar classes that can possibly be converted? 4. Are there any differences concerning the occurrence of conversion VII between the most frequent words and the words that show the widest array of grammar classes that can possibly be converted? If so, why? The corpus employed in the study was the British National Corpus, compiled from 100 million words. These words have been obtained from a wide array of sources, gathered in a way they could show a wide sample of spoken and written British English. It is obvious that, by dealing with a sample of the target language, the corpus might not represent a hundred percent of the language used. This way, it will always be an incomplete sample; therefore, when analyzing corpora, one should work with the concept of probability, which is really helpful to this study, once it made possible to show how probable conversion is. The results have indicated that conversion is a frequent process in the English language, once it involves 10 word classes and more than 36 million words. Moreover, it might be suggested that conversion is a living process in the English language and, through an empirical way, it is possible to point out that verbs, prepositions and pronouns are the most intrinsically related to conversion word classes. To sum up, this dissertation hopes that it has contributed to the study of conversion, since there are few studies that have demonstrated empirically how frequent conversion is. This work also presents and discusses the research limitations and its possible applications in the future, apart from pedagogical applications of the results / Este trabalho teve como objetivos principais delimitar e descrever o processo comumente chamado de conversão, demonstrar, de maneira empírica, sua freqüência para apontar as classes de palavras mais tipicamente convertidas na língua inglesa. Para tanto, o trabalho encontrou suporte teórico na Lingüística de Corpus, que se preocupa em analisar qualquer língua de maneira empírica, por intermédio de corpora, ou seja, compilações de textos autênticos armazenadas em formato de arquivo de computador. Além da Lingüística de Corpus, o projeto fundamentou-se no estudo da conversão, que é também chamada de derivação imprópria na gramática normativa. Há vários trabalhos que lidam com a questão da conversão; entretanto, nenhum deles demonstrou empiricamente quão freqüente a conversão é e quase nunca utilizaram textos autênticos como objeto de análise e exemplos. Desse modo, este trabalho buscou preencher essa lacuna, sendo, portanto, capaz de demonstrar empiricamente a extensão da conversão na língua inglesa por meio de um corpus autêntico, o British National Corpus. No intuito de operacionalizar os objetivos deste trabalho, foram elencadas as seguintes perguntas de pesquisa: 1. Quais são as classes de palavras mais e menos passíveis de serem convertidas na língua inglesa? 2. Qual é a proporção, no corpus selecionado, entre as palavras que estão envolvidas no processo de conversão e as que não são modificadas por esse fenômeno? 3. Quais são as palavras que apresentam maior repertório de classes de palavras passíveis de serem convertidas no corpus selecionado? IX 4. Há diferenças na freqüência do processo de conversão entre as palavras mais freqüentes e as que apresentam maior repertório de classes de palavras passíveis de serem convertidas? Em caso afirmativo, o que explica essa diferença? O corpus empregado na pesquisa foi o British National Corpus, (BNC), compilado a partir de 100 milhões de palavras obtidas da língua inglesa escrita e falada. As amostras de língua foram obtidas de uma grande variedade de fontes, reunidas de modo a mostrar um recorte abrangente do inglês britânico falado e escrito do final do século XX. É evidente que, por se tratar de uma amostra, o corpus pode não representar cem por cento da língua utilizada. Nesse sentido, será sempre uma amostra incompleta; dessa forma, ao estudar um corpus, devemos trabalhar com a questão de probabilidade, o que é extremamente útil para este trabalho, uma vez que nos permitiu determinar quão provável a conversão é. Os resultados indicaram que a conversão é um processo recorrente na língua inglesa, uma vez que envolve 10 classes de palavras e mais de 36 milhões de palavras. Além disso, pode-se sugerir que a conversão é um processo vivo na língua inglesa e, de maneira empírica, é possível apontar que as classes de palavras que estão mais intrinsecamente relacionadas à conversão são os verbos, as preposições e os pronomes. Por conseguinte, a pesquisa pretende ter contribuído para o estudo da conversão, uma vez que há poucos trabalhos que demonstrem, de maneira empírica, quão freqüente a conversão é. Desse modo, a pesquisa espera ter feito uma contribuição original para a área. O trabalho ainda apresenta e discute as limitações da pesquisa realizada, aponta possíveis desdobramentos deste estudo em pesquisas futuras e oferece sugestões dos resultados da pesquisa.
25

Um modelo computacional de aquisição de primeira língua / Properties of natural languages and the acquisitions process

Faria, Pablo, 1978- 24 August 2018 (has links)
Orientadores: Ruth Elisabeth Vasconcellos Lopes, Charlotte Marie Chamberlland Galves / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-24T00:21:30Z (GMT). No. of bitstreams: 1 Faria_Pablo_D.pdf: 2488292 bytes, checksum: c75ee78601e9b73c790d12ce7e2d414e (MD5) Previous issue date: 2013 / Resumo: Neste trabalho, o fenômeno de aquisição de uma língua natural é investigado através de uma modelagem computacional. O aprendiz modelado - apelidado de IASMIM - se caracteriza como um modelo computacional integrado de aquisição de primeira língua, visto que integra os processos de aquisição lexical e sintática. Além disso, o modelo foi concebido de modo a atender certos critérios de plausibilidade empírica e psicológica. A perspectiva teórica que norteia a investigação é a da Gramática Gerativa (cf. Chomsky, 1986) e este é um modelo voltado para a competência linguística, não um modelo de processamento ou de performance (i.e., de uso do conhecimento linguístico). O aprendiz modelado é capaz de adquirir um conhecimento gramatical relativamente abrangente e demonstra algum potencial translinguístico, particularmente no que diz respeito a variações de ordem. As simulações para avaliação do modelo permitem observar a emergência de padrões de adjunção e de recursividade na gramática, considerados aqui como as principais evidências de um conhecimento sintático mais elaborado. Finalmente, o modelo incorpora algumas noções caras à teoria sintática no âmbito do Programa Minimalista (cf. Chomsky, 1995b), tais como set- Merge, pair-Merge, "traço seletor" (cf. Chomsky, 1998), em conjunto com assunções sobre a binariedade das representações sintáticas e a hipótese de que a ordem linear não tem papel na sintaxe (cf. Uriagereka, 1999). O modelo incorpora, ainda, uma versão da representação semântico-conceitual proposta em Jackendoff (1990). Nesta modelagem, estas noções e assunções ganham uma interpretação concreta e integrada, interagindo na determinação das propriedades do conhecimento adquirido / Abstract: In the present work, the acquisition of natural languages is investigated through a computer simulation. The modelled learner - dubbed IASMIM - is characterized as an integrated computational model of first language acquisition, in the sense that it integrates the processes of lexical and syntactic acquisition. Furthermore, the model was conceived in order to be empirically and psychologically plausible. The theoretical perspective of this enterprise is that of Generative Grammar (cf. Chomsky, 1986) and this is a model concerned with linguistic competence, rather than language processing or performance (i.e., how the acquired knowledge is put to use). The modelled learner is capable of acquiring a relatively broad grammatical knowledge and shows some crosslinguistic abilities, in particular, the ability to handle languages with distinct word orders. In the simulations for evaluation of the model we can observe the emergence of adjunction and recursive patterns in the grammar, taken here as the main pieces of evidence of a more elaborated syntactic knowledge. Finally, the model embodies some central notions for syntactic theory under the Minimalist Program (cf. Chomsky, 1995b), such as set-Merge, pair-Merge and "selector feature" (cf. Chomsky, 1998), together with the assumptions that syntactic representations are strictly binary branching and that linear word order has no significant role in syntactic phenomena (cf. Uriagereka, 1999). The model also embodies a version of the semantic-conceptual representation proposed in Jackendoff (1990). They take a concrete and integrated existence in this model, interacting with one another to determine the properties of the acquired grammatical knowledge / Doutorado / Linguistica / Doutor em Linguística
26

Algoritmos OPWI e LDM-GA para sistemas de conversão texto-fala de alta qualidade empregando a tecnologia SCAUS / Algorithm OPWI and LDM-GA for high quality text-to-speech synthesis based on automatic unit selection

Morais, Edmilson da Silva 20 April 2006 (has links)
Orientador: Fabio Violaro / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-07T23:29:06Z (GMT). No. of bitstreams: 1 Morais_EdmilsondaSilva_D.pdf: 5597078 bytes, checksum: 4dec4fc5a56d9d1ff2204a3c1d7dd86b (MD5) Previous issue date: 2006 / Resumo: Esta Tese apresenta dois novos algoritmos denominados OPWI (Optimized Prototype Waveform Interpolation) e LDM-GA (Linguistic Data Mining Using Genetic Algorithm). Estes algoritmos são formulados no contexto de sistemas CTF-SCAUS (sistemas de Conversão Texto-Fala empregando a tecnologia de Seleção e Concatenação Automática de Unidades de Síntese). O algoritmo OPWI é apresentado como uma nova alternativa para o módulo de Back-End de sistemas CTF-SCAUS, permitindo modificações prosódicas e suavizações espectrais de alta qualidade. O algoritmo LDM-GA foi desenvolvido com o objetivo de minimizar problemas de treinamento, em sistemas CTF-SCAUS, relacionados a distribuições de probabilidade com características LNRE (Large Number of Rare Events). Resultados da avaliação dos algoritmos OPWI e LDM-GA são apresentados e discutidos detalhadamente. Além destes dois algoritmos, esta Tese apresenta uma ampla revisão bibliográfica sobre os principais módulos de um sistema CTF-SCAUS, módulos de Front-End (Módulo lingüístico), módulo prasódico, módulo de seleção de unidades de síntese e módulo de Back-End (Módulo de síntese) / Abstract: This Thesis presents two new algorithms for Unit Selection Based Text-to-Speech systems (USBTTS). The first algorithm is the OPWI (Optimized Prototype Waveform Interpolation), which was designed to be used as a Back-End module for USB-TTS. The second algorithm is the LDM-GA (Linguistic Data Mining Using Genetic AIgorithm), which was designed to minimize training problems related to LNRE (Large Number of Rare Events) distributions. Experimental results and analysis of the OPWI and LDM-GA algorithms are presented in detail. The OPWI algorithm is evaluated under operations af analysisjre-synthesis and pr~sodic modifications, TSM (Time Scale Modifications) and PSM (Pitch Scale Modifications). The LDM-GA is evaluated in the context of phaneme segmental duration prediction based on linear regression mo de!. In addition to these two new algorithms (OPWI and LDM-GA), this Thesis presents a large review of the main modules of a USB-TTS system,Front-End Module (Linguistic module), prosodic module, unit-selection module and Back-End module (Synthesis module) / Doutorado / Telecomunicações e Telemática / Doutor em Engenharia Elétrica
27

A formação de palavras no português do brasil: um estudo dos sufixos -eir e -ud numa abordagem computacional / The formation of words in Portuguese of Brazil: a study of the suffix -eir e -ud and a computational approach

Costa, Ednardo Luiz da January 2010 (has links)
COSTA, Ednardo Luiz da. A formação de palavras no português do Brasil: um estudo dos sufixos -eir e -ud numa abordagem Computacional .2010, 132 p. Dissertação (Mestrado em Linguística) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-Graduação em Linguística, Fortaleza-CE, 2010. / Submitted by nazareno mesquita (nazagon36@yahoo.com.br) on 2012-08-06T15:25:20Z No. of bitstreams: 1 2010_diss_ ELdaCosta.pdf: 831120 bytes, checksum: 2556ae3f825ffbf276110a73ff22dd6c (MD5) / Approved for entry into archive by Maria Josineide Góis(josineide@ufc.br) on 2013-09-23T23:26:36Z (GMT) No. of bitstreams: 1 2010_diss_ ELdaCosta.pdf: 831120 bytes, checksum: 2556ae3f825ffbf276110a73ff22dd6c (MD5) / Made available in DSpace on 2013-09-23T23:26:36Z (GMT). No. of bitstreams: 1 2010_diss_ ELdaCosta.pdf: 831120 bytes, checksum: 2556ae3f825ffbf276110a73ff22dd6c (MD5) Previous issue date: 2010 / Este estudo investiga a formação de palavras na Língua Portuguesa contemporânea do Brasil. Dentro da perspectiva da morfologia derivacional, esta pesquisa teve por objetivo desenvolver um estudo das regras de formação de palavras através dos sufixos -eir e -ud na Língua Portuguesa. Essas regras foram desenvolvidas para melhor investigar a produtividade do processo morfológico da sufixação sob a perspectiva da Teoria Gerativa, centramos nosso trabalho principalmente nas idéias sobre a formação de palavras desenvolvidas por Anderson (1992) e Rocha (1998). Realizamos uma pesquisa empírica para podermos alcançar os objetivos de nosso trabalho. Compilamos um corpus contendo exemplos dos seguintes corpora brasileiros: NILC- São Carlos, ConDivport e Chave. Além dessas fontes, coletamos também diversos textos de jornais e revistas on-line, de forma assistemática, com o intuito de melhor descrever o fenômeno da derivação sufixal no português brasileiro contemporâneo. O nosso trabalho também possui uma implementação computacional, uma vez que desenvolvemos a construção de um analisador automático de palavras derivadas. Utilizamos para isso o FSA Utilities (que atualmente é um dos mais usados pacotes de ferramentas computacionais para construção e manipulação de autômatos e transdutores de estados finitos) na modelação computacional deste fragmento da morfologia flexional e derivacional do português.

Page generated in 0.1479 seconds