Global ETD Search

141	A tradução de binômios nos contratos de \'common law\' à luz da lingüística de corpus / Translating binomial expressions in common law agreements: a corpus-based study Luciana Carvalho Fonseca 30 May 2007 (has links) O objetivo desta pesquisa é estudar os binômios que ocorrem em contratos de common law à luz da Lingüística de Corpus, procurando dar subsídios que auxiliem os tradutores de textos jurídicos a chegar a uma tradução natural, ou seja, para que traduzam linguagem jurídica por linguagem jurídica. Os binômios são formados por duas palavras pertencentes à mesma categoria gramatical, ligadas pela conjunção and ou or. Alguns exemplos são: terms and conditions, any and all, executed and delivered, due and payable, action or proceeding, agreement or obligation. Os binômios são uma marca do inglês jurídico e como tal têm sido objeto de diversos estudos. O mesmo, porém, não ocorre com a linguagem jurídica em português. Assim, ao lidar com a tradução de binômios, estudos mostram que os tradutores brasileiros se apegam à opção mais literal. A escolha de estudar os binômios nos contratos de common law se deve ao fato de estarem os contratos entre os documentos mais difíceis de traduzir e de ler e por terem uma altíssima concentração de binômios. Por essas razões, para estudar os binômios na linguagem jurídica em inglês e dar elementos para o tradutor chegar à tradução em português do Brasil, compilamos um corpus comparável de agreements e contratos autênticos perfazendo, aproximadamente, 1 milhão de palavras - 705 744 em inglês e 289 984 em português - composto por 5 amostras de 28 espécies de contratos e agreements, totalizando 140 documentos em cada língua. O corpus foi explorado de acordo com os princípios e ferramentas da Lingüística de Corpus. Para etiquetar o corpus usamos o programa CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System) do UCREL (Universidade de Lancaster) e para explorá-lo, o WordSmith Tools de Mike Scott. / This research aims at studying binomial expressions in common law agreements in the light of Corpus Linguistics in an attempt to provide translators with the necessary linguistic elements that will enable them to render a natural translation, that is, to translate legal language into legal language. Binomial expressions are formed by two words belonging to the same grammatical category and joined by and or or. Some examples are: terms and conditions, any and all, executed and delivered, due and payable, action or proceeding, agreement or obligation. Binomials are an integral part of English legal language and as such have deserved a considerable amount of study. The same, however, does not occur in Brazilian Portuguese legal language. Therefore, when dealing with binomial expressions, studies show that Brazilian translators tend to translate all the elements of a binomial literally. The choice of text type is due to the fact that agreements and contratos are among the most difficult documents to translate and seem to have an incredibly high concentration of binomial expressions. For said reasons, in order to study binomials in English legal language and provide elements for translators to arrive at their own translation into Brazilian Portuguese, we have compiled and explored a bilingual comparable corpus consisting of authentic agreements and contratos, totalling, approximately, 1 million words - 705,744 in English and 289,984 in Brazilian Portuguese - made up of 5 samples of 28 different kinds of contratos and agreements, a total of 140 documents in each language. Exploring such a corpus greatly depended on the principles and tools of Corpus Linguistics. To tag the corpus we used UCREL\'s CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System) and to explore the corpus we used Mike Scott\'s WordSmith Tools. Binômios Common law Contratos Lingüística de corpus Tradução jurídica Agreements Binomials Common law Corpus linguistics Legal translation
142	VoTec: a construção de vocabulários eletrônicos para aprendizes de tradução / VoTec: the construction of electronic vocabularies for translation learners Guilherme Fromm 31 January 2008 (has links) O presente trabalho visa descrever a construção de um Vocabulário Técnico Online, denominado VoTec e disponibilizado em uma página da Internet, para aprendizes de Tradução. São discutidos vários modelos de obras similares que serviram de base para o desenvolvimento do mesmo. O VoTec é uma ferramenta que se vale de corpora técnicos para a construção de seus verbetes e de um banco de dados (ambos exaustivamente descritos) para o seu funcionamento. São apresentados, também, o resultado de duas pesquisas realizadas com tradutores: uma com profissionais da área, para colher suas opiniões sobre obras terminográficas em geral, e outra com aprendizes, para colher suas opiniões após o uso da ferramenta. A inovação proposta pela ferramenta é a possibilidade de customização de seus modos de apresentação na tela e as formas de busca no banco de dados. O modo de apresentação possibilita duas formas de visualização da microestrutura: a normal, formatada como os dicionários impressos, e a descritiva, uma forma própria dos dicionários eletrônicos, em que a microestrutura é descrita de forma hierárquica. A consulta ao banco de dados pode ser feita de três modos diferentes: total, tradutor e modular. A consulta total disponibiliza praticamente todos os campos existentes no banco de dados; a do tradutor apresenta os campos que se destacaram na pesquisa realizada com os profissionais da área; a modular é montada de acordo com as necessidades tradutórias do consulente, isto é, ele pode visualizar ou não cada campo disponível no banco de dados. Além dessas consultas ligadas ao banco, a página do VoTec disponibiliza, também, links para pesquisa externa em páginas pertinentes, como dicionários e enciclopédias online. / The present work aims at describing the construction of an Online Technical Vocabulary, to be known as VoTec and available on an Internet site for Translation learners. Many similar models are discussed and taken into account in its development. The VoTec is a tool that relies on a technical corpora and a data bank (both exhaustively described) to build up the entries available at the site. The results of two researches with translators are also shown: one with the professionals in the area, to collect their opinions about terminographical reference works in general, and another one with the learners, to elicit their opinions on the tool after they had their first contact with it. The innovation proposed by the tool is the possibility of customizing the display of its screens and the searches the data bank make available. The screen display offers two ways to view the microstructure: the normal one, similar to a paperback dictionary model, and the descriptive one, typical of electronic dictionaries, where the microstructure is described in a hierarchical way. The data bank can be searched in three different ways: total, translator and modulated. The total search shows almost all the fields available in the data bank; the translator one shows the fields that were highlighted by the professional translators in one of the researches; the modulated one is built up according to the user\'s translation necessities, that is, he/she can choose which field or fields of the data bank will be shown. Besides these searches which access the data bank, the VoTec page also offers links to external searches in related webpages, such as online dictionaries and encyclopedias. Ensino da Tradução Lingüística de Corpus Tecnologia da Informação Terminografia Terminologia Corpus Linguistics Information Technology Terminography Terminology Translation Training
143	A tradução de jogos de palavras no romance O Xangô de Baker Street: uma revisão do quadro de estratégias de Delabastita com o auxílio da Linguística de Corpus / The translation of wordplays in the novel O xangô de Baker Street: a review of Delabastitas framework with the support of Corpus Linguistics. Nilson Roberto Barros da Silva 24 August 2015 (has links) Esta tese analisa a tradução de jogos de palavras do romance O xangô de Baker Street (SOARES, 1995), traduzido para o inglês por Clifford Landers em 1997, e o faz com base no quadro de estratégias de tradução de jogos de palavras apresentado por Delabastita (1996). O corpus de estudo é composto pelo romance citado mais a sua tradução para a língua inglesa, A samba for Sherlock. Esta investigação utiliza a abordagem teórico-metodológica da Linguística de Corpus e se caracteriza como um estudo direcionado pelo corpus (TOGNINI-BONELLI, 2001), uma vez que os dados analisados foram evidenciados a partir da exploração de linhas de concordância elaboradas com palavras-chave do corpus de estudo. A exploração do corpus de estudo (de modo especial, a geração e a análise da lista de palavras-chave e das linhas de concordância, bem como o alinhamento do corpus nas duas línguas português e inglês) contou com o auxílio do programa WordSmith Tools 6.0 (SCOTT, 2012), desenvolvido especialmente para a análise lexical. A análise das traduções demonstrou que o quadro de estratégias apresentado por Delabastita (1996) dá conta apenas de parte dos procedimentos observados na tradução dos jogos de palavras investigados. Em decorrência disso, esta tese propõe a ampliação do quadro de estratégias apresentado pelo referido autor, por meio do acréscimo de quatro novas estratégias de tradução de jogos de palavras, quais sejam: 1) o jogo de palavras da língua-fonte é traduzido por um jogo de palavras na língua-alvo e adiciona-se uma explicação; 2) o tradutor realiza uma alteração textual (a substituição de uma palavra no texto inteiro, por exemplo) para viabilizar a tradução de um jogo de palavras; 3) o tradutor reproduz o jogo de palavras do texto-fonte no texto da língua-alvo, sem traduzilo, e adiciona uma explicação; 4) o tradutor reproduz o jogo de palavras do texto-fonte no texto da língua-alvo, sem traduzi-lo, mas suprime elementos (ou a repetição de elementos) constitutivos do jogo de palavras original. / Based on Delabastita\'s (1996) framework for wordplay translation strategies, this dissertation analyzes the translation of wordplays in the novel O Xangô de Baker Street (SOARES, 1995), translated into English by Clifford Landers in 1997. Our study corpus consists of the above mentioned novel and its translation into English, A samba for Sherlock. This research uses the theoretical and methodological approach of Corpus Linguistics and is characterized as \'corpus-driven\' (TOGNINI-BONELLI, 2001), once the data analyzed were highlighted in the concordances generated from keywords of the corpus. The exploration of the corpus (in particular, the generation and analysis of the keyword list and concordances as well as the corpus alignment in both languages - Portuguese and English) was carried out with the lexical analysis software WordSmith Tools 6.0 (SCOTT, 2012). A qualitative analysis of equivalence choices showed that Delabastita\'s (1996) framework matches only partially the procedures observed in the translation of the wordplays investigated. As a result, this dissertation proposes the expansion of Delabastitas framework by means of four new translation strategies of wordplays, as follows: 1) the source language wordplay is translated by a wordplay in the target language and an explanation is added; 2) the translator changes the text (by substituting a word in the whole text, for instance) in order to enable the translation of a wordplay; 3) the translator reproduces the source language wordplay in the target language text, without translating it, and adds an explanation; 4) the translator reproduces the source language wordplay in the target language text, without translating it, but suppresses elements (or the repetition of elements) which constitute the original wordplay. Estratégias de tradução Jogos de palavras Linguística de Corpus Corpus Linguistics Translation strategies Wordplays
144	A lingüística de corpus a serviço do tradutor: proposta de um dicionário de culinária voltado para a produção textual / Corpus linguistics at the translator\'s service: proposal of an online dictionary of culinary aiming at text production Elisa Duarte Teixeira 01 December 2008 (has links) Os dicionários sempre foram e ainda são uma das principais ferramentas da tarefa tradutória. No entanto, a terminografia parece não ter se beneficiado ainda de forma sistemática, pelo menos no Brasil, da estreita relação entre dicionários técnicos e esse público-alvo específico e cada vez mais expressivo: os tradutores técnicos. Na área da Culinária, por exemplo, cuja demanda por traduções tem crescido regularmente no país, os dicionários disponíveis no par de línguas inglês-português, ainda que possam contribuir para a compreensão do texto original, não dão qualquer informação sobre como os termos são, de fato, usados em textos reais na área, ou seja, não auxiliam o tradutor numa etapa fundamental da atividade tradutória: a produção textual na língua de chegada. Nossa tese é a de que um dicionário que procure atender as necessidades de produção textual do tradutor deve concentrar-se nos aspectos que caracterizam o texto técnico do ponto de vista da tradução, isto é, deve descrever e propor equivalentes ou soluções tradutórias para as Unidades de Tradução Especializadas (UTEs) presentes nesses textos, com as quais o tradutor da área se depara freqüentemente em sua prática, sejam elas terminológicas ou não. A Lingüística de Corpus (L.C.), abordagem empirista que vê a língua como um sistema probabilístico, tem se dedicado à identificação de padrões léxico-gramaticais recorrentes na linguagem por meio da observação de textos autênticos organizados sob a forma de corpora eletrônicos. É, portanto, a área de estudos que julgamos fornecer os subsídios teóricos e metodológicos mais adequados para compilar as UTEs a partir de textos reais. Para abrigar essas unidades, apresentamos uma proposta de dicionário online bidirecional inglês-português voltado para o tradutor da área técnica da Culinária. As etapas seguidas no desenvolvimento deste trabalho estão organizadas em seis capítulos. O primeiro trata de aspectos teórico-práticos da tradução técnica e discute o papel da terminologia na prática tradutória. O segundo examina as especificidades do trabalho do tradutor da área da Culinária no Brasil e caracteriza a receita culinária , foco de nosso estudo, como gênero e tipologia textual. No terceiro capítulo, as bases teóricas e metodológicas da L.C. são apresentadas, bem como os critérios de coleta do corpus que servirá de base para a identificação das UTEs. O Capítulo IV descreve a etapa de exploração desse corpus: primeiramente, apresentamos o estudo em que é feito um levantamento manual de padrões léxicogramaticais usando o programa WordSmith Tools; em seguida, descrevemos uma metodologia de extração semi-automática de UTEs no corpus. O Capítulo V apresenta nossa proposta do Dicionário Online de Culinária bidirecional para Tradutores, descrevendo sua macro- e microestrutura. O Capítulo VI apresenta nossas considerações finais. Os resultados obtidos em nosso trabalho demonstram que a L.C., se usada não apenas como metodologia, mas como abordagem teórica na exploração de corpora especializados, permite elaborar dicionários mais úteis e confiáveis para o tradutor, pois leva em consideração quaisquer padrões associativos entre palavras cuja probabilidade de ocorrer em textos representativos da área seja alta fato que justifica plenamente a inclusão desses padrões num dicionário voltado para o tradutor-produtorde- textos. / Dictionaries have always been and still are one of the main tools for the translator s task. Nevertheless, terminography does not seem to have systematically benefited, at least in Brazil, from the close relation between technical dictionaries and this increasingly significant and particular target audience: technical translators. In the field of Culinary, for instance, which has witnessed a growing demand for translations in Brazil, much as the dictionaries available for the English-Portuguese language pair may contribute to the understanding of the source text, they still do not provide any information on how the terms are actually used in real texts. In other words, they do not help the translator in a crucial step of the translation activity: text production in the target language. The thesis advanced here is that a dictionary which seeks to meet the needs of a translator s text production should focus on the aspects which characterize technical texts from the point of view of translation itself, that is, it should describe and propose translation equivalents or suggestions for the Specialized Translation Units (STUs) occurring in these texts, which the translator in the area often comes across in her/his practice, whether they are terminological or not. Corpus Linguistics (CL), an empirical approach which regards language as a probabilistic system, has devoted itself to the identification of recurring lexico-grammatical patterns in language by observing authentic texts organized as electronic corpora. It is, therefore, the field of studies we deem capable of providing the most adequate theoretical and methodological support to extract the STUs from real texts. In order to embrace these units, a proposal of an online bidirectional English-Portuguese dictionary is presented, which is aimed at the technical Culinary translator. The steps followed in the development of this study were organized in six chapters. The first deals with the theoretical and practical aspects of technical translation and discusses the role of terminology in translation practice. The second examines the specificities of the Culinary translator s job in Brazil and characterizes the culinary recipe , the focus of this study, in terms of text genre and typology. In the third chapter, the theoretical and methodological foundations of CL are presented, as well as the criteria used in the compilation of the corpus to be used for the identification of the STUs. Chapter IV describes the exploration of this corpus: first, we present the study in which a manual search of lexico-grammatical patterns using the WordSmith Tools program is carried out; next, a methodology for semi-automatic extraction of STUs in the corpus is described. Chapter V presents our proposal for a bidirectional online Culinary Dictionary for Translators, describing its macro- and microstructure. Chapter VI contains the final considerations. The results obtained in this study bear witness to the fact that CL, if used not only as a methodology, but as a theoretical approach in the investigation of specialized corpora, enables the production of more useful and trustworthy dictionaries for the translator, for it takes into account any association patterns between words with a probability of occurrence in representative texts in the field a fact which strongly supports the inclusion of these patterns in a dictionary aimed at the translator-producer-of-texts Culinária Dicionários bilíngües Lingüística de corpus Terminologia Tradução técnica Bilingual dictionaries Corpus linguistics Culinary Technical translation Terminology
145	Glossário bilíngue de colocações de hotelaria: um modelo à luz da Linguística de Corpus / Bilingual glossary of collocations of the hotel industry: a model in the light of Corpus Linguistics Sandra Lago Martinez Navarro 15 March 2012 (has links) O objetivo desta pesquisa é elaborar uma proposta de glossário bilíngue (inglês - português) de colocações da hotelaria, voltado às necessidades do tradutor. Esta pesquisa justifica-se por abordar uma área técnica com grande volume de traduções e escassez de estudos terminológicos e por dar destaque a um elemento constitutivo e de alta incidência nas comunicações especializadas as colocações. Na base do fenômeno das colocações está o princípio de que a linguagem é padronizada e integra um sistema probabilístico, ou seja, tende a funcionar por meio de unidades pré-fabricadas convencionalizadas pelo uso. Conhecer esses padrões é de suma importância ao tradutor que pretende produzir um texto natural na língua de chegada. Esta pesquisa encontra-se no escopo dos estudos em Linguística de Corpus, Terminologia Textual, Tradução e Fraseologia, áreas que compartilham o interesse em observar a linguagem real em seu contexto de ocorrência. Para este trabalho, construímos um corpus comparável de textos extraídos de sites de estabelecimentos hoteleiros no Brasil e nos Estados Unidos. Foram compilados 321 textos e 546.106 palavras em inglês, 710 textos e 514.449 palavras em português, conteúdo subdividido por categorias de estabelecimentos. Para a exploração do corpus, utilizamos o software WordSmith Tools, versão 5 (Scott, 2007), em especial, ferramentas como listas de palavras-chave, listas de colocados e concordâncias. Realizamos um estudo aprofundado da palavra room, fazendo um levantamento de suas principais colocações e explicitando o caminho percorrido para o estabelecimento dos equivalentes. A partir desses dados, apresentamos nossa proposta de glossário, que privilegiou aspectos interesse ao tradutor. / This research presents a proposal for a bilingual glossary (English-Portuguese) of collocations typical of the hotel industry, aimed at meeting the needs of the translator. This way, we address a technical area in which translation is a constant need while there is a real lack of reference materials and we also focus on an element that constitutes specialized communications - the collocations. This linguistics phenomenon represents the principle according to which language is standardized and makes up a probalistic system, which tends to function by means of pre-fabricated conventionalized units. A good command of such standards is of utmost importance for the translator who wishes to produce a natural translation in the target language. This research draws on the principles of Corpus Linguistics, Textual Terminology, Translation and Phraseology, areas which share the interest of observing real language in context. We have built a comparable corpus comprising texts extracted from websites of hotel properties in Brazil and USA. The corpus is divided up into hotel categories and contains 321 texts and 546,106 words in English; 710 texts and 514,449 words in Portuguese. This corpus was explored with the aid of WordSmith Tools program (Scott, 2007, version 5) and tools such as keywords, lists of collocations and concordance lines. We have carried out a thorough investigation of the word room, determining its major collocates and outlining the procedures to establish their equivalents. This study concludes with our proposal for a glossary entry that focussed on the intests of our target audience, the translator. Colocações Hotelaria Linguística de corpus Terminologia Tradução Collocations Corpus linguistics Hotel industry Terminology Translation
146	O advérbio em fraseologias das áreas da culinária e do direito contratual: um estudo baseado em corpus / The adverb in phraseologies in the areas of Culinary and Contract Law: a corpus-based study Helmara Febeliana Real de Moraes 26 January 2011 (has links) Ao analisar o material hoje disponível sobre os advérbios em inglês e em português observa-se, em especial naqueles baseados em corpus e aqui referimo-nos mais especificamente às gramáticas , que o estudo dessa classe gramatical vem ganhando espaço. Além de abordar questões morfológicas, sintáticas, pragmáticas, semânticas e em alguns casos discursivas, essas obras de referência têm procurado conscientizar o consulente sobre a imprecisão dessa classe gramatical, chamando a atenção para seu uso em contexto. Mesmo com esses avanços significativos, no entanto, observa-se que não há dados sobre o uso dos advérbios, mais especificamente aqueles terminados em ly e mente, em linguagens especializadas, principalmente no que tange o levantamento de padrões linguísticos que venham a caracterizar essas áreas e tenham, em sua composição, esse grupo de advérbios. Partindo de dois corpora de estudo, um composto de receitas culinárias em inglês e em português e outro de instrumentos contratuais no mesmo par de línguas, levantamos os cinco advérbios terminados em ly e mente mais chave em cada tipologia e língua e extraímos os padrões linguísticos em que ocorriam. Considerando a extração e análise dos dados coletados, pudemos comprovar a nossa tese de que esse grupo de advérbios apresenta características próprias e fraseologias típicas da área em que se inserem, ajustando-se a cada contexto de uso. Inclusive, tal fato é evidenciado quando analisamos immediately, advérbio com alto índice de chavicidade e comum às receitas culinárias e contratos em inglês, e imediatamente e juntamente nessas tipologias em português. Descrevemos também todo o processo para o levantamento de formas equivalentes de algumas fraseologias na direção inglês-português, com o objetivo de enfatizar a necessidade de incluir os resultados obtidos em diferentes obras de referência, especialmente em gramáticas e dicionários especializados, o que contribuiria de modo significativo para o trabalho do produtor de textos, principalmente o tradutor. / When analyzing the material available nowadays about adverbs in English and in Portuguese we observe, especially in those that are corpus-based more specifically grammar books , that the study of this grammatical class has gained ground. Besides covering topics such as morphology, syntax, pragmatics, semantics and sometimes discourse, these reference books have tried to make the reader aware of the lack of precision when referring to this grammatical class, emphasizing its use in context. However, despite these significant advances we observe that adverbs, especially those ending in ly in English and mente in Portuguese, are not mentioned as far as specialized languages are concerned, especially when referring to linguistic patterns that may characterize their use in specific areas, in both languages. Based on two study corpora, one with recipes (Culinary) in English and in Portuguese and the other with agreements (Contract Law) in these two languages, we extracted the five adverbs (ending in ly and mente) with the highest keyness index in each text typology and language, also identifying the linguistic patterns in which they occurred. Considering the extraction and analysis of the collected data, we could confirm our thesis that these adverbs have their own characteristics and specific phraseologies in the area in which they occur, adjusting to each context of use. This was also observed when we analyzed immediately, an adverb with a high keyness index that was common to both areas of study, i.e., culinary recipes and agreements in English, and imediatamente and juntamente in the same text typologies in Portuguese. We have also described the whole process to extract the equivalent forms of some phraseologies in the English-Portuguese direction, with the objective of emphasizing the need to include the results obtained so far in different reference books, especially grammar books and specialized dictionaries which would contribute significantly to the job of the text producer, mainly the translator. Advérbios Fraseologia Linguagens especializadas Linguística de corpus Padrões linguísticos Adverbs Corpus linguistics Linguistic patterns Phraseology Specialized languages
147	Verblexpor : um recurso léxico com anotação de papéis semânticos para o português Zilio, Leonardo January 2015 (has links) Esta tese propõe um recurso léxico de verbos com anotação de papéis semânticos, denominado VerbLexPor, baseado em recursos como VerbNet, PropBank e FrameNet. As bases teóricas da proposta são interdisciplinares e retiradas da Linguística de Corpus e do Processamento de Linguagem Natural (PLN), visando-se a contribuir para a Linguística e para a Computação. As hipóteses de pesquisa são: a) um mesmo conjunto de papéis semânticos pode ser aplicado a diferentes gêneros textuais; e b) as diferenças entre esses gêneros se destacam no ranqueamento dos papéis semânticos. O desenvolvimento do VerbLexPor se apoia em dois corpora: um especializado, com mais de 1,6 milhão de palavras, composto por artigos científicos de Cardiologia de três periódicos brasileiros; e um não especializado, com mais de 1 milhão de palavras composto por artigos do jornal popular Diário Gaúcho. Os corpora foram anotados com o parser PALAVRAS, e as informações de sentenças, verbos e argumentos foram extraídas e armazenadas em um banco de dados. O VerbLexPor tem 192 verbos e mais de 15 mil argumentos anotados distribuídos em mais de 6 mil sentenças. Observou-se que o corpus do Diário Gaúcho privilegia uma sintaxe direta e pouco uso de voz passiva e adjuntos, enquanto o corpus de Cardiologia apresenta mais voz passiva e um maior uso de INSTRUMENTOS na posição de sujeito, além de uma menor incidência de AGENTES. Foram realizados também alguns experimentos paralelos, como a anotação de papéis semânticos por vários anotadores e o agrupamento automático de verbos. Na tarefa de múltiplos anotadores, cada um anotou exatamente as mesmas 25 orações. Os anotadores receberam um manual de anotação e um treinamento básico (explicação sobre a tarefa e dois exemplos de anotação). Usou-se o cálculo de multi-π para avaliar a concordância entre os anotadores, e o resultado foi de π = 0,25. Os motivos para essa concordância baixa podem estar na falta de um treinamento mais completo. A tarefa de agrupamento de verbos mostrou que a sintaxe e a semântica são igualmente importantes para o agrupamento. Este estudo contribui para a área de Linguística, com um léxico de verbos anotados semanticamente, e também para a Computação, com dados que podem ser consultados e processados para diversas aplicações do PLN, principalmente por estarem disponíveis nos formatos XML e SQL. / This dissertation aims at developing a lexical resource of verbs annotated with semantic roles, called VerbLexPor, and based on other resources, such as VerbNet, PropBank, and FrameNet. The theoretical bases of this study lies in Corpus Linguistics and Natural Language Processing (NLP), so that it aims at contributing to both Linguistics and Computer Science. The hypotheses are: a) one set of semantic roles can be applied to different genres; and b) the differences among genres are shown by the ranking of semantic roles. The development of VerbLexPor has two corpora at the basis: a specialized one, with more than 1.6 million words, composed by scientific papers in the field of Cardiology from three Brazilian journals; and a non-specialized one, with more than 1 million words, composed by newspaper articles from Diário Gaúcho. The corpora were analyzed with the parser PALAVRAS, and sentence, verb and argument information was extracted and stored in a database. VerbLexPor has 192 verbs and more than 15 thousand arguments annotated with semantic roles, distributed among more than 6 thousand sentences. We observed that Diário Gaúcho has a more direct syntax, with less passive voice and adjuncts, while Cardiology has more passive voice and more INSTRUMENTS for subjects, and fewer AGENTS. We also conducted some parallel experiments, such as semantic role labeling with multiple annotators and automatic verbal clustering. In the multiple annotators task, each of them annotated exactly the same 25 sentences. They received an annotation manual and basic training (explanation on the task and two annotation examples). We used multi-π to evaluate agreement among annotators, and results were π = 0,25. Reasons for this low agreement may be a lack of a thoroughly developed training. The verbal clustering task showed that syntax and semantics are equally important for verbal clustering. This study contributes to Linguistics, with a verbal lexicon annotated with semantic roles, and also to Computer Science, with data that can be assessed and processed for various NLP applications, especially because the data are available in both XML and SQL formats. Língua portuguesa Linguística computacional Corpus Linguagem especializada Semantic role labeling Lexical resource NLP Corpus linguistics
148	Análise de um corpus de produção escrita em português por crianças e adultos indígenas bilíngues/monolíngues de Dourados/MS a partir da linguistíca de corpus Espindola, Sandra January 2014 (has links) Com a finalidade de entender a origem das dificuldades apresentadas por crianças e adultos indígenas na produção de textos em português, surgiu a presente investigação. a partir da Linguística de Corpus. Para tanto, foi construído um corpus de 483 textos de crianças e 349 textos de adultos escritos em língua portuguesaproduzidos por crianças e adultos indígenas e não indígenas. A amostra do grupo das crianças contou um total de 175 crianças, sendo 111 indígenas (71 bilíngues Guarani/Kaiowá e 40 Terena monolíngues) e 64 não indígenas, falantes monolíngues de português, alunos do 4º e do 5º ano do Ensino Fundamental. O grupo de adultos foi formado por um total de 118 adultos, sendo 74 indígenas (36 bilíngues Guarani/Kaiowá e 38 Terena monolíngues) e 44 não indígenas, falantes monolíngues de português, do1o e do último ano do Ensino Superior. Os objetivos específicos da pesquisa foram: (a) verificar se existem diferenças entre o tipo de dificuldades reveladas pelos indígenas monolíngues e bilíngues de diferentes etnias – Kaiowá/Guarani e Terena – em comparação com os monolíngues não indígenas na produção de textos narrativos em português; (b) na comparação entre os dois grupos etários, crianças e adultos, observar em que medida o caminho percorrido do ensino básico à formação acadêmica interferiu no desenvolvimento da habilidade de escrita de textos; e (c) no caso dos grupos de participantes adultos, investigar se o tempo de permanência no curso de graduação (alunos que estão no primeiro e no quarto ano de curso) interfere no nível de dificuldade na produção de textos. Os dados foram analisados através da ferramenta AntConc, a partir do viés teórico da Linguística de Corpus. A partir dessa proposta de pesquisa espera-se contribuir para que os professores, tanto os que atendem os acadêmicos quanto os que atendem as crianças, compreendam como a escrita desses dois grupos indígenas se estrutura. Essas informações são essenciais para futuras orientações nos trabalhos de leitura e escritas propostos pela escola e pelos cursos universitários que recebem acadêmicos indígenas. / In order to underste the origin of the difficulties faced by indigenous children e adults in the production of texts in Portuguese, this research emerged, from Corpus Linguistics. To that end, was built a corpus of 483 children e 349 adults texts of texts written in Portuguese produced by children e indigenous e non-indigenous adults.The sample of children group counted a total of 175 children, with 111 indigenous (71 bilingual Guarani / Kaiowá e Terena 40 monolingual) e 64 non-indigenous, monolingual speakers of Portuguese, students of the 4th e 5th year of elementary school.The adult group consisted of a total of 118 adults, with 74 indigenous (36 bilingual Guarani / Kaiowá e Terena 38 monolingual) e 44 non-indigenous, monolingual speakers of Portuguese, the first e last years of higher education.The specific objectives of the research were: (a) determine whether there are differences between the kinds of problems revealed by monolingual e bilingual indigenous ethnic groups - Kaiowá / Guarani e Terena - compared to non-indigenous monolingual in the production of narrative texts in Portuguese;(b) the comparison between the two age groups, children e adults, to observe to what extent the traveled way of basic education to academic interfered in the development of written texts skill;e (c) in the case of adults participating groups, to investigate whether the time spent in the undergraduate course (students who are the first e fourth year of course) interferes with the level of difficulty in producing texts.Data were analyzed by AntConc tool from the theoretical bias of Corpus Linguistics. From this research proposal is expected to contribute to teachers, both those who meet the academic e the attending children, underste how the writing of these two indigenous groups structure.This information is essential for future guidance in reading e written work proposed by schools e university courses receiving indigenous academics. Escrita Língua portuguesa Ensino e aprendizagem Educação indígena Produção textual Language education Teaching indigenous Corpus linguistics
149	Edição semidiplomática e estudo lexicográfico de habilitações à herança setecentistas do Juízo de Órfãos de São Paulo / Semidiplomatic editing and lexicographical study of enable to heritage the eighteenth century of the Orphan Court of São Paulo Fabio Gimenez 28 January 2015 (has links) Os objetivos deste trabalho são apresentar a transcrição semidiplomática justalinear, fidedigna, numerada a cada cinco linhas, de cinco autos cíveis de habilitação à herança lavrados no século XVIII, na cidade de São Paulo, pelo Juízo dos Órfãos, que poderá ser lida sem perdas de informação dos documentos originais, sendo de interesse para o estudioso acadêmico que pesquise tanto dados históricos quanto linguísticos; estruturar o vocabulário de todas as palavras que constam nesses documentos, usando como ferramenta o software AntConc3.2.4w; e traçar um panorama da história interna dos documentos, do Juízo de Órfãos, das leis orfanológicas vigentes e trazer uma breve análise tipológica. / The objectives of this work are present semidiplomatic justalinear transcription, reliable, numbered every five lines, five civil cases enable the inheritance drawn up in the eighteenth century, the city of São Paulo, by the Orphans Court, which can be read without loss of information from the original documents, being of interest to the academic scholar who search for both historical and linguistic data; structure the vocabulary of all the words contained in these documents, using as a tool the AntConc3.2.4w software; and draw a picture of the inside story of the documents, the Orphan Court, the existing orfanológicas laws and bring a brief typological analysis. Direito Filologia História Lexicografia Linguística de corpus Corpus linguistics History Law Lexicography Philology
150	Um estudo da lexia bem (português-francês) pela linguística de corpus / A study of the lexical item BEM (Portuguese - French) by Corpus Linguistics Gisele Galafacci 29 September 2014 (has links) No contexto de ensino e aprendizagem de uma língua estrangeira, o dicionário bilíngue aparece como um instrumento linguístico que se propõe a auxiliar os aprendizes na construção do conhecimento em relação à língua de aprendizagem. No entanto, esse instrumento tem apresentado muitas lacunas, o que resulta em dificuldades aos aprendizes no que concerne à compreensão e, sobretudo, à expressão em língua estrangeira. Tais lacunas se referem ao conteúdo informacional contido na sua microestrutura, que apresenta geralmente uma quantidade reduzida de definições, as quais não são acompanhadas de exemplos de uso na maioria dos casos. Por isso, este trabalho considera a descrição do item lexical BEM em obras lexicográficas, tanto monolíngues como bilíngues, com o objetivo de verificar se os conteúdos informacionais, sua estruturação e organização são funcionais para os consulentes em contextos de ensino e aprendizagem. Além disso, propõe uma descrição baseada em corpora do mesmo item lexical realizada com auxílio do instrumental da Linguística de Corpus, utilizada como metodologia neste trabalho. Consideramos a hipótese de que a descrição lexicográfica baseada em corpora pode se constituir num diferencial para a compreensão de uso de itens lexicais em situação de ensino e aprendizagem de uma língua estrangeira. Este estudo se justifica pela necessidade que observamos na prática docente de fornecer aos estudantes instrumentos linguísticos que possam lhes melhor auxiliar na compreensão do uso das lexias em francês, especialmente em situações de produção oral e escrita. / In the context of teaching and learning a foreign language, bilingual dictionaries appear as a linguistic tool that aims to assist learners in constructing knowledge related to language learning. However, this instrument shows many gaps, which results in difficulties for learners to understand and speak in a foreign language. Such gaps generally refer to the informational content contained in its microstructure, which offers a reduced amount of definitions that, in the majority of cases, are not followed by examples of their use. Therefore, this work considers the description of the lexical item BEM in lexicographical works, both monolingual and bilingual, with the goal of checking whether the informational content, its structure and its organization are functional for users in the context of teaching and learning. It also proposes an approach based on corpora of the same lexical item performed by using the tools of Corpus Linguistics, which comprises the methodology of this work. We consider the hypothesis that the lexicographical description based on corpora may constitute an increase in the understanding of the use of lexical items when teaching and learning a foreign language. This study was justified by the need to provide students with linguistic tools that can help them better understand the use of words in French, especially in speaking and writing situations. Lexicografia bilingue Linguística de Corpus Produção em língua estrangeira Bilingual lexicography Corpus Linguistics Foreign language production

Search results