• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 209
  • 118
  • 32
  • 13
  • 13
  • 12
  • 7
  • 6
  • 4
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 469
  • 469
  • 155
  • 133
  • 93
  • 89
  • 85
  • 75
  • 72
  • 67
  • 65
  • 62
  • 50
  • 48
  • 45
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.

Análise de um corpus de produção escrita em português por crianças e adultos indígenas bilíngues/monolíngues de Dourados/MS a partir da linguistíca de corpus

Espindola, Sandra January 2014 (has links)
Com a finalidade de entender a origem das dificuldades apresentadas por crianças e adultos indígenas na produção de textos em português, surgiu a presente investigação. a partir da Linguística de Corpus. Para tanto, foi construído um corpus de 483 textos de crianças e 349 textos de adultos escritos em língua portuguesaproduzidos por crianças e adultos indígenas e não indígenas. A amostra do grupo das crianças contou um total de 175 crianças, sendo 111 indígenas (71 bilíngues Guarani/Kaiowá e 40 Terena monolíngues) e 64 não indígenas, falantes monolíngues de português, alunos do 4º e do 5º ano do Ensino Fundamental. O grupo de adultos foi formado por um total de 118 adultos, sendo 74 indígenas (36 bilíngues Guarani/Kaiowá e 38 Terena monolíngues) e 44 não indígenas, falantes monolíngues de português, do1o e do último ano do Ensino Superior. Os objetivos específicos da pesquisa foram: (a) verificar se existem diferenças entre o tipo de dificuldades reveladas pelos indígenas monolíngues e bilíngues de diferentes etnias – Kaiowá/Guarani e Terena – em comparação com os monolíngues não indígenas na produção de textos narrativos em português; (b) na comparação entre os dois grupos etários, crianças e adultos, observar em que medida o caminho percorrido do ensino básico à formação acadêmica interferiu no desenvolvimento da habilidade de escrita de textos; e (c) no caso dos grupos de participantes adultos, investigar se o tempo de permanência no curso de graduação (alunos que estão no primeiro e no quarto ano de curso) interfere no nível de dificuldade na produção de textos. Os dados foram analisados através da ferramenta AntConc, a partir do viés teórico da Linguística de Corpus. A partir dessa proposta de pesquisa espera-se contribuir para que os professores, tanto os que atendem os acadêmicos quanto os que atendem as crianças, compreendam como a escrita desses dois grupos indígenas se estrutura. Essas informações são essenciais para futuras orientações nos trabalhos de leitura e escritas propostos pela escola e pelos cursos universitários que recebem acadêmicos indígenas. / In order to underste the origin of the difficulties faced by indigenous children e adults in the production of texts in Portuguese, this research emerged, from Corpus Linguistics. To that end, was built a corpus of 483 children e 349 adults texts of texts written in Portuguese produced by children e indigenous e non-indigenous adults.The sample of children group counted a total of 175 children, with 111 indigenous (71 bilingual Guarani / Kaiowá e Terena 40 monolingual) e 64 non-indigenous, monolingual speakers of Portuguese, students of the 4th e 5th year of elementary school.The adult group consisted of a total of 118 adults, with 74 indigenous (36 bilingual Guarani / Kaiowá e Terena 38 monolingual) e 44 non-indigenous, monolingual speakers of Portuguese, the first e last years of higher education.The specific objectives of the research were: (a) determine whether there are differences between the kinds of problems revealed by monolingual e bilingual indigenous ethnic groups - Kaiowá / Guarani e Terena - compared to non-indigenous monolingual in the production of narrative texts in Portuguese;(b) the comparison between the two age groups, children e adults, to observe to what extent the traveled way of basic education to academic interfered in the development of written texts skill;e (c) in the case of adults participating groups, to investigate whether the time spent in the undergraduate course (students who are the first e fourth year of course) interferes with the level of difficulty in producing texts.Data were analyzed by AntConc tool from the theoretical bias of Corpus Linguistics. From this research proposal is expected to contribute to teachers, both those who meet the academic e the attending children, underste how the writing of these two indigenous groups structure.This information is essential for future guidance in reading e written work proposed by schools e university courses receiving indigenous academics.

Ordet grym i ny användning : En semantisk studie av ordet i tidningstexter 1965-2004

Ericsson, Anna January 2009 (has links)
Syftet med denna studie är att se hur ordet grym används i icketraditionell bemärkelse. Undersökningen har skett genom studier av ordet i elva tidningskorpusar mellan åren 1965-2004, sammanställda av Språkbanken. Genom att studera faktorer såsom betydelse, genre, användare och ordklass har jag kommit fram till att ordet har gått från att innan 1970-talet endast använts för någonting negativt till att ordet används som en förstärkning eller för något som är snyggt, häftigt och positivt. Studien visar att ordet främst används inom sport- och musikgenren i tidningarna och majoriteten av användarna är män. I denna studie om bruket av ordet grym i tidningsskriftspråk har ordet inte uppkommit i annan ordklass än vad dagens ordböcker tar upp. / The aim of this study is to see how the Swedish word grym is used in non-traditional sense. The research is based on eleven newspaper corpuses from Språkbanken between the years 1965-2004. By studying factors like meaning, genre, user and part of speech the conclusion is that the word has gone from something negative before the 1970s to be used as reinforcement or for something nice, cool and positive. The research shows that the word mainly is used within the sport and music genre in the newspapers and the majority of the users are men. In the result the word is never used as another part of speech other than the ones presented in the word books, which is adjective and adverb.

Neutral or not? : A study of gender (in)equality in the use of professional terms in English.

Östman, Klara January 2017 (has links)
Jenny Cheshire, current editor in chief of Language in Society, stated that there is a bias of masculine terms and referents in the English language (1985, p. 22). This poses a problem, both linguistically and socially, and conscious language reforms need to be imposed in order for the bias to drastically be countered (1985, p. 22). In the past decades, gender-neutral terms, such as chairperson has been gaining ground in English, particularly in business discourse, and are contributing to create a more gender-neutral language. According to Cheshire (2008), media discourse is enormously influential (p.9) in the way we communicate, and this study investigates patterns in the use of chairperson and salesperson, as well as historically male professions priest and manager and female professions nurse and secretary. The data for this study is taken from the TIME Magazine Corpus. The results of this study show that masculine gender collocates appear commonly with the historically female professions and conversely for the historically male professions which appear more often with feminine collocates. Furthermore, through analysis of 1,000 instances of the terms in the corpus, it is noted that there are differences as to how the professions are connected with other words as well. Sexuality, nationality and physicality are ways in which the collocates of the terms differ. It is noted that, over time, there have been both increases and decreases in how gender collocates appear with the terms and that the frequency in usage of the feminine, masculine and gender-neutral terms have all been noted to vary in usage over the past century in the selected discourse.

Construction de corpus généraux et spécialisés à partir du Web (Ad hoc and general-purpose corpus construction from web sources) / Ad hoc and general-purpose corpus construction from web sources

Barbaresi, Adrien 19 June 2015 (has links)
Le premier chapitre s'ouvre par un description du contexte interdisciplinaire. Ensuite, le concept de corpus est présenté en tenant compte de l'état de l'art. Le besoin de disposer de preuves certes de nature linguistique mais embrassant différentes disciplines est illustré par plusieurs scénarios de recherche. Plusieurs étapes clés de la construction de corpus sont retracées, des corpus précédant l'ère digitale à la fin des années 1950 aux corpus web des années 2000 et 2010. Les continuités et changements entre la tradition en linguistique et les corpus tirés du web sont exposés. Le second chapitre rassemble des considérations méthodologiques. L'état de l'art concernant l'estimation de la qualité de textes est décrit. Ensuite, les méthodes utilisées par les études de lisibilité ainsi que par la classification automatique de textes sont résumées. Des dénominateurs communs sont isolés. Enfin, la visualisation de textes démontre l'intérêt de l'analyse de corpus pour les humanités numériques. Les raisons de trouver un équilibre entre analyse quantitative et linguistique de corpus sont abordées.Le troisième chapitre résume l'apport de la thèse en ce qui concerne la recherche sur les corpus tirés d'internet. La question de la collection des données est examinée avec une attention particulière, tout spécialement le cas des URLs sources. La notion de prétraitement des corpus web est introduite, ses étapes majeures sont brossées. L'impact des prétraitements sur le résultat est évalué. La question de la simplicité et de la reproducibilité de la construction de corpus est mise en avant.La quatrième partie décrit l'apport de la thèse du point de vue de la construction de corpus proprement dite, à travers la question des sources et le problèmes des documents invalides ou indésirables. Une approche utilisant un éclaireur léger pour préparer le parcours du web est présentée. Ensuite, les travaux concernant la sélection de documents juste avant l'inclusion dans un corpus sont résumés : il est possible d'utiliser les apports des études de lisibilité ainsi que des techniques d'apprentissage artificiel au cours de la construction du corpus. Un ensemble de caractéristiques textuelles testées sur des échantillons annotés évalue l'efficacité du procédé. Enfin, les travaux sur la visualisation de corpus sont abordés : extraction de caractéristiques à l'échelle d'un corpus afin de donner des indications sur sa composition et sa qualité. / At the beginning of the first chapter the interdisciplinary setting between linguistics, corpus linguistics, and computational linguistics is introduced. Then, the notion of corpus is put into focus. Existing corpus and text definitions are discussed. Several milestones of corpus design are presented, from pre-digital corpora at the end of the 1950s to web corpora in the 2000s and 2010s. The continuities and changes between the linguistic tradition and web native corpora are exposed.In the second chapter, methodological insights on automated text scrutiny in computer science, computational linguistics and natural language processing are presented. The state of the art on text quality assessment and web text filtering exemplifies current interdisciplinary research trends on web texts. Readability studies and automated text classification are used as a paragon of methods to find salient features in order to grasp text characteristics. Text visualization exemplifies corpus processing in the digital humanities framework. As a conclusion, guiding principles for research practice are listed, and reasons are given to find a balance between quantitative analysis and corpus linguistics, in an environment which is spanned by technological innovation and artificial intelligence techniques.Third, current research on web corpora is summarized. I distinguish two main approaches to web document retrieval: restricted retrieval and web crawling. The notion of web corpus preprocessing is introduced and salient steps are discussed. The impact of the preprocessing phase on research results is assessed. I explain why the importance of preprocessing should not be underestimated and why it is an important task for linguists to learn new skills in order to confront the whole data gathering and preprocessing phase.I present my work on web corpus construction in the fourth chapter. My analyses concern two main aspects, first the question of corpus sources (or prequalification), and secondly the problem of including valid, desirable documents in a corpus (or document qualification). Last, I present work on corpus visualization consisting of extracting certain corpus characteristics in order to give indications on corpus contents and quality.

A tradução de binômios nos contratos de \'common law\' à luz da lingüística de corpus / Translating binomial expressions in common law agreements: a corpus-based study

Luciana Carvalho Fonseca 30 May 2007 (has links)
O objetivo desta pesquisa é estudar os binômios que ocorrem em contratos de common law à luz da Lingüística de Corpus, procurando dar subsídios que auxiliem os tradutores de textos jurídicos a chegar a uma tradução natural, ou seja, para que traduzam linguagem jurídica por linguagem jurídica. Os binômios são formados por duas palavras pertencentes à mesma categoria gramatical, ligadas pela conjunção and ou or. Alguns exemplos são: terms and conditions, any and all, executed and delivered, due and payable, action or proceeding, agreement or obligation. Os binômios são uma marca do inglês jurídico e como tal têm sido objeto de diversos estudos. O mesmo, porém, não ocorre com a linguagem jurídica em português. Assim, ao lidar com a tradução de binômios, estudos mostram que os tradutores brasileiros se apegam à opção mais literal. A escolha de estudar os binômios nos contratos de common law se deve ao fato de estarem os contratos entre os documentos mais difíceis de traduzir e de ler e por terem uma altíssima concentração de binômios. Por essas razões, para estudar os binômios na linguagem jurídica em inglês e dar elementos para o tradutor chegar à tradução em português do Brasil, compilamos um corpus comparável de agreements e contratos autênticos perfazendo, aproximadamente, 1 milhão de palavras - 705 744 em inglês e 289 984 em português - composto por 5 amostras de 28 espécies de contratos e agreements, totalizando 140 documentos em cada língua. O corpus foi explorado de acordo com os princípios e ferramentas da Lingüística de Corpus. Para etiquetar o corpus usamos o programa CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System) do UCREL (Universidade de Lancaster) e para explorá-lo, o WordSmith Tools de Mike Scott. / This research aims at studying binomial expressions in common law agreements in the light of Corpus Linguistics in an attempt to provide translators with the necessary linguistic elements that will enable them to render a natural translation, that is, to translate legal language into legal language. Binomial expressions are formed by two words belonging to the same grammatical category and joined by and or or. Some examples are: terms and conditions, any and all, executed and delivered, due and payable, action or proceeding, agreement or obligation. Binomials are an integral part of English legal language and as such have deserved a considerable amount of study. The same, however, does not occur in Brazilian Portuguese legal language. Therefore, when dealing with binomial expressions, studies show that Brazilian translators tend to translate all the elements of a binomial literally. The choice of text type is due to the fact that agreements and contratos are among the most difficult documents to translate and seem to have an incredibly high concentration of binomial expressions. For said reasons, in order to study binomials in English legal language and provide elements for translators to arrive at their own translation into Brazilian Portuguese, we have compiled and explored a bilingual comparable corpus consisting of authentic agreements and contratos, totalling, approximately, 1 million words - 705,744 in English and 289,984 in Brazilian Portuguese - made up of 5 samples of 28 different kinds of contratos and agreements, a total of 140 documents in each language. Exploring such a corpus greatly depended on the principles and tools of Corpus Linguistics. To tag the corpus we used UCREL\'s CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System) and to explore the corpus we used Mike Scott\'s WordSmith Tools.

VoTec: a construção de vocabulários eletrônicos para aprendizes de tradução / VoTec: the construction of electronic vocabularies for translation learners

Guilherme Fromm 31 January 2008 (has links)
O presente trabalho visa descrever a construção de um Vocabulário Técnico Online, denominado VoTec e disponibilizado em uma página da Internet, para aprendizes de Tradução. São discutidos vários modelos de obras similares que serviram de base para o desenvolvimento do mesmo. O VoTec é uma ferramenta que se vale de corpora técnicos para a construção de seus verbetes e de um banco de dados (ambos exaustivamente descritos) para o seu funcionamento. São apresentados, também, o resultado de duas pesquisas realizadas com tradutores: uma com profissionais da área, para colher suas opiniões sobre obras terminográficas em geral, e outra com aprendizes, para colher suas opiniões após o uso da ferramenta. A inovação proposta pela ferramenta é a possibilidade de customização de seus modos de apresentação na tela e as formas de busca no banco de dados. O modo de apresentação possibilita duas formas de visualização da microestrutura: a normal, formatada como os dicionários impressos, e a descritiva, uma forma própria dos dicionários eletrônicos, em que a microestrutura é descrita de forma hierárquica. A consulta ao banco de dados pode ser feita de três modos diferentes: total, tradutor e modular. A consulta total disponibiliza praticamente todos os campos existentes no banco de dados; a do tradutor apresenta os campos que se destacaram na pesquisa realizada com os profissionais da área; a modular é montada de acordo com as necessidades tradutórias do consulente, isto é, ele pode visualizar ou não cada campo disponível no banco de dados. Além dessas consultas ligadas ao banco, a página do VoTec disponibiliza, também, links para pesquisa externa em páginas pertinentes, como dicionários e enciclopédias online. / The present work aims at describing the construction of an Online Technical Vocabulary, to be known as VoTec and available on an Internet site for Translation learners. Many similar models are discussed and taken into account in its development. The VoTec is a tool that relies on a technical corpora and a data bank (both exhaustively described) to build up the entries available at the site. The results of two researches with translators are also shown: one with the professionals in the area, to collect their opinions about terminographical reference works in general, and another one with the learners, to elicit their opinions on the tool after they had their first contact with it. The innovation proposed by the tool is the possibility of customizing the display of its screens and the searches the data bank make available. The screen display offers two ways to view the microstructure: the normal one, similar to a paperback dictionary model, and the descriptive one, typical of electronic dictionaries, where the microstructure is described in a hierarchical way. The data bank can be searched in three different ways: total, translator and modulated. The total search shows almost all the fields available in the data bank; the translator one shows the fields that were highlighted by the professional translators in one of the researches; the modulated one is built up according to the user\'s translation necessities, that is, he/she can choose which field or fields of the data bank will be shown. Besides these searches which access the data bank, the VoTec page also offers links to external searches in related webpages, such as online dictionaries and encyclopedias.

A tradução de jogos de palavras no romance O Xangô de Baker Street: uma revisão do quadro de estratégias de Delabastita com o auxílio da Linguística de Corpus / The translation of wordplays in the novel O xangô de Baker Street: a review of Delabastitas framework with the support of Corpus Linguistics.

Nilson Roberto Barros da Silva 24 August 2015 (has links)
Esta tese analisa a tradução de jogos de palavras do romance O xangô de Baker Street (SOARES, 1995), traduzido para o inglês por Clifford Landers em 1997, e o faz com base no quadro de estratégias de tradução de jogos de palavras apresentado por Delabastita (1996). O corpus de estudo é composto pelo romance citado mais a sua tradução para a língua inglesa, A samba for Sherlock. Esta investigação utiliza a abordagem teórico-metodológica da Linguística de Corpus e se caracteriza como um estudo direcionado pelo corpus (TOGNINI-BONELLI, 2001), uma vez que os dados analisados foram evidenciados a partir da exploração de linhas de concordância elaboradas com palavras-chave do corpus de estudo. A exploração do corpus de estudo (de modo especial, a geração e a análise da lista de palavras-chave e das linhas de concordância, bem como o alinhamento do corpus nas duas línguas português e inglês) contou com o auxílio do programa WordSmith Tools 6.0 (SCOTT, 2012), desenvolvido especialmente para a análise lexical. A análise das traduções demonstrou que o quadro de estratégias apresentado por Delabastita (1996) dá conta apenas de parte dos procedimentos observados na tradução dos jogos de palavras investigados. Em decorrência disso, esta tese propõe a ampliação do quadro de estratégias apresentado pelo referido autor, por meio do acréscimo de quatro novas estratégias de tradução de jogos de palavras, quais sejam: 1) o jogo de palavras da língua-fonte é traduzido por um jogo de palavras na língua-alvo e adiciona-se uma explicação; 2) o tradutor realiza uma alteração textual (a substituição de uma palavra no texto inteiro, por exemplo) para viabilizar a tradução de um jogo de palavras; 3) o tradutor reproduz o jogo de palavras do texto-fonte no texto da língua-alvo, sem traduzilo, e adiciona uma explicação; 4) o tradutor reproduz o jogo de palavras do texto-fonte no texto da língua-alvo, sem traduzi-lo, mas suprime elementos (ou a repetição de elementos) constitutivos do jogo de palavras original. / Based on Delabastita\'s (1996) framework for wordplay translation strategies, this dissertation analyzes the translation of wordplays in the novel O Xangô de Baker Street (SOARES, 1995), translated into English by Clifford Landers in 1997. Our study corpus consists of the above mentioned novel and its translation into English, A samba for Sherlock. This research uses the theoretical and methodological approach of Corpus Linguistics and is characterized as \'corpus-driven\' (TOGNINI-BONELLI, 2001), once the data analyzed were highlighted in the concordances generated from keywords of the corpus. The exploration of the corpus (in particular, the generation and analysis of the keyword list and concordances as well as the corpus alignment in both languages - Portuguese and English) was carried out with the lexical analysis software WordSmith Tools 6.0 (SCOTT, 2012). A qualitative analysis of equivalence choices showed that Delabastita\'s (1996) framework matches only partially the procedures observed in the translation of the wordplays investigated. As a result, this dissertation proposes the expansion of Delabastitas framework by means of four new translation strategies of wordplays, as follows: 1) the source language wordplay is translated by a wordplay in the target language and an explanation is added; 2) the translator changes the text (by substituting a word in the whole text, for instance) in order to enable the translation of a wordplay; 3) the translator reproduces the source language wordplay in the target language text, without translating it, and adds an explanation; 4) the translator reproduces the source language wordplay in the target language text, without translating it, but suppresses elements (or the repetition of elements) which constitute the original wordplay.

A lingüística de corpus a serviço do tradutor: proposta de um dicionário de culinária voltado para a produção textual / Corpus linguistics at the translator\'s service: proposal of an online dictionary of culinary aiming at text production

Elisa Duarte Teixeira 01 December 2008 (has links)
Os dicionários sempre foram e ainda são uma das principais ferramentas da tarefa tradutória. No entanto, a terminografia parece não ter se beneficiado ainda de forma sistemática, pelo menos no Brasil, da estreita relação entre dicionários técnicos e esse público-alvo específico e cada vez mais expressivo: os tradutores técnicos. Na área da Culinária, por exemplo, cuja demanda por traduções tem crescido regularmente no país, os dicionários disponíveis no par de línguas inglês-português, ainda que possam contribuir para a compreensão do texto original, não dão qualquer informação sobre como os termos são, de fato, usados em textos reais na área, ou seja, não auxiliam o tradutor numa etapa fundamental da atividade tradutória: a produção textual na língua de chegada. Nossa tese é a de que um dicionário que procure atender as necessidades de produção textual do tradutor deve concentrar-se nos aspectos que caracterizam o texto técnico do ponto de vista da tradução, isto é, deve descrever e propor equivalentes ou soluções tradutórias para as Unidades de Tradução Especializadas (UTEs) presentes nesses textos, com as quais o tradutor da área se depara freqüentemente em sua prática, sejam elas terminológicas ou não. A Lingüística de Corpus (L.C.), abordagem empirista que vê a língua como um sistema probabilístico, tem se dedicado à identificação de padrões léxico-gramaticais recorrentes na linguagem por meio da observação de textos autênticos organizados sob a forma de corpora eletrônicos. É, portanto, a área de estudos que julgamos fornecer os subsídios teóricos e metodológicos mais adequados para compilar as UTEs a partir de textos reais. Para abrigar essas unidades, apresentamos uma proposta de dicionário online bidirecional inglês-português voltado para o tradutor da área técnica da Culinária. As etapas seguidas no desenvolvimento deste trabalho estão organizadas em seis capítulos. O primeiro trata de aspectos teórico-práticos da tradução técnica e discute o papel da terminologia na prática tradutória. O segundo examina as especificidades do trabalho do tradutor da área da Culinária no Brasil e caracteriza a receita culinária , foco de nosso estudo, como gênero e tipologia textual. No terceiro capítulo, as bases teóricas e metodológicas da L.C. são apresentadas, bem como os critérios de coleta do corpus que servirá de base para a identificação das UTEs. O Capítulo IV descreve a etapa de exploração desse corpus: primeiramente, apresentamos o estudo em que é feito um levantamento manual de padrões léxicogramaticais usando o programa WordSmith Tools; em seguida, descrevemos uma metodologia de extração semi-automática de UTEs no corpus. O Capítulo V apresenta nossa proposta do Dicionário Online de Culinária bidirecional para Tradutores, descrevendo sua macro- e microestrutura. O Capítulo VI apresenta nossas considerações finais. Os resultados obtidos em nosso trabalho demonstram que a L.C., se usada não apenas como metodologia, mas como abordagem teórica na exploração de corpora especializados, permite elaborar dicionários mais úteis e confiáveis para o tradutor, pois leva em consideração quaisquer padrões associativos entre palavras cuja probabilidade de ocorrer em textos representativos da área seja alta fato que justifica plenamente a inclusão desses padrões num dicionário voltado para o tradutor-produtorde- textos. / Dictionaries have always been and still are one of the main tools for the translator s task. Nevertheless, terminography does not seem to have systematically benefited, at least in Brazil, from the close relation between technical dictionaries and this increasingly significant and particular target audience: technical translators. In the field of Culinary, for instance, which has witnessed a growing demand for translations in Brazil, much as the dictionaries available for the English-Portuguese language pair may contribute to the understanding of the source text, they still do not provide any information on how the terms are actually used in real texts. In other words, they do not help the translator in a crucial step of the translation activity: text production in the target language. The thesis advanced here is that a dictionary which seeks to meet the needs of a translator s text production should focus on the aspects which characterize technical texts from the point of view of translation itself, that is, it should describe and propose translation equivalents or suggestions for the Specialized Translation Units (STUs) occurring in these texts, which the translator in the area often comes across in her/his practice, whether they are terminological or not. Corpus Linguistics (CL), an empirical approach which regards language as a probabilistic system, has devoted itself to the identification of recurring lexico-grammatical patterns in language by observing authentic texts organized as electronic corpora. It is, therefore, the field of studies we deem capable of providing the most adequate theoretical and methodological support to extract the STUs from real texts. In order to embrace these units, a proposal of an online bidirectional English-Portuguese dictionary is presented, which is aimed at the technical Culinary translator. The steps followed in the development of this study were organized in six chapters. The first deals with the theoretical and practical aspects of technical translation and discusses the role of terminology in translation practice. The second examines the specificities of the Culinary translator s job in Brazil and characterizes the culinary recipe , the focus of this study, in terms of text genre and typology. In the third chapter, the theoretical and methodological foundations of CL are presented, as well as the criteria used in the compilation of the corpus to be used for the identification of the STUs. Chapter IV describes the exploration of this corpus: first, we present the study in which a manual search of lexico-grammatical patterns using the WordSmith Tools program is carried out; next, a methodology for semi-automatic extraction of STUs in the corpus is described. Chapter V presents our proposal for a bidirectional online Culinary Dictionary for Translators, describing its macro- and microstructure. Chapter VI contains the final considerations. The results obtained in this study bear witness to the fact that CL, if used not only as a methodology, but as a theoretical approach in the investigation of specialized corpora, enables the production of more useful and trustworthy dictionaries for the translator, for it takes into account any association patterns between words with a probability of occurrence in representative texts in the field a fact which strongly supports the inclusion of these patterns in a dictionary aimed at the translator-producer-of-texts

Glossário bilíngue de colocações de hotelaria: um modelo à luz da Linguística de Corpus / Bilingual glossary of collocations of the hotel industry: a model in the light of Corpus Linguistics

Sandra Lago Martinez Navarro 15 March 2012 (has links)
O objetivo desta pesquisa é elaborar uma proposta de glossário bilíngue (inglês - português) de colocações da hotelaria, voltado às necessidades do tradutor. Esta pesquisa justifica-se por abordar uma área técnica com grande volume de traduções e escassez de estudos terminológicos e por dar destaque a um elemento constitutivo e de alta incidência nas comunicações especializadas as colocações. Na base do fenômeno das colocações está o princípio de que a linguagem é padronizada e integra um sistema probabilístico, ou seja, tende a funcionar por meio de unidades pré-fabricadas convencionalizadas pelo uso. Conhecer esses padrões é de suma importância ao tradutor que pretende produzir um texto natural na língua de chegada. Esta pesquisa encontra-se no escopo dos estudos em Linguística de Corpus, Terminologia Textual, Tradução e Fraseologia, áreas que compartilham o interesse em observar a linguagem real em seu contexto de ocorrência. Para este trabalho, construímos um corpus comparável de textos extraídos de sites de estabelecimentos hoteleiros no Brasil e nos Estados Unidos. Foram compilados 321 textos e 546.106 palavras em inglês, 710 textos e 514.449 palavras em português, conteúdo subdividido por categorias de estabelecimentos. Para a exploração do corpus, utilizamos o software WordSmith Tools, versão 5 (Scott, 2007), em especial, ferramentas como listas de palavras-chave, listas de colocados e concordâncias. Realizamos um estudo aprofundado da palavra room, fazendo um levantamento de suas principais colocações e explicitando o caminho percorrido para o estabelecimento dos equivalentes. A partir desses dados, apresentamos nossa proposta de glossário, que privilegiou aspectos interesse ao tradutor. / This research presents a proposal for a bilingual glossary (English-Portuguese) of collocations typical of the hotel industry, aimed at meeting the needs of the translator. This way, we address a technical area in which translation is a constant need while there is a real lack of reference materials and we also focus on an element that constitutes specialized communications - the collocations. This linguistics phenomenon represents the principle according to which language is standardized and makes up a probalistic system, which tends to function by means of pre-fabricated conventionalized units. A good command of such standards is of utmost importance for the translator who wishes to produce a natural translation in the target language. This research draws on the principles of Corpus Linguistics, Textual Terminology, Translation and Phraseology, areas which share the interest of observing real language in context. We have built a comparable corpus comprising texts extracted from websites of hotel properties in Brazil and USA. The corpus is divided up into hotel categories and contains 321 texts and 546,106 words in English; 710 texts and 514,449 words in Portuguese. This corpus was explored with the aid of WordSmith Tools program (Scott, 2007, version 5) and tools such as keywords, lists of collocations and concordance lines. We have carried out a thorough investigation of the word room, determining its major collocates and outlining the procedures to establish their equivalents. This study concludes with our proposal for a glossary entry that focussed on the intests of our target audience, the translator.

O advérbio em fraseologias das áreas da culinária e do direito contratual: um estudo baseado em corpus / The adverb in phraseologies in the areas of Culinary and Contract Law: a corpus-based study

Helmara Febeliana Real de Moraes 26 January 2011 (has links)
Ao analisar o material hoje disponível sobre os advérbios em inglês e em português observa-se, em especial naqueles baseados em corpus e aqui referimo-nos mais especificamente às gramáticas , que o estudo dessa classe gramatical vem ganhando espaço. Além de abordar questões morfológicas, sintáticas, pragmáticas, semânticas e em alguns casos discursivas, essas obras de referência têm procurado conscientizar o consulente sobre a imprecisão dessa classe gramatical, chamando a atenção para seu uso em contexto. Mesmo com esses avanços significativos, no entanto, observa-se que não há dados sobre o uso dos advérbios, mais especificamente aqueles terminados em ly e mente, em linguagens especializadas, principalmente no que tange o levantamento de padrões linguísticos que venham a caracterizar essas áreas e tenham, em sua composição, esse grupo de advérbios. Partindo de dois corpora de estudo, um composto de receitas culinárias em inglês e em português e outro de instrumentos contratuais no mesmo par de línguas, levantamos os cinco advérbios terminados em ly e mente mais chave em cada tipologia e língua e extraímos os padrões linguísticos em que ocorriam. Considerando a extração e análise dos dados coletados, pudemos comprovar a nossa tese de que esse grupo de advérbios apresenta características próprias e fraseologias típicas da área em que se inserem, ajustando-se a cada contexto de uso. Inclusive, tal fato é evidenciado quando analisamos immediately, advérbio com alto índice de chavicidade e comum às receitas culinárias e contratos em inglês, e imediatamente e juntamente nessas tipologias em português. Descrevemos também todo o processo para o levantamento de formas equivalentes de algumas fraseologias na direção inglês-português, com o objetivo de enfatizar a necessidade de incluir os resultados obtidos em diferentes obras de referência, especialmente em gramáticas e dicionários especializados, o que contribuiria de modo significativo para o trabalho do produtor de textos, principalmente o tradutor. / When analyzing the material available nowadays about adverbs in English and in Portuguese we observe, especially in those that are corpus-based more specifically grammar books , that the study of this grammatical class has gained ground. Besides covering topics such as morphology, syntax, pragmatics, semantics and sometimes discourse, these reference books have tried to make the reader aware of the lack of precision when referring to this grammatical class, emphasizing its use in context. However, despite these significant advances we observe that adverbs, especially those ending in ly in English and mente in Portuguese, are not mentioned as far as specialized languages are concerned, especially when referring to linguistic patterns that may characterize their use in specific areas, in both languages. Based on two study corpora, one with recipes (Culinary) in English and in Portuguese and the other with agreements (Contract Law) in these two languages, we extracted the five adverbs (ending in ly and mente) with the highest keyness index in each text typology and language, also identifying the linguistic patterns in which they occurred. Considering the extraction and analysis of the collected data, we could confirm our thesis that these adverbs have their own characteristics and specific phraseologies in the area in which they occur, adjusting to each context of use. This was also observed when we analyzed immediately, an adverb with a high keyness index that was common to both areas of study, i.e., culinary recipes and agreements in English, and imediatamente and juntamente in the same text typologies in Portuguese. We have also described the whole process to extract the equivalent forms of some phraseologies in the English-Portuguese direction, with the objective of emphasizing the need to include the results obtained so far in different reference books, especially grammar books and specialized dictionaries which would contribute significantly to the job of the text producer, mainly the translator.

Page generated in 0.0635 seconds