Spelling suggestions: "subject:"linguística dde corpus"" "subject:"linguística dde korpus""
51 |
Fraseologia do verbo get na língua inglesa: uma abordagem da Linguística de Corpus e da Gramática de Construções / Phraseology of the verb get in the English Language: a Corpus Linguistics and Construction Grammar approachRosa, Rodrigo Garcia 09 April 2014 (has links)
Esta pesquisa investiga os usos de get nos contextos em que o verbo é seguido de sintagmas nominais com a finalidade geral de apresentar um mapeamento das construções em que esse predicado pode ocorrer. A pesquisa adota a perspectiva metodológica da Linguística de Corpus (McENERY; HARDIE, 2012), para a seleção e extração de dados da língua em uso por meio da utilização de um corpus de inglês americano (Corpus of Contemporary American English - COCA), e o embasamento teórico adota a perspectiva da Gramática de Construções Cognitiva (GOLDBERG, 1995; 2006), para a análise e classificação dos dados em construções. Mais especificamente, o referido mapeamento construcional tem como objetivo descrever o comportamento linguístico de get em dois níveis de análise, a saber: (1) No nível construcional, ao salientar as principais características sintáticas, semânticas e pragmáticas dos contextos gramaticais em que o verbo ocorre e; (2) No nível lexical, ao focalizar e discutir os principais fraseologismos nucleados por get. O corpus de estudo é composto de 9.210 enunciados extraídos do COCA e conta com get em todas as suas formas morfológicas possíveis, isto é, a busca feita no corpus fez uso da forma lematizada do verbo de maneira a trazer diferentes instanciações de get (get, gets, getting, got, gotten). Quanto aos colocados, a metodologia de busca e seleção dos complementos nominais priorizou os 50 substantivos mais frequentes à margem direita de get, também em suas formas lematizadas, de maneira a garantir uma variedade semântica considerável entre os elementos que colocam com o verbo sob investigação. Os resultados a que este estudo chegou confirmam o comportamento polissêmico e a versatilidade sintática de get (ISRAEL, 2004), ao explicitarem 13 contextos construcionais em que esse verbo é produtivo. Entretanto, a análise quantitativa dos dados demonstra a preferência de get pela construção transitiva, contexto no qual o sentido central licenciado é o de obtenção. No que se refere ao comportamento de get no nível lexical, o corpus de estudo salientou 74 unidades fraseológicas nucleadas pelo verbo / This research examines the uses of get in contexts where the verb is followed by nominal phrases and it aims at proposing a mapping of the constructions where this predicate may occur. The research adopts the methodological perspective of Corpus Linguistics (McENERY; HARDIE, 2012) for the selection and extraction of data of language in use from a corpus of American English (Corpus of Contemporary American English COCA), and the theoretical framework adopts the perspective of Cognitive Construction Grammar (GOLDBERG, 1995; 2006), for the analysis and categorization of the data in constructions. More specifically, the constructional mapping referred to has the objective to describe the linguistic behavior of get in two levels of analysis, namely: (1) In the constructional level, by highlighting the main syntactic, semantic and pragmatic characteristics of the grammatical contexts in which the verb occurs and; (2) In the lexical level, by emphasizing and discussing the main phraseologisms headed by get. The study corpus is composed of 9.210 utterances extracted from COCA and it contains get in all of its possible morphological forms, that is, the search run in the corpus made use of the lemmatized form of the verb so as to generate distinct instantiations of get (get, gets, getting, got, gotten). As for the collocates, the method of search and selection of the nominal complements prioritized the 50 most frequent nouns to the right of get, also in their lemmatized forms, in order to guarantee a considerable semantic variability amongst the elements with which the verb under analysis collocates. The conclusions at which this study arrived confirm the polysemous behavior and the syntactic versatility of get (ISRAEL, 2004), by outlining 13 constructional contexts in which the verb is productive. Nevertheless, the quantitative analysis of the data shows the preference of get for the transitive construction, context in which the licensed central meaning is that of obtention. As for the behavior of get in the lexical level, the study corpus highlighted 74 phraseological units headed by get
|
52 |
Prosa argumentativa em língua inglesa: um estudo contrastivo sobre advérbios em corpora digitais / Argumentative prose in English language: a contrastive study about adverbs in digital corporaMaria Izabel de Andrade Almeida 30 March 2010 (has links)
Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro / Esta pesquisa tem como objetivo principal investigar como aprendizes brasileiros de língua inglesa usam advérbios com terminação em ly no inglês escrito, e comparar ao uso que deles fazem os falantes de inglês como língua materna. Para tanto, o trabalho encontra suporte teórico e metodológico na Linguística de Corpus e fundamenta-se na área chamada de pesquisa sobre corpora de aprendizes, que se ocupa da coleta e armazenagem de dados linguísticos de sujeitos aprendizes de uma língua estrangeira, para a formação de um corpus que possa ser utilizado para fins descritivos e pedagógicos. Esta área objetiva identificar em que aspectos os aprendizes diferem ou se assemelham aos falantes nativos. Os corpora empregados na pesquisa são o corpus de estudo (Br-ICLE), contendo inglês escrito por brasileiros, compilado de acordo com o projeto ICLE (International Corpus of Learner English) e dois corpora de referência (LOCNESS e BAWE), contendo inglês escrito por falantes de inglês como língua materna. Os resultados indicam que os alunos brasileiros usam, em demasia, as categorias de advérbios que indicam veracidade, realidade e intensidade, em relação ao uso que deles fazem os falantes nativos, além de usarem esses advérbios de forma distinta. Os resultados sugerem que, além das diferenças apresentadas em termos de frequência (seja pelo sobreuso ou subuso dos advérbios), os aprendizes apresentavam combinações errôneas, ou em termos de colocados ou em termos de prosódia semântica. E finalmente a pesquisa revela que a preferência dos aprendizes por advérbios que exprimem veracidade, realidade e intensidade cria a impressão de um discurso muito assertivo. Conclui-se que as diferenças encontradas podem estar ligadas a fatores como o tamanho dos corpora, a influência da língua materna dos aprendizes, a internalização dos elementos linguísticos necessários para a produção de um texto em língua estrangeira, a falta de fluência dos aprendizes e o contexto de sala de aula nas universidades / This research investigates how Brazilian learners of English use adverbs ending in-ly in written English and compares their use to that of speakers of English as a mother tongue. To this end, the work resorts to Corpus Linguistics as both theoretical and methodological support. The research is based on the area called Learner Corpora Research, which deals with the collection, storage and analysis of linguistic data produced by learners of a foreign language, which can then be used for descriptive and teaching purposes. This area aims to identify ways in which learners use of the foreign language is different or similar to that of native speakers. The data used in this research are the corpus of study (Br-ICLE), containing written English produced by Brazilian learners, built according to the ICLE project (International Corpus of Learner English), as well as two reference corpora (Locness and BAWE) containing written English produced by speakers of English as a mother tongue. The results indicate that Brazilian learners overuse the categories of adverbs that indicate truth, reality and intensity in comparison to the use made by native speakers, furthermore they use these adverbs in different ways. The results also suggest that, given the differences in frequency (either by overuse or underuse of adverbs), the learners tend to misuse combinations in terms of collocates or in terms of semantic prosody. And finally, the research reveals that the preference of learners for adverbs expressing truth, reality and intensity creates the impression of very assertive voices. We conclude that these differences may be related to factors such as the size of the corpus, the influence of the learners mother tongue, the internalization of linguistic elements needed to produce a text in a foreign language or even the lack of fluency of the learners and the classroom context in the universities
|
53 |
A cultura brasileira de Darcy Ribeiro em língua inglesa : um estudo da tradução de termos e expressões de antropologia da civilização /Serpa, Talita. January 2012 (has links)
Orientador: Diva Cardoso de Camargo / Banca: Francis Henrik Aubert / Banca: Adriane Orenha Ottaiano / Resumo: Com o propósito de investigar os comportamentos linguístico-tradutório e social de dois tradutores diante dos obstáculos impostos pelos limites culturais na Tradução, analisamos um corpus paralelo da subárea de especialidade da Antropologia da Civilização, composto pelas obras O processo civilizatório: etapas da evolução sociocultural (1968) e O povo brasileiro: a formação e o sentido do Brasil (1995), de autoria do antropólogo Darcy Ribeiro e pelas respectivas traduções para a língua inglesa, realizadas por Betty J. Meggers e Gregory Rabassa.Também nos valemos de dois corpora comparáveis de Antropologia em português e em inglês, e de um corpus de apoio composto principalmente por dicionários de Ciências Sociais e Antropologia. Os principais objetivos que nortearam a presente pesquisa foram: observar a tradução de termos e expressões das obras darcynianas, assim como verificar o processo tradutório concernente aos brasileirismos e neologismos terminológicos elaborados pelo autor; investigar o comportamento linguístico-cultural dos tradutores, por meio da análise das opções por eles utilizadas nas traduções e dos traços de simplificação e explicitação nos textos traduzidos; e elaborar dois glossários bilíngues para a terminologia antropológica. Para tanto, apoiamo-nos na abordagem interdisciplinar proposta por Camargo (2005, 2007), adotando, para o levantamento e processamento eletrônico dos dados, o arcabouço teórico-metodológico dos Estudos da Tradução Baseados em Corpus (BAKER, 1993, 1995, 1996, 2000), da Linguística de Corpus (BERBER SARDINHA, 2004, 2010; TOGNINI-BONELLI, 2001) e, em parte, da Terminologia (BARROS, 2004; KRIEGER & FINATTO, 2004, FAULSTICH, 1995, 2000). No tocante à análise dos dados levantados, adotamos os trabalhos de Sociologia da Tradução... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Intending to investigate the social and translational linguistic behaviors of two translators in face of obstacles imposed by cultural barriers in translation, we analyzed a parallel corpus of Social Anthropology of Civilization sub-area, composed by the works, O processo civilizatório (1968) e O povo brasileiro (1995), written by the anthropologist Darcy Ribeiro, as well as by their translations into English, performed by Betty J. Meggers and Gregory Rabassa, respectively. We also used two comparable corpora of Anthropology in Portuguese and in English, and a support corpus composed mainly of dictionaries of Social Sciences and Anthropology. The main objectives that guided this research were: to observe the translation of terms and expressions in Darcy Ribeiro's works, to analyze the translational process concerning to the terminological Brazilianisms and neologisms produced by the author; to investigate the translators' linguistic and cultural behavior through the analysis of resources used by them in their translations; to identify simplification and explicitation features in the two translated texts; and to elaborate two bilingual glossaries for anthropological terminology. With these purposes, we based our study on Camargo's interdisciplinary proposal (2005,2007) adopting, for the electronic collection and processing of data, the theoretical and methodological framework of Corpus-Based Translation Studies (Baker, 1993, 1995, 1996, 2000), of Corpus Linguistics (BERBER SARDINHA, 2004, 2010, TOGNINI-BONELLI, 2001) and, in part, of Terminology (BARROS, 2004; KRIEGER & FINATTO, 2004, FAULSTICH, 1995, 2000). Concerning the classification and analyzes of data gathered from our corpora, we based our research... (Complete abstract click electronic access below) / Mestre
|
54 |
Atos de fala em dicionários híbridos italiano>português-brasileiro: sugestão para dicionarização de ilocuções via corpora / Speech acts in Italian>Brazilian-Portuguese hybrid dictionaries: a suggestion for lexicographical records of illocutionary acts through Corpus linguisticsRenato Railo Ribeiro 25 September 2015 (has links)
O objetivo do estudo foi sugerir a inserção, em dicionários híbridos italiano>portuguêsbrasileiro tais como o Parola Chiave (2012), de informações acerca da dimensão pragmático-ilocucionária de ambas as línguas, a partir do uso de corpora eletrônicos. A metodologia empregada foi a seguinte: (a) fundamentação teórica, baseada: no conceito de Lexicografia de Krieger (2008) e no de dicionário híbrido de Höfling, Silva e Tosqui (2004); no de Pragmática Linguística e no de atos de fala de Bianchi (2008) e Sbisà (2009); no de Linguística de Corpus de Berber-Sardinha (2000), (2003) e (2004) e Tagnin (2004) e (2013); (b) estabelecimento de critérios para a investigação de ilocuções em corpora italiano e português-brasileiro, a saber: adoção da teoria dos atos de fala proposta por Austin (1990[1975]) (em função de seu critério para reconhecimento de ilocuções, a forma verbal na primeira pessoa do singular do presente do indicativo na voz ativa, e de sua associação ilocuções-verbos); adoção de dois corpora online, Corpus Paisà e Corpus do Português (o primeiro do italiano, o segundo do português-brasileiro, escolhidos em função da extensão de cada um, o que os torna representativos de suas respectivas línguas); adoção de cinco verbos ilocucionários comissivos do italiano, promettere, giurare, assicurare, impegnarsi, garantire (em função da mútua relação sinonímica que possuem entre si, segundo o dicionário Sinonimi e contrari minore (2009)); adoção de cinco verbos ilocucionários comissivos do português-brasileiro, prometer, jurar, assegurar, comprometer-se, garantir (em função de serem semanticamente equivalentes aos respectivos verbos italianos, segundo o Parola Chiave); adoção da forma verbal citada acima como sintaxe de busca para pesquisa em corpora; (c) análise qualitativa e quantitativa: obtiveram-se os números totais de ocorrências de cada ilocução; realizou-se uma análise qualitativa de modo a excluir casos anômalos, cujos critérios de exclusão foram: casos de homonímia, negação, repetição e ininteligibilidade; após obtenção dos números reais, excluíram-se da pesquisa as ilocuções mi impegno e comprometo-me/ me comprometo (em função da baixa frequência); (d) discussão acerca das possibilidades de dicionarização de ilocuções a partir dos resultados de corpora. Como resultado final, a sugestão foi a de inserir: na microestrutura, marcas de uso referentes às classes de ilocução; na micromedioestrutura, remissivas de modo a conduzir o leitor a um texto externo à nomenclatura; na macroestrutura, um texto externo à nomenclatura que contenha: (i) explicações referentes às classes de ilocuções e lista de respectivas espécies convencionalmente recorrentes do italiano dispostas segundo frequência; (ii) espécies de ilocuções equivalentes do português-brasileiro dispostas segundo frequência; (iii) exemplos de uso, retirados dos corpora, de tais verbos ilocucionários desempenhando sua função ilocucionária convencional. / This study aims to suggest a method of inserting, in hybrid Italian>Brazilian-Portuguese dictionaries such as Parola Chiave (2012), information about the pragmaticillocutionary dimension of both languages, through electronic corpora. The methodology used was as follows: (a) theoretical foundation based on: Krieger\'s concept of Lexicography (2008) and Höfling, Silva & Tosqui\'s hybrid dictionary (2004); Bianchi (2008) and Sbisà\'s (2009) Pragmalinguistics and speech acts; Berber- Sardinha (2000, 2003, 2004) and Tagnin\'s (2004, 2013) Corpus Linguistics; (b) establishing criteria for illocution research in corpora, namely: adopting the theory of speech acts proposed by Austin (1990[1995]) as research paradigm (due to its criteria for recognizing illocutions, the verb form in the first-person singular of the present indicative in active voice and its illocution-verbs association); adopting two online corpora, Corpus Paisà and Portuguese Corpus (due to the length of each one, which makes them representative of their languages); adopting five Italian illocutionary verbs of commissive class, promettere, giuare, assicurare, impegnarsi, garantire (due to the mutual synonymy relation they have one to each other, according to Sinonimi e contrari minore (2009)); adopting five illocutionary verbs of Brazilian-Portuguese, as known: prometer, jurar, assegurar, comprometer-se, garantir (for being semantically equivalent to their corresponding verb in Italian, according to Parola Chiave (2009)); adopting the verb form mentioned above as syntax search to corpora research; (c) quantitative and qualitative analysis: the total number of occurrences of each illocution was obtained; a qualitative analysis was conducted in order to exclude anomalous cases, of which exclusion criteria were: cases of homonyms, denial, occurrences repetition and unintelligibility; a quantitative analysis was conducted in order to exclude the illocutions mi impegno and comprometo-me / me comprometo (due to their low frequency); (d) discussion around the possibilities of lexicographical records of illocutions from the results of corpora. As a final result, the suggestion was to insert: in the dictionary microstructure, signs of usage referring to illocution classes; in its micromediumstructure: cross references in order to conduct the reader to a section out of nomenclature; in its macrostructure: a text, external to the nomenclature, containing: (i) explanations related to illocution classes and a list of conventionally recurring species of Italian arranged by frequency; (ii) equivalent illocutions species of Portuguese- Brazilian arranged by frequency; (iii) examples of usage, taken from the corpora, of illocutionary verbs performing their conventional illocutionary function.
|
55 |
Interpretação simultânea: a linguística de Corpus na preparação do intérprete / Simultaneous Interpreting: Corpus Linguistics in Interpreter PreparationCarla Cynira Lima Nejm 18 March 2011 (has links)
Considerando a pouca quantidade de dados e o tempo limitado para a preparação do intérprete de conferência, o objetivo desta pesquisa é propor uma metodologia para a elaboração de glossários bilíngues, inglês/português, voltados às necessidades de preparação deste profissional, no modo de Interpretação Simultânea, utilizando as ferramentas da Linguística de Corpus. Apesar do crescente número de publicações sobre Estudos de Interpretação, ainda não existe uma extensa bibliografia, em português, que apresente material de suporte para a preparação do intérprete. O modelo de glossário proposto tem como objetivo incluir não apenas termos técnicos e acrônimos, mas também colocados de termos, nomes próprios e paráfrases, e até mesmo pronúncia, quando relevante, pois o acesso a tais informações não somente permite que a Interpretação siga as normas da convencionalidade da língua de chegada, como também poupa o intérprete de depender tanto de um conhecimento intuitivo da língua, reduzindo, dessa forma, a carga cognitiva. Devido ao pouco tempo para a preparação do intérprete, é impraticável fazer uma leitura detalhada de grande quantidade de material de estudo. A Linguística de Corpus, por permitir o estudo de grandes coletâneas de textos e possibilitar a análise dos padrões de linguagem em textos naturais, foi utilizada na elaboração dos glossários. A metodologia descreve a elaboração de glossários para quatro trabalhos com tópicos distintos, sendo que os corpora coletados têm como base as informações enviadas pelo contratante do serviço, biografias de palestrantes, resumos de palestras e outros documentos relacionados aos eventos. Os corpora foram explorados com o programa WordSmith Tools, e, ao final, os glossários foram avaliados em relação a sua eficácia para o evento de Interpretação estudado, tendo como base a transcrição das palestras proferidas. / Given the lack of data and the limited time available for the preparation of Conference Interpreters, this research aims to propose a methodology for the preparation of English/Portuguese bilingual glossaries, based on the preparation needs of professionals in the simultaneous interpreting mode, using Corpus Linguistics tools. In spite of the growing number of publications on Interpreting Studies, there is still no extensive bibliography in Portuguese that can provide support material for the preparation of interpreters. The proposed glossary model aims to include not only technical terms and acronyms, but also collocates of terms, proper names and paraphrases, including their correct pronunciation, whenever relevant. By having access to this information, Interpreters can follow the norms of language use of the target text, while depending less on their intuitive knowledge of the language, thus reducing the cognitive load. Interpreters have little time to prepare and, therefore, are unable to read large quantities of studying material. Corpus Linguistics enables the analysis of a large number of documents and language patterns in natural texts, which makes it very useful for the preparation of glossaries. The methodology describes the preparation of glossaries on four different topics and the collected corpora were based on information sent by the parties contracting Interpreting services, such as speakers biographies, lecture summaries and other documents related to the events. The corpora were explored with WordSmith Tools software and assessed with regard to their efficacy for the Interpreting event studied, based on the transcription of the lectures given.
|
56 |
Tradução jurídica e divórcio: a elaboração de um glossário nos idiomas português, francês e inglês / Juridical translation and divorce: creating a glossary in Portuguese, English and FrenchMaysa Vani Alves 24 August 2016 (has links)
Os tradutores, muitas vezes, encontram dificuldades em relação à terminologia a ser aplicada na tradução de determinados documentos, especialmente na tradução de termos marcados culturalmente, que nem sempre possuem um equivalente plenamente satisfatório. Na área jurídica, a tradução de textos não requer apenas conhecimento de idiomas e da cultura do país-alvo, mas também dos sistemas jurídicos dos países. Tendo isso em vista, o objetivo desta pesquisa foi a elaboração de uma proposta de glossário trilíngue (português inglês francês) com termos jurídicos relacionados ao divórcio. / Translators often have difficulties regarding the terminology to be applied in the translation of certain documents, especially in translation of culturally marked terms that do not have fully satisfactory equivalents. In the legal area, the translation of texts requires not only knowledge of languages and the country\'s target culture, but also the countries\' legal systems. With this in view, the aim of this research was the development of a proposal for a trilingual glossary (Portuguese - English - French) with legal terms related to divorce.
|
57 |
Fraseologia do verbo get na língua inglesa: uma abordagem da Linguística de Corpus e da Gramática de Construções / Phraseology of the verb get in the English Language: a Corpus Linguistics and Construction Grammar approachRodrigo Garcia Rosa 09 April 2014 (has links)
Esta pesquisa investiga os usos de get nos contextos em que o verbo é seguido de sintagmas nominais com a finalidade geral de apresentar um mapeamento das construções em que esse predicado pode ocorrer. A pesquisa adota a perspectiva metodológica da Linguística de Corpus (McENERY; HARDIE, 2012), para a seleção e extração de dados da língua em uso por meio da utilização de um corpus de inglês americano (Corpus of Contemporary American English - COCA), e o embasamento teórico adota a perspectiva da Gramática de Construções Cognitiva (GOLDBERG, 1995; 2006), para a análise e classificação dos dados em construções. Mais especificamente, o referido mapeamento construcional tem como objetivo descrever o comportamento linguístico de get em dois níveis de análise, a saber: (1) No nível construcional, ao salientar as principais características sintáticas, semânticas e pragmáticas dos contextos gramaticais em que o verbo ocorre e; (2) No nível lexical, ao focalizar e discutir os principais fraseologismos nucleados por get. O corpus de estudo é composto de 9.210 enunciados extraídos do COCA e conta com get em todas as suas formas morfológicas possíveis, isto é, a busca feita no corpus fez uso da forma lematizada do verbo de maneira a trazer diferentes instanciações de get (get, gets, getting, got, gotten). Quanto aos colocados, a metodologia de busca e seleção dos complementos nominais priorizou os 50 substantivos mais frequentes à margem direita de get, também em suas formas lematizadas, de maneira a garantir uma variedade semântica considerável entre os elementos que colocam com o verbo sob investigação. Os resultados a que este estudo chegou confirmam o comportamento polissêmico e a versatilidade sintática de get (ISRAEL, 2004), ao explicitarem 13 contextos construcionais em que esse verbo é produtivo. Entretanto, a análise quantitativa dos dados demonstra a preferência de get pela construção transitiva, contexto no qual o sentido central licenciado é o de obtenção. No que se refere ao comportamento de get no nível lexical, o corpus de estudo salientou 74 unidades fraseológicas nucleadas pelo verbo / This research examines the uses of get in contexts where the verb is followed by nominal phrases and it aims at proposing a mapping of the constructions where this predicate may occur. The research adopts the methodological perspective of Corpus Linguistics (McENERY; HARDIE, 2012) for the selection and extraction of data of language in use from a corpus of American English (Corpus of Contemporary American English COCA), and the theoretical framework adopts the perspective of Cognitive Construction Grammar (GOLDBERG, 1995; 2006), for the analysis and categorization of the data in constructions. More specifically, the constructional mapping referred to has the objective to describe the linguistic behavior of get in two levels of analysis, namely: (1) In the constructional level, by highlighting the main syntactic, semantic and pragmatic characteristics of the grammatical contexts in which the verb occurs and; (2) In the lexical level, by emphasizing and discussing the main phraseologisms headed by get. The study corpus is composed of 9.210 utterances extracted from COCA and it contains get in all of its possible morphological forms, that is, the search run in the corpus made use of the lemmatized form of the verb so as to generate distinct instantiations of get (get, gets, getting, got, gotten). As for the collocates, the method of search and selection of the nominal complements prioritized the 50 most frequent nouns to the right of get, also in their lemmatized forms, in order to guarantee a considerable semantic variability amongst the elements with which the verb under analysis collocates. The conclusions at which this study arrived confirm the polysemous behavior and the syntactic versatility of get (ISRAEL, 2004), by outlining 13 constructional contexts in which the verb is productive. Nevertheless, the quantitative analysis of the data shows the preference of get for the transitive construction, context in which the licensed central meaning is that of obtention. As for the behavior of get in the lexical level, the study corpus highlighted 74 phraseological units headed by get
|
58 |
A tradução da culinária típica brasileira para o inglês: um estudo sob o enfoque da Linguística de Corpus / Typical Brazilian cooking translated into English: a corpus-based researchRozane Rodrigues Rebechi 14 April 2015 (has links)
Apesar de a culinária ser tema constante de programas de TV, seções de jornais e revistas, livros de receitas e diversas outras publicações, ainda é pouco estudada no meio acadêmico. Normalmente desconsiderada como linguagem especializada, a área não é contemplada com grande oferta de materiais de referência, ainda mais escassos quando consideramos o par de línguas português-inglês. No que tange à culinária tipicamente brasileira, não há disponíveis no mercado materiais que abranjam termos e fraseologias que auxiliem tradutores e redatores da área na produção de textos em língua inglesa. Consequentemente, não raro essa tarefa resulta em equivalentes equivocados, falta de naturalidade e adaptações que acarretam a descaracterização de referências culturais. Com o objetivo de identificar os termos próprios da culinária brasileira que constituem as entradas do dicionário e equivalentes, definições, fraseologias e outras informações relevantes em língua inglesa, construímos um corpus de estudo a partir de livros de receitas, que foi investigado segundo os preceitos da Linguística de Corpus. Esse corpus é constituído por um subcorpus comparável e um paralelo. O primeiro é composto de onze livros escritos originalmente em português e em inglês, contabilizando aproximadamente 430.000 palavras em cada idioma. O subcorpus paralelo compreende seis dos onze livros escritos originalmente em português e suas respectivas traduções para a língua inglesa. Duas ferramentas computacionais foram utilizadas no processamento desse material: o WordSmith Tools 6.0 e o ParaConc. A partir das palavras-chave-chave simples e compostas em português palavras significativamente mais recorrentes em no mínimo dois dos onze livros , buscamos equivalentes no material em língua inglesa. Os resultados mostraram que nem sempre há correspondência entre o conteúdo selecionado para compor os livros de culinária brasileira escritos em português e em inglês. No material em português, observamos maior presença de receitas emblemáticas e ingredientes típicos de algumas regiões, ao passo que em inglês sobressaem pratos do dia a dia, comprovando que a divulgação da culinária brasileira pelo brasileiro está atrelada a questões nacionalistas de preservação de símbolos, diferente daquela propagada em língua inglesa, talvez mais baseada na observação dos hábitos alimentares brasileiros. Diante dessa discrepância, nem sempre foi possível identificar equivalentes e, consequentemente, fraseologias para as referências culturais brasileiras nas receitas escritas originalmente em inglês. Nesses casos, recorremos à versão em inglês do subcorpus paralelo. Verificamos, também, que os textos em português utilizam uma linguagem mais informal e menos detalhada, observada especialmente na seção da receita dedicada ao modo de preparo. Para a construção do dicionário, utilizamos o software TshwaneLex A metodologia se mostrou adequada para o levantamento da terminologia e de equivalentes da área, podendo, assim, ser aplicada a outras pesquisas que partam de dados empíricos. / The aim of this dissertation is to build the Portuguese-English Dictionary of Brazilian Cooking. Although cooking is a common theme of TV shows, newspaper and magazine sections, cookbooks and various publications, it has been underestimated by scholars. Usually disregarded as specialized language, it does not count with a large supply of reference materials. This is especially true when we consider the pair of languages Portuguese-English. Regarding the typical Brazilian cooking, works covering terms and phraseologies which could help translators and writers with the production of texts in the area are nonexistent. Consequently, the task results in problems such as the use of wrong equivalents, lack of fluency and adaptations that lead to mischaracterization of cultural references. In order to identify the terms which are characteristic of Brazilian cooking which constitute the dictionary entries and their equivalents, definitions, phraseologies and other relevant information in English, we built a corpus from cookbooks. This corpus, which consists of a comparable and a parallel subcorpus, was investigated with the methodology underlying Corpus Linguistics. The first comparable corpus comprises eleven books originally written in Portuguese and in English, accounting for about 430,000 words in each language. The parallel subcorpus is made up of six of the eleven books originally written in Portuguese and their translations into English. The data were drawn by two computational tools: WordSmith Tools 6.0 and ParaConc. From simple and complex key-keywords in Portuguese words which are significantly more reccurrent in at least two of the eleven books considered , we searched for equivalents in the English texts. Results showed differences between Brazilian cookbooks written in Portuguese vis-à-vis those written in English. Concerning the recipes written in Portuguese, we observed a higher presence of emblematic dishes and ingredients which are typical of some regions. On the other hand, day to day recipes stand out in the books written in English, confirming that Brazilians are more influenced by nationalist issues when choosing their characteristic dishes, whereas foreigners seem to base their choices on observation of eating habits. Due to this discrepancy, the English books at times failed to provide equivalents for some of the Brazilian cultural references. In such cases, we resorted to the English version of the parallel subcorpus. We also observed that the recipes in Portuguese use a more informal language and are less detailed, mainly when we analyze the section devoted to preparation. To build the dictionary we used the software TshwaneLex. The results showed that the methodology was useful for identifying terms, phraseologies and equivalents in a specialized area. This may motivate other researchers to attempt to use it in other studies which deal with empirical data.
|
59 |
A fraseologia do futebol: um estudo bilingue português-inglês direcionado pelo corpus / Football Phraseology: A bilingual Portuguese-English corpus-driven study.Sabrina Matuda 09 August 2011 (has links)
O objetivo desta pesquisa é estudar a terminologia do futebol em inglês e português por meio do estabelecimento de equivalentes fraseológicos. A escolha de trabalhar com unidades fraseológicas, e não apenas com termos isolados, deve-se ao fato de acreditarmos que um termo raramente ocorre sozinho. Em outras palavras, é muito provável que este venha acompanhado de um colocado, formando uma colocação e, muitas vezes, seja até parte de uma unidade de sentido maior. Para tanto, a fundamentação teórica embasa-se na Linguística de Corpus, na Terminologia Textual, na Tradução Técnica como ato comunicativo sujeito a condicionantes culturais e no conceito forma-representação. O corpus de estudo possui, aproximadamente, um milhão de palavras em cada língua: 917.073 em português e 1.002.897 em inglês. Cada corpus é dividido em quatro subcorpora: regras do jogo, textos jornalísticos sobre resultados de partidas, narrações minuto a minuto e transmissões sociais. A análise do corpus foi realizada de maneira semiautomática, utilizando o etiquetador Tree-Tagger para fazer a etiquetagem morfossintática dos textos e o programa WordSmith Tools para explorar o corpus. O estudo nos mostrou que a extração de unidades fraseológicas é uma abordagem promissora para a compilação de um glossário que tenha como objetivo registrar o uso autêntico da terminologia técnica - em nosso caso, do futebol. Ao final do trabalho, apresentamos um modelo de glossário bilíngue português-inglês de fraseologias formadas a partir do termo gol, com base na análise realizada. / This study investigates football terminology both in English and in Portuguese and attempts to establish phraseological equivalents. Phraseological units were chosen to the detriment of individual terms because these usually occur in a larger context rather than as isolated lexical items living a life of their own. We believe that a term tends to be accompanied by a collocate, making up a collocation, which is frequently part of an extended unit of meaning. Therefore, the study is based on the notions of Corpus Linguistics and Textual Terminology. To explain cultural differences, technical translation is viewed as a communicative act subject to cultural restraints and the concept of form-representation is called upon to elucidate such differences. Our corpus consists of approximately two million words - 1.002.897 in English and 917.073 in Portuguese. Each corpus is divided into four subcorpora: laws of the game, newspaper reports on match results, live minute by minute commentaries and live commentaries by sports journalists and by football fans via social media like twitter and facebook. The analysis was carried out semi-automatically on tagged corpora, for which we used Helmut Schmids Tree-Tagger and Mike Scotts WordSmith Tools. All in all, the study proved that the extraction of phraseological units is a promising approach to build a glossary which aims at registering the authentic use of specialized language, in this case, the language of football. The study concludes with a model for a bilingual Portuguese-English phraseological glossary with entries made up of the term goal.
|
60 |
A construção de um glossário bilíngue de futebol com o apoio da Linguística de Corpus. / Bulding a bilingual glossary on Football with the aid of Corpus LinguisticsSeemann, Paulo Augusto Almeida 26 March 2012 (has links)
Ao tentar traduzir um texto específico sobre o tema futebol da língua espanhola para o português brasileiro ou vice-versa, o tradutor se depara com uma infinidade de termos típicos dessa área de especialidade que não constam em muitos dos atuais dicionários e glossários, ou constam de forma limitada, sem abranger muitas das situações reais de uso. Neste trabalho, construímos um glossário bilíngue e bidirecional que contempla os termos futebolísticos mais frequentes no par linguístico espanhol-português, usados rotineiramente na comunicação escrita. Partimos da suposição que a Linguística de Corpus forneceria os meios necessários para tal empreitada. A Linguística de Corpus permite estudar uma língua ou variedade linguística por computador, por meio de evidências empíricas encontradas em um corpus, entendido como um conjunto de dados linguísticos textuais em formato eletrônico e coletado de forma criteriosa. Esta dissertação está dividida em cinco partes. Como introdução, falamos de alguns aspectos históricos das línguas portuguesa e espanhola, da influência do futebol em nossa sociedade, de problemas encontrados em dicionários e glossários, e do potencial das notícias futebolísticas da Internet como referência para a construção do glossário que propomos. Na segunda parte, comentamos a Linguística de Corpus como abordagem e método de investigação, os tipos de corpora e a composição de nosso corpus de estudo, a questão da equivalência na tradução e a forma como selecionamos os termos e seus equivalentes tradutórios, tendo como base a comparação de notícias futebolísticas do Brasil, da Espanha e da Argentina, além da extração e observação de palavras-chave, com a ajuda de ferramentas eletrônicas específicas. Na terceira parte, discutimos as questões terminológicas que envolvem este estudo, especialmente as decisões tomadas para a macro e microestrutura de nosso glossário. Na quarta parte, demonstramos como o glossário pode ser apresentado ao consulente e oferecemos uma amostra de verbetes. Na quinta e última parte, fazemos as considerações finais, em que concluímos que a Linguística de Corpus, como abordagem e metodologia, confirmou-se eficiente para a construção do glossário bilíngue, pois a exploração de corpora especializados permitiu identificar os principais termos futebolísticos e seus equivalentes tradutórios usados na comunicação escrita do jornalismo brasileiro, espanhol e argentino, resultando em uma obra de referência bilíngue específica do futebol com quase quatro mil verbetes; todos com exemplos reais de uso / When trying to translate a specific text on football from Spanish into Brazilian Portuguese or vice versa, the translator is faced with a myriad of footbal-specific terms which are not found in most dictionaries or glossaries, or which are found in a limited way, leaving out many real use situations. In the course of this study, a bilingual and bi-directional glossary was built with the most commonly used football terms in written communication in the Spanish-Portuguese language pair, . My initial assumption was that Corpus Linguistics would provide the necessary means for such a task. Corpus Linguistics enables one to study a language or a language variety using a computer, retrieving empirical evidence found in a corpus, which is defined as a set of texts, compiled according to predefined criteria, in electronic format. This dissertation is divided into five parts. In the introduction, some historical aspects of Portuguese and Spanish are discussed, as well as the influence of football in our society, the problems found in dictionaries and glossaries, and the potential of football news retrieved from the Internet as a basis for building the glossary proposed. In the second part, I argue that Corpus Linguistics is an approach and a method of research, and present the different types of corpora. Then, the question of equivalence in translation is briefly addressed, the content of our corpus of study is explained, as well as the steps adopted to identify the terms and their translation equivalents, through the comparison of football news from Brazil, Spain and Argentina, and by means of the extraction and observation of keywords, with the aid of specific electronic tools. In the third part, I discuss the terminology issues implicated in this study, especially with reference to the decisions taken for the macro- and microstructure of the glossary. In the fourth part, I propose a form of presenting the glossary to the user and provide a sample of entries. In the fifth and last part, I make the final considerations, in which I conclude that Corpus Linguistics, as an approach and a methodology, proved to be effective for the construction of the targeted bilingual glossary, since exploring the specialized corpora made it possible to properly identify the main football terms used in written communication in Brazilian, Spanish and Argentine journalism and their translation equivalents. The result is a bilingual work of reference in the field of football, which contains nearly four thousand entries, all of them with authentic examples of usage.
|
Page generated in 0.0689 seconds