Spelling suggestions: "subject:"corpus."" "subject:"korpus.""
311 |
A practical approach to the standardisation and elaboration of Zulu as a technical languageVan Huyssteen, Linda 30 November 2003 (has links)
The lack of terminology in Zulu can be overcome if it is developed to meet international scientific and technical demands. This lack of terminology can be traced back to the absence of proper language policy implementation with regard to the African languages. Even though Zulu possesses the basic elements that are necessary for its development, such as orthographical standards, dictionaries, grammars and published literature, a number of problems exist within the technical elaboration and standardisation processes:
* Inconsistencies in the application of standard rules, in relation to both orthography and terminology.
* The lack of standardisation of the (technical) word-formation patterns in Zulu. (Generally the role of culture in elaboration has largely been overlooked).
* The avoidance of exploiting written technical text corpora as a resource for terminology. (Text encoding by means of corpus query tools in term extraction has just begun in Zulu and needs to be properly exemplified).
* The avoidance of introducing oral technical corpora as a resource for improving the acceptability of technical terminology by, for instance, designing a type of reusable corpus annotation.
This study contributes towards solving these problems by offering a practical approach within the context of the real written, standard and oral Zulu language, mainly within the medical terminological domain. This approach offers a reusable methodological foundation with proper language exemplification that can guide terminologists in terminological research, or to some extent even train them, to achieve effective technical elaboration and eventual standardisation.
This thesis aims at attaining consistent standardisation on the orthographical level in order to ease the elaboration task of the terminologist. It also aims at standardising the methods of word- (term-)
formation linking them to cultural factors, such as taboo. However, this thesis also emphasises the significance of using written and oral technical corpora as terminology resource. This, for instance, is made possible through the application of corpus linguistics, in semi-automatic term extraction from a written technical corpus to aid lemmatisation (listing entries) and in corpus annotation to improve the acceptability of terminology, based on the comparison of standard terms with oral terms. / Linguistics and Modern Languages / D. Litt et Phil. (Linguistics)
|
312 |
A Beautiful Wife Makes a Happy Husband : A CADS-based study on collocates to ‘husband’ and ‘wife’ throughout times in both movies and contemporary culture / En vacker maka skapar en lycklig make : En CADS-baserad studie om kollokationer till "make" och "maka" genom tiderna i både filmer och samtida kulturStrandberg, Anna January 2021 (has links)
This thesis aims to investigate the differences between what collocations are used for ‘husband’ and ‘wife’ in films and contemporary culture. The comparison spans through different decades and the decades will also be compared and analysed. The thesis will investigate if the collocates reflect the societal change and if so, can the results relate to existing power structures/gender roles? The background for the thesis consists of information about marriage history, films and their influence on culture, what a collocation is and previous research on collocation. The method used for this thesis was Corpus-Assisted Discourse Studies which includes both corpus studies and discourse analysis. Consequently, a more in-depth understanding of the results and tables were given. To classify the collocates collected from the Movie Corpus (which represents movies) and the Corpus of Historical American English (representing culture) the results are presented Caldas-Coulthard and Moon’s categorisation schema. After this, in the discussion, the proportional distribution is presented because the corpora are different sizes and this way they can be compared correctly. The conclusion is that movies reflect culture somewhat, but it lacks in some areas. However, some patterns can be found. ‘Wife’ and ‘husband’ are discussed differently, and the difference in collocates shows that. Moreover, the results seem to reflect typical stereotypes that do exist and has existed.
|
313 |
Artigos médicos em inglês, publicados em periódicos do Brasil e do exterior: uma análise a partir de corpora comparáveisPerrotti-Garcia, Ana Julia 29 June 2009 (has links)
Made available in DSpace on 2016-04-28T18:24:05Z (GMT). No. of bitstreams: 1
Ana Julia Perrotti Garcia.pdf: 821486 bytes, checksum: bee7b666f17ebb799b231741536e2c70 (MD5)
Previous issue date: 2009-06-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In recent years, Brazilian medical journals have increased the number of
articles published in English in their issues, in an effort to attract readers from
outside Brazil. Little is known about the quality of English language used in
these papers, however. Two comparable corpora of approximately 5 million
tokens each were collected especially for this study and contain full papers from
medical journals. Corpus BRAZIL contains full papers from medical journals
published in Brazil and corpus ABROAD contains full papers published in
American and European medical journals, both in British English and American
English. After analyzing the language used in both corpora, using WordSmith
Toos (WordList, clusters; and Concord, and a script in Unix shell language, we
detected that the verb submit had 1,111 occurrences in corpus BRAZIL and
only 4 in corpus ABROAD. We then looked more closely at the verb submit , a
prima facie translation of the Portuguese word submeter , in order to detect
which grammatical structures were used in corpus ABROAD to express the
same meaning. The strategies found in corpus ABROAD to express the idea
studied were: use of verbs (such as undergo; receive; take; have; initiate, start,
begin, use, continue, allocate, assign, attend, complete; to be taken, be referred
for; perform, do, be considered for, elegible for, to be given, to be subjected to,
subject to) in different tenses, voices and modes; use of adjectives; use of
prepositions (after, on, with, without) / As revistas médicas brasileiras têm apresentado, nos últimos anos, um número
crescente de artigos publicados em inglês, em um esforço para atrair leitores
do exterior e dar maior visibilidade aos textos de pesquisadores nacionais.
Entretanto, pouco se sabe sobre as características da língua inglesa
empregada nesses textos. Dois corpora comparáveis, com aproximadamente
cinco milhões de tokens cada foram especialmente coletados para o presente
estudo. Ambos contêm artigos de revistas médicas escritos em inglês. O
corpus BRAZIL com artigos publicados em revistas médicas brasileiras e o
corpus ABROAD com artigos publicados em revistas médicas dos Estados
Unidos e Europa, tanto em inglês norte-americano quanto britânico. Após
analisar a língua usada em ambos os corpora, usando ferramentas do
programa WordSmith (WordList, clusters e o concordanceador Concord) e uma
rotina de computador desenvolvida em linguagem Shell, detectamos que o
verbo submit teve 1.111 ocorrências no corpus BRAZIL e apenas quatro no
corpus ABROAD. O objetivo específico deste estudo foi determinar como os
médicos brasileiros usaram o verbo submit, uma tradução prima facie da
palavra submeter , e detectar quais estruturas gramaticais foram usadas no
corpus ABROAD para expressar o mesmo significado. As estruturas
encontradas no corpus ABROAD para expressar a ideia de submeter-se a um
exame, teste ou terapia foram: uso de verbos (tais como undergo; receive;
take; have; initiate, start, begin, use, continue, allocate, assign, attend,
complete; to be taken, be referred for; perform, do, be considered for, elegible
for, to be given, to be subjected to, subject to) em diferentes tempos, vozes e
modos; uso de adjetivação; uso de preposições (after, on, with, without)
|
314 |
Os lexical bundles na busca por semelhanças em um documento do setor farmacêutico / Lexical bundles searching similarities in a document of pharmaceutical sectorMazza, Luciene Novais 29 July 2009 (has links)
Made available in DSpace on 2016-04-28T18:24:09Z (GMT). No. of bitstreams: 1
Luciene Novais Mazza.pdf: 2077236 bytes, checksum: ab60b489f57494f9b4bd86ae30c618c1 (MD5)
Previous issue date: 2009-07-29 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / The present study explored a specific document of the pharmaceutical segment called Site Master File through the investigation of words combinations defined as lexical bundles (Biber et al.,1999). The aim of the study was to draw out the bundles so that to verify the degree of conformity of the linguistic features the use of lexical bundles may achieve, as being part of a document organized in a similar way, produced by different authors at different locations around the world. The theoretical-methodological approach was developed on the principles of Corpus Linguistics (Stubbs, 1996; Scott and Tribble, 2006; Berber Sardinha and Barbara, 2008; amongst others), an approach that makes use of a vast variety of authentic texts of language in use supported by computational tools. We compiled for this study fifteen samples of the Site Master File document stored in machine-readable form that belong to the same multinational pharmaceutical company based in Europe, which has more than a hundred of plants situated across the world. The Site Master File is a document prepared by pharmaceutical manufacturers that contains specific information about the quality assurance, the production and quality control of pharmaceutical manufacturing operations carried out at a named site/plant in order to be submitted to a regulatory authority. In addition, all documents must be officially certified in English. The analysis of the corpus data was performed to extract three-word bundles by using scripting languages such as Perl and Cygwin. Besides, a computer application was also designed to provide the cross-reference of data. The results of data analysis showed that although the samples of Site Master File bring a large range of similarity in its organization, we have not found regularity on the use of recurrent lexical bundles across the Site Master File documents. Thus, considering the absences of common lexical bundles across documents, we observed that, in each operating area of the pharmaceutical business unit there are some typical characteristics in relation to the type of product manufactured in the site, the processes engaged in the unit pharmaceutical operations as well as the geographic nearness relationships to the linguistic choices made by the different authors. Therefore, this study offers a contribution to the knowledge of variation in English use in preparing the Site Master File by authors allocated in a specific site. Moreover, the present study involves further research into the field of English for Specific Purposes based on corpora and into the studies of terminology / O objetivo deste trabalho foi examinar o documento Site Master File do setor farmacêutico a partir da investigação de uma combinação de palavras denominada lexical bundles (Biber et al. 1999) com o propósito de verificar o grau de conformidade com elementos lingüísticos que um documento com a mesma organização estrutural, escrita por diferentes autores em diferentes partes do mundo pode atingir. A presente pesquisa teve como principal suporte teórico e metodológico a Lingüística de Corpus (Stubbs, 1996; Scott e Tribble, 2006; Berber Sardinha e Barbara, 2008; entre outros), uma abordagem que permite investigar como a língua ocorre naturalmente no discurso por meio de ferramentas computacionais. Para esta investigação foram compilados quinze exemplares do documento Site Master File pertencente a um mesmo grupo farmacêutico multinacional com sede na Europa e com unidades de negócios espalhadas em mais de 100 países. O documento Site Master File é um conjunto de textos produzidos pelas indústrias farmacêuticas para atender as exigências de garantia e controle da qualidade dos medicamentos, a fim de se obter certificação internacional junto aos órgãos de vigilância sanitária. Ademais, todos os documentos devem ser oficialmente produzidos em língua inglesa. Para a análise dos dados foram utilizadas as linguagens de programação Perl e Cygwin, como também foi desenvolvido um aplicativo para gerar a extração dos lexical bundles de três palavras. Os resultados da análise dos dados indicaram, que embora o documento Site Master File apresente semelhanças em sua organização, não há uma regularidade de lexical bundles recorrentes entre as amostras dos quinze exemplares. Assim, dessa ausência de bundles semelhantes, foi possível observar traços característicos do tipo de negócio que cada unidade da empresa está envolvida, dos processos e produtos fabricados e, ainda, a relação da proximidade geográfica com as escolhas lingüísticas feitas pelos autores. Portanto, este estudo além de contribuir para o conhecimento das variações de uso da língua inglesa por autores de diferentes localidades na elaboração do documento Site Master File, também implica em futuras pesquisas no ensino de línguas para fins específicos baseado em corpora e nos estudos sobre terminologia
|
315 |
Autenticidade em livros didáticos para o ensino de inglês como língua estrangeira: um estudo diacrônico sob a perspectiva da Linguística de CorpusContrera, Solange 06 May 2010 (has links)
Made available in DSpace on 2016-04-28T18:24:16Z (GMT). No. of bitstreams: 1
Solange Contrera.pdf: 2749850 bytes, checksum: 872ee389d66d45fe5e452144a28da49a (MD5)
Previous issue date: 2010-05-06 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / The main aim of this researcher was to verify whether, in modern English teaching
books, authentic bundles were used or not, and whether, in books of the last
decades, in a diachronic perspective, if it was done or not. The main theoretical
underpinning for the research is provided by Corpus Linguistic, which is the area that
is concerned with the collection and analysis of criteriously selected corpora, which
could be read by computers with the aim of linguistic research. The researcher was
also based on the theoretical underpinning of the Teaching Approaches known as:
(1) audiolingual; (2) communicative; and (3) corpus Informed to investigate the use of
authentic language in the development of the English books. The research questions
investigated in this study were: (1) to the analysis of convergent and divergent lexical
bundles in this study corpus, (2) to discover which is the frequency of those lexical
bundles; (3) to the analysis the convergent and divergent bundles in each text of the
English books; and (4) and to verify which are the books composed by a degree of
superior linguistic authenticity in relation to the others investigated. The corpora
selected for the research are as follows: (a) the study of corpus, formed by five
English books designed for a foreign language, for the intermediate level, composed
of 25.485 words; (b) the reference corpora: British National Corpus (BNC), composed
of 100 million words, and the Google Corpus, composed of 1 trillion words. The
researcher analyzed, the degree of authenticity in the constancy of the language
used in the English books analyzed -some that were, and others that are still in use in
English teaching bringing a contribution to the Corpus Linguistics field / A pesquisadora teve como objetivo principal verificar se os autores de livros
didáticos atuais e voltados para o ensino de língua inglesa, de fato, empregam
lexicogramática autêntica e se os autores de livros didáticos de décadas passadas,
numa perspectiva diacrônica, também o fizeram. Para tanto, encontrou suporte
teórico na Lingüística de Corpus, uma área cujos pesquisadores se preocupam com
a coleta e com exploração criteriosas de corpora em formatos legíveis por
computador com o objetivo de pesquisar uma língua. A pesquisadora
fundamentou-se também nos pressupostos teóricos das abordagens de ensino de
língua estrangeira conhecidas como (1) audiolingualismo, (2) comunicativismo e (3)
informada por corpus para investigar o uso de língua autêntica no desenvolvimento
dos livros didáticos. As questões de pesquisa norteadoras deste estudo concernem
(1) à análise de pacotes lexicais convergentes e divergentes no corpus de estudo,
(2) à descoberta de qual é a freqüência desses pacotes lexicais, (3) à análise dos
pacotes convergentes e dos divergentes em cada texto dos livros didáticos e, por
fim, (4) à constatação de quais são os livros compostos por um grau de
autenticidade lingüística superior em relação aos demais investigados. Os corpora
selecionados para a pesquisa são estes: (a) o corpus de estudo, formado por cinco
livros didáticos para o ensino de inglês como língua estrangeira, para o nível
intermediário, compostos por 25.485 palavras, e (b) os corpora de referência: o
British National Corpus (BNC), composto por 100 milhões de palavras, e o Google
Corpus, composto por 1 trilhão de palavras. A pesquisadora almejou, ao analisar o
grau de autenticidade da língua constante desses livros didáticos uns que foram, e
outros que ainda são utilizados no ensino de inglês trazer uma contribuição para a
área da Lingüística de Corpus
|
316 |
A linguagem dos reality TV shows norte-americanos: análise e classificaçãoAraújo, Rafael Fonseca de 30 March 2017 (has links)
Submitted by Filipe dos Santos (fsantos@pucsp.br) on 2017-04-06T12:50:58Z
No. of bitstreams: 1
Rafael Fonseca de Araújo.pdf: 9767748 bytes, checksum: 9ba35e483f432ff6315a1d92099ab469 (MD5) / Made available in DSpace on 2017-04-06T12:50:58Z (GMT). No. of bitstreams: 1
Rafael Fonseca de Araújo.pdf: 9767748 bytes, checksum: 9ba35e483f432ff6315a1d92099ab469 (MD5)
Previous issue date: 2017-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This thesis presents a Multi-dimensional (MD) analysis (Biber, 1988 et seq.) of a
Corpus of American Reality TV Shows (CARTS). Reality television can be described
as unscripted television shows with non-professional actors being observed by
cameras in preconfigured environments (Kavka, 2012) and despite of being a relatively
new TV genre is a cornerstone of contemporary US television programming, since
according to some critics it has remade television culture (Murray and Quellette 2004).
The major goal of the study was to provide a lexical-grammatical description of the
verbal language of Reality TV shows by investigating a corpus of 780 texts taken from
39 popular American Reality TV shows, totaling over 6 million tokens. The specific
goals were to compare CARTS against the four dimensions of general English register
variation as well as against the five dimensions of American television register variation
(Berber Sardinha;; Veirano Pinto, in press). CARTS texts were classified into four main
program types (Competition, Documentary, Talent and Professional, and
Transformation) and into 13 sub-program types, namely, celebrities, dating, gamedoc,
docusoap, hidden cameras, reality sitcoms, business, cooking, fashion, performing,
expert guidance, self-improvement and social experimental. The corpus was balanced
so that each major category had the same number of texts. CARTS was tagged for
part of speech with the Biber Tagger and analyzed by the Bibber Tag Count which
calculated the normalized frequencies of the 128 linguistics features considered in the
research. The results present the additive MD analysis by showing how reality TV
shows are similar or different from others spoken and written English registers (from
Biber seminal 1988 study), as well as how the various manifestations of Reality TV
compare to television registers on US. Since there is no precedent for studies within
Corpus Linguistics dedicated to researching the lexical-grammatical profile of Reality
TV Shows in a multidimensional perspective, this research intends to fill this gap / O presente trabalho apresenta uma Análise Multidimensional (BIBER, 1988 et seq.)
do Corpus of American Reality TV Shows (CARTS). Reality TV shows podem ser
descritos como programas de televisão sem roteiro, com atores não profissionais
sendo observados por câmeras em ambiente pré-configurados (KAVKA, 2012) e
apesar de ser um gênero de televisão relativamente novo é considerado um marco na
programação da televisão nos EUA, uma vez que reinventou a cultura da televisão
(MURRAY e QUELLETTE, 2004). O principal objetivo do estudo é fornecer uma
descrição dos padrões léxico-gramaticais da linguagem verbal dos Reality TV shows.
Os objetivos específicos foram comparar o CARTS com as cinco principais dimensões
de variação da Língua Inglesa (BIBER, 1988 et seq.), bem como em contraste com as
quatro dimensões de variação de registro da televisão norte-americana (BERBER
SARDINHA e VEIRANO PINTO, no prelo). O CARTS é formado por 780 textos
extraídos de 39 reality TV shows norte-americanos populares, totalizando cerca de 6
milhões de palavras. Os textos do corpus foram classificados em quatro principais
categorias Competição, Documentário, Talento e Profissão, e Transformação que, por
sua vez, foram subdivididas em 13 subcategorias nomeadas: celebridades, namoro,
jogo-documentário, novela-documentário, câmeras escondidas e portáteis, reality
sitcom, business, culinária, moda, artistas de palco, orientação de especialistas,
melhoria pessoal e experimento social. O corpus foi balanceado para que cada
categoria tivesse a mesma quantidade de textos, etiquetado gramaticalmente com o
Biber Tagger e processado pelo Biber Tag Count que calcula a frequência
normalizada das 128 variáveis linguísticas consideradas no estudo. Os resultados da
Análise Multidimensional demonstram como os reality TV shows se assemelham ou
se diferenciam dos demais registros da Língua Inglesa propostos por Biber (1988) em
seu estudo seminal, tal como as várias manifestações de Reality TV se comparam
aos registros da televisão norte-americana. Uma vez que não há precedentes de
estudos, dentro da Linguística de Corpus, dedicados à investigação do perfil léxico-
gramatical dos reality TV shows em uma perspectiva multidimensional, a presente
pesquisa pretende preencher esta lacuna
|
317 |
Alineació de textos jurídics paral·lels (català-castellà): alguns problemesRibas Bruguer, Marta 24 April 2006 (has links)
El desenvolupament que han tingut recentment els programes d'alineació de corpus bilingües obre noves perspectives en l'estudi dels textos d'especialitat. La seva utilització permet contrastar i evidenciar diferències discursives entre textos especialitzats paral·lels en llengües diferents, fet que constitueix un benefici a l'hora de tractar el coneixement comparatiu entre un i altre discurs. Tanmateix, la formalització d'aquest coneixement resulta una tasca complexa i així ho demostren els casos de soroll en els resultats dels programes.Partint d'un corpus de textos jurisprudencials paral·lels catalans i castellans i utilitzant el programa ALINEA, fem un estudi descriptiu de detall sobre les diferències discursives entre els textos jurisprudencials catalans i castellans per tal de formalitzar el coneixement comparatiu del discurs jurídic (jurisprudencial) català i castellà. Establim una tipologia dels fenòmens lingüístics propis d'aquest discurs que poden generar alineacions insatisfactòries, n'estudiem les causes i fem una proposta de tractament lexicogràfic i d'estratègies complementàries (regles lingüístiques) per millorar els resultats de l'alineació d'aquest tipus de textos. / Recent development in alignment programs of bilingual corpora open horizons in studies about specialized texts. Its use let to contrast and to show discoursive differences between parallel specialized texts in different languages. This constitues a benefit in the treatment of comparative knowledge between one discourse and the other. Nevertheless, the formalization of this knowledge is a complex task and, so, the cases of noise in the results of the programs show it.Considering a corpus of Catalan and Spanish jurisprudencial parallel texts and using the ALINEA program, we present a descriptive study of detail about the discoursive differences between Catalan and Spanish jurisprudencial texts in order to formalize the comparative knowledge of Catalan and Spanish legal (jurisprundencial) discourse. We set a typology of own linguistic phenomena about this type of discourse which can generate non satisfactory alignments, we study the causes of this and we make a proposal of lexicographic treatment and of supplementary strategies (linguistic rules) in order to improve the results of the alignment of this type of texts.
|
318 |
Análise de vocábulos recorrentes e preferenciais na obra As mulheres de Tijucopapo, de Marilene Felinto, e na respectiva tradução para o inglês The women of Tijucopapo, realizada por Irene Mathews, com base em aspectos de normalização /Grigoleto, Grace Gonçalves. January 2011 (has links)
Orientador: Diva Cardoso de Camargo / Banca: Emiliana Fernandes Bonalumi / Banca: Adriane Orenha Ottaiano / Resumo: O presente trabalho tem por objetivo analisar a tradução de vocábulos considerados recorrentes e preferenciais na obra As mulheres de Tijucopapo, de Marilene Felinto, bem como observar possíveis tendências de normalização por parte da tradutora Irene Matthews na tradução para o inglês: The women of Tijucopapo. Esta pesquisa é parte de um projeto maior, o PETra - Padrões de Estilo de Tradutores, coordenado pela Profa. Dra. Diva Cardoso de Camargo. A metodologia situa-se no campo dos estudos da tradução baseados em corpus (proposta de Baker, 1993, 1995, 1996, 2000, 2004; estudos sobre normalização de Scott, 1998; e pesquisas de Camargo, 2005, 2007), e no da linguística de corpus (estudos de Berber Sardinha, 2003, 2004); também se apoia na fortuna crítica da autora (trabalhos de Araújo, 2006; Bailey, 2010; Fiorucci, 2009; Gonçalves, 2001; Jacomel, 2008; Santos, 2005; Schmidt, 2009; Vieira, 2001; Wanderley, 2009 e Xavier, 2003). A pesquisa foi realizada por meio de uma combinação de análises semimanuais e de análises computadorizadas. Inicialmente, utilizamos o programa WordSmith Tools para obter a frequência das palavras na obra de Felinto. Em seguida, utilizamos a ferramenta KeyWords para identificar quais seriam as palavras-chave presentes no romance. Após esse levantamento, recorremos à fortuna crítica de Felinto e definimos cinco vocábulos considerados preferenciais da autora:"homem", "mulheres", "chuva", "amor" e "égua". Com base em Scott (1998), examinamos a tradução dos cinco vocábulos em relação a nove características de normalização. Os resultados encontrados nesta pesquisa mostram que a tradutora Irene Matthews tende a usar estratégias que podem ser identificadas como características de normalização / Abstract: This thesis aims at analyzing the translation of words considered recurring and preferred in the novel As mulheres de Tijucopapo, by Marilene Felinto, as well as observing possible tendencies of normalization by the translator Irene Matthews in the translation to English: The women of Tijucopapo. This research is part of a bigger project, the PETra (Padrões de Estilo de Tradutores), coordinated by Doc. Diva Cardoso de Camargo. The methodology employed is that of corpus-based translation studies (proposed by Baker, 1993, 1995, 1996, 2000, 2004; Scott's study concerning normalization, 1998; and Camargo's research studies, 2005, 2007), and that of corpus linguistics (Berber Sardinha's study, 2003, 2004). We also base our study on Felinto's critical heritage (studies by Araújo, 2006; Bailey, 2010; Fiorucci, 2009; Gonçalves, 2001; Jacomel, 2008; Santos, 2005; Schmidt, 2009; Vieira, 2001; Wanderley, 2009, and Xavier, 2003). The research was carried out by means of a combination of semi- manual and computerized analyses. Initially, we used the computer software WordSmith Tools to obtain the frequency of the words in Felinto's book. Then, we went on to use the tool KeyWords to identify which would be the keywords in the author's novel. After collecting these data, we used Felinto's critical heritage in order to select five words that could be considered as recurring and preferred in Felinto's writing: 'homem' ('man‟), 'mulheres' ('women)', 'chuva' ('rain'), 'amor' ('love') and 'égua' ('mare'). Based on Scott (1998), we analyzed the translation of the five selected words in relation to nine normalization features. The results obtained in this study show that the translator Irene Matthews tends to use strategies that may be identified as features of normalization / Mestre
|
319 |
Estudo em corpora de traduções e três glossários bilíngues nas subáreas de anestesiologia, cardiologia e ortopediaPaiva, Paula Tavares Pinto [UNESP] 06 February 2006 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:49Z (GMT). No. of bitstreams: 0
Previous issue date: 2006-02-06Bitstream added on 2014-06-13T18:55:14Z : No. of bitstreams: 1
paiva_ptp_me_sjrp.pdf: 1956034 bytes, checksum: 439ede6ac47e2ddd1cddf5dc9c2cf089 (MD5) / Este estudo examinou traduções de termos médicos de maior freqüência em três subáreas médicas: anestesiologia, cardiologia e ortopedia, bem como observou traços de simplificação e de explicitação apresentados pelos tradutores de cada subárea. Para tanto, fundamentamo-nos, principalmente, nos Estudos da Tradução Baseados em Corpus (Baker, 1993, 1995, 1996; Camargo, 2004, 2005), na Lingüística de Corpus (Berber Sardinha, 2000, 2004; Tognini-Bonelli, 2001) e em parte, na Terminologia (Aubert, 1996; Barros, 2004; Krieger & Finatto, 2004). Para a compilação do corpus de estudo, foram utilizados artigos científicos de revistas brasileiras bilíngües e de revistas estrangeiras de renome na comunidade médica das respectivas subáreas. A pesquisa conta com o auxílio de três ferramentas: WordList, KeyWords e Concord, disponibilizadas pelo programa WordSmith Tools versão 3.0. A comparação dos termos médicos das três subáreas foi feita a partir de um corpus paralelo de textos originais e de textos traduzidos, e de dois corpora comparáveis de textos de mesma natureza originalmente escritos em português e em inglês. O levantamento de termos médicos mais freqüentes em português para cada subárea permitiu a elaboração de um glossário com os respectivos termos equivalentes em inglês, acompanhados do seu contexto em ambas as línguas. O exame de traços de simplificação e de explicitação possibilitou a identificação de estratégias por parte dos três tradutores diante de textos das respectivas subáreas médicas. / The present study aims at observing the most frequent medical terms in Portuguese and their translation into English from three medical fields, Anesthesiology, Cardiology and Orthopaedics, as well as examining aspects of simplification and explicitation shown in the respective translator's texts from each medical area. The methodology adopted is that of Corpus-based Translation Studies (Baker 1993, 1995, 1996; Camargo, 2004, 2005), Corpus Linguistics (Berber Sardinha, 2000, 2004; Tognini-Bonelli, 2001); and Terminology (Aubert, 1996; Barros, 2004; Krieger & Finatto, 2004). For compiling the main corpus, we used scientific papers from bilingual Brazilian journals and foreign journals well-known in their respective medical fields. This study used three tools: WordList, KeyWords and Concord, from the software WordSmith Tools version 3.0. A comparison of medical terms was carried out based on a parallel corpus of original and translated texts, and on two comparable corpora composed by texts originally written in Portuguese and in English. After listing and analyzing the most frequent medical terms in Portuguese, we compiled a glossary with the respective equivalents in English followed by their contexts in both languages for each of the three medical areas. The observation of simplification and explicitation features revealed strategies used by the three translators when dealing with medical texts.
|
320 |
Tradução juramentada de contratos de compra e vendaRocha, Celso Fernando [UNESP] 07 February 2007 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:49Z (GMT). No. of bitstreams: 0
Previous issue date: 2007-02-07Bitstream added on 2014-06-13T18:30:39Z : No. of bitstreams: 1
rocha_cf_me_sjrp.pdf: 1043171 bytes, checksum: e0ef6e6e04aaf286f740c8e29c6b570b (MD5) / Com a presente dissertação, estudamos características da tradução juramentada na direção inglês.português, no que concerne a semelhanças e diferenças no uso de termos simples, expressões fixas e semifixas mais freqüentes encontrados em contratos de compra e venda. A pesquisa situa-se no campo dos Estudos da Tradução Baseados em Corpus e no da Lingüística de Corpus; ainda recorre, em parte, ao arcabouço teórico-metodológico da Terminologia. O corpus de estudo de textos traduzidos no modo juramentado contém: 34 contratos de compra traduzidos por dois tradutores; compilamos, também, um corpus comparável de textos originalmente escritos em inglês e português, referentes a contratos de compra e venda. A pesquisa conta com o auxilio do programa de computador WordSmith Tools versão 4.0 para o levantamento dos dados, tendo sido utilizadas as ferramentas WordList, KeyWord e Concord. A partir dos dados gerados, criamos um glossário de termos simples, e de expressões fixas e semifixas mais freqüentes, presentes no corpus de estudo. Os termos simples levantados constam de dicionários; no entanto, não se encontra registrada, na maioria da obras, qualquer referência quanto ao uso. Por sua vez, a maior parte das expressões fixas e semifixas não se encontram nos dicionários. Com a utilização do corpus comparável, foi possível localizar aproximadamente 70% dessas expressões fixas e semifixas. Além do levantamento léxico, a descrição de características da tradução juramentada, de seus aspectos legais, e da forma de apresentação do texto podem ser de grande utilidade para o tradutor aprendiz. Pode-se perceber o emprego de traduções literais, o que permitiria inferir o uso de uma linguagem mais atrelada ao original, de inserções em português de construções sintáticas, e de expressões da linguagem contratual... / The present study aims at observing features of sworn translation in the English.Portuguese direction, concerning similarities and differences in the use of the most frequent simple terms, fixed and semi-fixed expressions present in sales contracts analyzed. This study has its theoretical basis on Corpus-Based Translation Studies, on Corpus Linguistics and on some theoretical concepts in Terminology. Our corpora of study comprise 34 sales contracts, translated by two sworn translators. We also compiled two comparable corpora of sales contract: one originally written in Portuguese and another in English. We used three tools of the software WordSmith Tool 4.0 in order to extract data: WordList, KeyWord and Concord. Based on the lexicon found in sales contracts corpora, we built a glossary of simple terms, fixed and semi-fixed expressions. Although the simple terms were present in the dictionaries of our support corpus, there is no information concerning their use. Regarding fixed and semifixed expressions most of them were not found in these dictionaries. The Portuguese comparable corpus showed approximately 70% of fixed and semi-fixed expressions. Also, descriptions about features of sworn translation, its legal aspects, and the text layout can be useful to the learner translator. The occurrence of literal translation, reveals a tendency to use a language closer to the style of sales contracts originally written in English. In addition, we observed a tendency to translate errors in clause numbers as well as imprecise adjectives and adverbs. Another important feature observed is the use of less lexical variation, which is confirmed by the standardized type/token ratio difference (2,29) in relation to the comparable corpus in Portuguese. This result also indicates that in the sworn translations studied, there is a tendency to use more repetition of words than in the analyzed sales contracts originally written in Portuguese.
|
Page generated in 0.0383 seconds