Return to search

Os lexical bundles na busca por semelhanças em um documento do setor farmacêutico / Lexical bundles searching similarities in a document of pharmaceutical sector

Made available in DSpace on 2016-04-28T18:24:09Z (GMT). No. of bitstreams: 1
Luciene Novais Mazza.pdf: 2077236 bytes, checksum: ab60b489f57494f9b4bd86ae30c618c1 (MD5)
Previous issue date: 2009-07-29 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / The present study explored a specific document of the pharmaceutical segment called Site Master File through the investigation of words combinations defined as lexical bundles (Biber et al.,1999). The aim of the study was to draw out the bundles so that to verify the degree of conformity of the linguistic features the use of lexical bundles may achieve, as being part of a document organized in a similar way, produced by different authors at different locations around the world. The theoretical-methodological approach was developed on the principles of Corpus Linguistics (Stubbs, 1996; Scott and Tribble, 2006; Berber Sardinha and Barbara, 2008; amongst others), an approach that makes use of a vast variety of authentic texts of language in use supported by computational tools. We compiled for this study fifteen samples of the Site Master File document stored in machine-readable form that belong to the same multinational pharmaceutical company based in Europe, which has more than a hundred of plants situated across the world. The Site Master File is a document prepared by pharmaceutical manufacturers that contains specific information about the quality assurance, the production and quality control of pharmaceutical manufacturing operations carried out at a named site/plant in order to be submitted to a regulatory authority. In addition, all documents must be officially certified in English. The analysis of the corpus data was performed to extract three-word bundles by using scripting languages such as Perl and Cygwin. Besides, a computer application was also designed to provide the cross-reference of data. The results of data analysis showed that although the samples of Site Master File bring a large range of similarity in its organization, we have not found regularity on the use of recurrent lexical bundles across the Site Master File documents. Thus, considering the absences of common lexical bundles across documents, we observed that, in each operating area of the pharmaceutical business unit there are some typical characteristics in relation to the type of product manufactured in the site, the processes engaged in the unit pharmaceutical operations as well as the geographic nearness relationships to the linguistic choices made by the different authors. Therefore, this study offers a contribution to the knowledge of variation in English use in preparing the Site Master File by authors allocated in a specific site. Moreover, the present study involves further research into the field of English for Specific Purposes based on corpora and into the studies of terminology / O objetivo deste trabalho foi examinar o documento Site Master File do setor farmacêutico a partir da investigação de uma combinação de palavras denominada lexical bundles (Biber et al. 1999) com o propósito de verificar o grau de conformidade com elementos lingüísticos que um documento com a mesma organização estrutural, escrita por diferentes autores em diferentes partes do mundo pode atingir. A presente pesquisa teve como principal suporte teórico e metodológico a Lingüística de Corpus (Stubbs, 1996; Scott e Tribble, 2006; Berber Sardinha e Barbara, 2008; entre outros), uma abordagem que permite investigar como a língua ocorre naturalmente no discurso por meio de ferramentas computacionais. Para esta investigação foram compilados quinze exemplares do documento Site Master File pertencente a um mesmo grupo farmacêutico multinacional com sede na Europa e com unidades de negócios espalhadas em mais de 100 países. O documento Site Master File é um conjunto de textos produzidos pelas indústrias farmacêuticas para atender as exigências de garantia e controle da qualidade dos medicamentos, a fim de se obter certificação internacional junto aos órgãos de vigilância sanitária. Ademais, todos os documentos devem ser oficialmente produzidos em língua inglesa. Para a análise dos dados foram utilizadas as linguagens de programação Perl e Cygwin, como também foi desenvolvido um aplicativo para gerar a extração dos lexical bundles de três palavras. Os resultados da análise dos dados indicaram, que embora o documento Site Master File apresente semelhanças em sua organização, não há uma regularidade de lexical bundles recorrentes entre as amostras dos quinze exemplares. Assim, dessa ausência de bundles semelhantes, foi possível observar traços característicos do tipo de negócio que cada unidade da empresa está envolvida, dos processos e produtos fabricados e, ainda, a relação da proximidade geográfica com as escolhas lingüísticas feitas pelos autores. Portanto, este estudo além de contribuir para o conhecimento das variações de uso da língua inglesa por autores de diferentes localidades na elaboração do documento Site Master File, também implica em futuras pesquisas no ensino de línguas para fins específicos baseado em corpora e nos estudos sobre terminologia

Identiferoai:union.ndltd.org:IBICT/oai:leto:handle/14101
Date29 July 2009
CreatorsMazza, Luciene Novais
ContributorsRamos, Rosinda de Castro Guerra
PublisherPontifícia Universidade Católica de São Paulo, Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, PUC-SP, BR, Lingüística
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_SP, instname:Pontifícia Universidade Católica de São Paulo, instacron:PUC_SP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0037 seconds