Made available in DSpace on 2016-04-28T18:22:57Z (GMT). No. of bitstreams: 1
Etelvo Ramos Filho.pdf: 6034350 bytes, checksum: aa0c4cb5722bdf425e95516446096188 (MD5)
Previous issue date: 2014-12-10 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This dissertation describes how a corpus of 900 research articles written in
English by researchers of 10 fields of study and nine different origins is mapped onto
the dimensions of variation proposed by Biber (1988). Its theoretical and
methodological underpinnings are provided by Corpus Linguistics and
Multidimensional Analysis. The former is an area in Applied Linguistics in which
language is seen as a probabilistic system and for whose studies computational tools and
corpora are used. The latter is a corpus based approach for the study of dimensions of
variations, which uses statistical procedures to identify relationships between linguistic
features and registers in large amounts of texts. The methodology included the
compilation of a corpus (Corpus of English Research Articles CERA), which is
composed of articles collected using the Internet, its processing and analyses based both
on origin and field. The result of the analyses for both the origin and the field shows
that the corpus is composed of articles whose features characterize them in the 5
dimensions of variation proposed by Biber (1988) as: 1) being informational, 2) being
non-narrative, 3) having explicit reference, 4) having non-explicit persuasion, and 5)
having abstract information / Fundamentada teórico e medotologicamente na Linguística de Corpus e na
Análise Multidimensional, esta tese analisa um corpus de 900 artigos de pesquisa em
língua inglesa, escritos por pesquisadores de dez áreas, provenientes de nove diferentes
origens. Para tanto, a pesquisa se apoia em uma área da Linguística Aplicada que vê a
língua como um sistema probabilístico e para cujos estudos são utilizados ferramentas
computacionais e corpora. A Análise Multidimensional é uma abordagem baseada em
corpus para o estudo de dimensões de variação que usa procedimentos estatísticos para
identificar relações entre traços linguísticos e registros em grandes quantidades de
textos. A metodologia incluiu a compilação de um corpus de estudo (Corpus of English
Research Articles CERA), composto de artigos coletados por meio da internet, que
envolveu processamento do texto e análises por origem e área de estudo. A partir do
mapeamento nas cinco dimensões de variação de Biber (1988), o resultado das análises
por origem e área mostra que o corpus é composto por artigos cujos traços os situam
nos seguintes polos: 1) produção informacional, 2) preocupação não-narrativa, 3)
referências explícitas, 4) persuasão não-explícita e 5) informação abstrata
Identifer | oai:union.ndltd.org:IBICT/oai:leto:handle/13705 |
Date | 10 December 2014 |
Creators | Ramos Filho, Etelvo |
Contributors | Sardinha, Antonio Paulo Berber |
Publisher | Pontifícia Universidade Católica de São Paulo, Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, PUC-SP, BR, Lingüística |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP, instname:Pontifícia Universidade Católica de São Paulo, instacron:PUC_SP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds