Made available in DSpace on 2016-04-28T18:23:33Z (GMT). No. of bitstreams: 1
Jose Lopes Moreira Filho.pdf: 2035751 bytes, checksum: cf609a94d9259efd9fa204399ba8dff0 (MD5)
Previous issue date: 2007-08-07 / Secretaria da Educação do Estado de São Paulo / The main aim of this study is the development of semi-automatic software to prepare reading
materials for English as a Second Language classes, using corpora to elaborate teaching material that explores real language.
The theoretical underpinning of the research is provided by Corpus Linguistics; a study area in
the domain of Applied Linguistics that takes an empirical approach to language and sees it as a
probabilistic system. It is based on the analysis of large amounts of real linguistic data by means of computers (Berber Sardinha, 2004).
More specifically, the corpus based research area concerned with the teaching process and foreign language learning informs this study. Some references can be found in Berber Sardinha (2004), Hunston (2002), Kennedy (1998), Johns (1991), Sinclair (1991), Flowerdew (1993), Fox (1998), Trible & Jones (1990).
In addition to Corpus Linguistics, thisinvestigation is also based on previous studies in the Teaching of Reading, such as those from (Grellet, 1981; Nuttal, 1988; Scott et al., 1984) for creating a standard activity model to develop a semi-automatic tool to prepare English reading lessons in Visual Basic 6 (VB6).
Our intention is to make an original contribution to English Language Teaching at the High School level in public schools. The goals are twofold: to develop innovative studies in this particular
subject and to provide an opportunity for the use of authentic texts and corpora in didactic activities.
Although literature in the area is extensive, there still seems to be a need for research on the
development of computational tools that will make it possible to use the same resources used in
corpora exploration for language teaching in Brazilian public schools.
Two corpora were used in the study: a reference corpus and a training corpus. The reference corpus was the British National Corpus (BNC), released in 1995 with more than 100,000,000 words. The training corpus, whose goal is to test the software functions, was collected from the Internet and has a total of 80 texts from varied genre / O trabalho teve como objetivo principal o desenvolvimento de um software para preparação
semi-automática de aulas de leitura de inglês com corpora para elaboração de materiais didáticos que
privilegiem a língua em uso.
Para tanto, o trabalho encontrou suporte teórico na Lingüística de Corpus. A Lingüística de Corpus é uma área inserida na esfera da Lingüística Aplicada, que utiliza uma abordagem empirista e vê a linguagem como sistema probabilístico com base em análises de grandes quantidades de dados lingüísticos reais, língua em uso, por meio de computador (Berber Sardinha, 2004).
Mais especificamente, o trabalho aqui apresentado fundamentou-se na área de pesquisa baseada em corpus que se preocupa com o processo de ensino e aprendizagem de línguas estrangeiras (Berber Sardinha, 2004; Hunston, 2002; Kennedy, 1998; Johns, 1991; Sinclair, 1991; Flowerdew, 1993; Fox, 1998; Trible & Jones, 1990).
Além da Lingüística de Corpus, o projeto fundamentou-se nos pressupostos teóricos e metodológicos do Ensino de Leitura (Grellet, 1981; Nuttal, 1988; Scott et al., 1984) para criação de uma atividade padrão para o desenvolvimento de uma ferramenta de preparação semi-automática de aulas de leitura de inglês.
O projeto buscou fazer uma contribuição original para o estudo do ensino de língua inglesa no Ensino Médio da escola pública, visto que não há estudos dessa natureza para o contexto educacional mencionado, e também por aproveitar textos autênticos e corpora, conjuntamente, em atividades didáticas.
Embora haja uma série de publicações e trabalhos que enfoquem a utilização dos instrumentos da Lingüística de Corpus no ensino de línguas, há uma grande necessidade de pesquisas sobre o desenvolvimento de ferramentas computacionais que possibilitem o ensino de línguas por meio de recursos usados na exploração de corpora para o contexto da escola pública brasileira.
Para a criação do software por meio de programação em linguagem Visual Basic 6 foram utilizados um corpus de treinamento composto por 80 textos de diversos gêneros, e o BNC (British National Corpus) como corpus de referência, com 4027 textos que totalizam mais de 100 milhões de palavras
Identifer | oai:union.ndltd.org:IBICT/oai:leto:handle/13908 |
Date | 07 August 2007 |
Creators | Moreira Filho, José Lopes |
Contributors | Sardinha, Antonio Paulo Berber |
Publisher | Pontifícia Universidade Católica de São Paulo, Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, PUC-SP, BR, Lingüística |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP, instname:Pontifícia Universidade Católica de São Paulo, instacron:PUC_SP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0016 seconds