• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 6
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 18
  • 18
  • 10
  • 7
  • 7
  • 6
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

A incidência do princípio idiomático e do princípio da escolha aberta na produção escrita de alunos brasileiros de inglês como língua estrangeira

Gil, Cristina Borges 16 March 2017 (has links)
Submitted by Filipe dos Santos (fsantos@pucsp.br) on 2017-03-23T13:09:34Z No. of bitstreams: 1 Cristina Borges Gil.pdf: 4736864 bytes, checksum: cc77f5e1e500d6c09793301a52d46456 (MD5) / Made available in DSpace on 2017-03-23T13:09:34Z (GMT). No. of bitstreams: 1 Cristina Borges Gil.pdf: 4736864 bytes, checksum: cc77f5e1e500d6c09793301a52d46456 (MD5) Previous issue date: 2017-03-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The aim of this research is to find evidence of both the idiom principle and the open-choice principle in the written production of Brazilian students of English as a foreign language. The theoretical basis of this study is Corpus Linguistics, an area which supports the research and the study of language in use, and which is based on the view of language as a probabilistic system. Sinclair (1991, 2004) sees language as a probabilistic system with two complementary principles: the idiom principle and the open-choice principle. The idiom principle has to do with the use of sequence of words which are at least partly prefabricated and that are appropriate in a given context. The open-choice principle is a way of seeing the language in which the only restriction to lexical choices is grammaticalness. The methodology consisted of the collection of a written corpus of Brazilian students of English as a foreign language and the subsequent analysis of all the sequences of words used in each text of the corpus. This procedure, known as ‘collocation tracking’, was introduced by Berber Sardinha (2014a). The findings point out that the two principles coexist in the texts as proposed by Sinclair. In addition, they also reveal nuances in the principles described by him in the written production of the learners. We called them idiom principle I and II, and open-choice principle I and II. The study presented here intended to have made an original contribution to Corpus Linguistics and to the study of Learner Corpora as it carried out a descriptive investigation of learner language and observed variant forms of the principles which are not found in texts written by educated native speakers / Esta pesquisa tem como objetivo principal detectar indícios do princípio idiomático e do princípio da escolha aberta na produção escrita de alunos brasileiros em inglês como língua estrangeira. A base teórica desta investigação é a Linguística de Corpus, uma área que proporciona a pesquisa, o estudo e a exploração da língua em uso e que se baseia na visão probabilística da linguagem. Sinclair (1991, 2004) considera a linguagem como sistema probabilístico a partir de dois princípios complementares: o idiomático e o da escolha aberta. O princípio idiomático diz respeito ao uso de sequências de palavras que são, pelo menos em parte, pré-fabricadas e adequadas para o contexto no qual se inserem. Já o princípio da escolha aberta diz respeito ao uso de sequências de palavras que seguem o modelo abertura-e-enchimento, combinadas a partir de regras gramaticais. A metodologia consistiu da coleta de um corpus de escrita de aprendizes brasileiros de inglês e do subsequente exame de todas as sequências de palavras de cada um dos textos do corpus, comparando-as com um corpus de referência representativo da língua em questão, o inglês. Esse procedimento, conhecido por rastreamento de colocações, foi introduzido por Berber Sardinha (2014a). A análise dos resultados indicou que os dois princípios coexistem nos textos analisados, como aventado por Sinclair (1991). Além disso, também revelou que há nas redações dos aprendizes nuances nos dois princípios propostos por Sinclair (1991), que denominamos princípio idiomático tipo I e II, e princípio da escolha aberta tipo I e II. A pesquisa pretende dar uma contribuição original à Linguística de Corpus, assim como à Linguística de Corpus de Aprendiz, à medida que foi realizada uma investigação descritiva da linguagem do aprendiz baseada em corpora e observado variantes dos princípios nos textos dos aprendizes que não se encontram em textos de falantes nativos letrados da língua
12

Escrita científica em português por hispano falantes: recursos linguísticos-computacionais baseados em métodos de alinhamento de textos paralelos / Scientific writing in portuguese by hispanic speaking: linguistic-computational resources based on alignments methods of parallel text

Torres, Lianet Sepúlveda 24 September 2015 (has links)
O número de estrangeiros interessados em aprender o português tem aumentado na última década, em consequência do crescimento da economia brasileira e do aumento da presença de multinacionais no Brasil. Esse fato se mostra pelo aumento do número de inscritos no exame de proficiência de português CELPE-Bras e de estudantes estrangeiros que ingressam nas universidades brasileiras. A maioria destes estudantes são de língua espanhola e precisam escrever seus textos acadêmicos em português. A proximidade das línguas portuguesa e espanhola apresenta-se tanto como um elemento positivo quanto como um obstáculo, pois oculta as diferenças e impede o domínio da língua portuguesa, mantendo, na fala e na escrita em português, interferências do espanhol. O maior número destas interferências acontece no nível lexical. Uma das alternativas para tratar os problemas em textos de aprendizes de uma língua é o emprego de ferramentas computacionais de pós-processamento e de suporte ao processo de escrita. No entanto, o número de recursos e ferramentas disponíveis para auxiliar a escrita de português como língua estrangeira é muito reduzido, diferentemente do cenário para a língua inglesa. Esta pesquisa propôs a criação de recursos e ferramentas de suporte à escrita no nível lexical como primeiro passo para a melhoria da qualidade linguística dos textos em português produzidos pelos nativos do espanhol. A Linguística de Córpus foi utilizada como metodologia para viabilizar a análise de erros de aprendizes. As ferramentas de auxílio utilizam léxicos bilíngues compilados por meio de técnicas de tradução, baseadas em alinhamento de córpus paralelos. Dado o número insuficiente de erros previamente anotados para suportar a detecção automática de erros, esta pesquisa propôs métodos baseados em modelo língua e na geração artificial de erros. A geração de erros artificiais se apresentou como um método eficiente para predizer erros lexicais dos aprendizes. As contribuições obtidas com a metodologia baseada em tradução automática para gerar auxílios à escrita entre línguas próximas, considerando a análise de erros lexicais extraídos de córpus de aprendizes, foco desta pesquisa, são: (i) do ponto de vista teórico, o levantamento e quantificação dos principais problemas causados pelas marcas do espanhol, deixadas nos textos acadêmicos em português escritos por nativos do espanhol; (ii) do ponto de vista de geração automática de recursos linguísticos, léxicos bilíngues de cognatos e falsos cognatos; léxico bilíngue de marcadores discursivos; léxico de expressões formulaicas que aparecem nos textos científicos e léxico bilíngue de verbos relacionados com pesquisa científica em português e, (iii) do ponto de vista da criação de subsídios para a área de auxílio à escrita científica, o projeto e avaliação de auxílios para suportar a escrita científica em português por nativos do espanhol. / In the last decade, as a result of Brazilian economic growth and the increased presence of multinationals in the country, the interest of foreigners in learning Portuguese rose. This fact is also noted by the number of students enrolled in the Portuguese proficiency exam, CELPE-Bras and the number of foreigner students entering at the Brazilian Universities. Most of these students are Spanish speakers and need to write the dissertation or thesis in Portuguese. The similarity between Portuguese and Spanish is considered as a positive element that often becomes an obstacle, because similarity and closeness frequently conceal differences and hinder learners from mastering the Portuguese, keeping interferences from their native Spanish both when speaking and writing in Portuguese. The largest number of this interference occurs at the lexical level. One alternative to deal with errors of second language learners is the use of computational post-edit tools and tools to support the writing process. However, the number of resources and tools available to help improve Portuguese writing as a foreign language is very small, unlike the scenario into English. This research proposed the creation of resources and writing support tools at the lexical level as a first step to improving the linguistic quality of the texts produced by Portuguese native Spanish. Corpus linguistics was used as a methodology to enable the learners error analysis. The writing support tools use bilingual lexicons compiled through translation techniques based on alignment parallel corpus. Given the insufficient number of errors previously annotated to support automatic error detection, this research proposed methods based on language model and artificial generation of errors. The generation of artificial errors introduced himself as an efficient method for predicting lexical errors of learners. The contributions obtained with the methodology based on automatic translation to generate written supports between similar languages, considering lexical error, extracted by the analysis of learners corpus, focus of this research are: (i) the theoretical point of view, the survey and quantification of the main problems caused by the Spanish marks, left in the academic texts written in Portuguese by native Spanish; (ii) the automatic generation of language resources point of view, bilingual lexicons of cognates and false cognates; bilingual lexicon of discourse markers; bilingual lexicon of formulaic expressions that appear in scientific texts and bilingual lexicon of verbs related to scientific research in Portuguese and, (iii) the point of view of creating subsidies for the area of support scientific writing, design and evaluation of aid to support scientific writing in Portuguese by native Spanish speakers.
13

Escrita científica em português por hispano falantes: recursos linguísticos-computacionais baseados em métodos de alinhamento de textos paralelos / Scientific writing in portuguese by hispanic speaking: linguistic-computational resources based on alignments methods of parallel text

Lianet Sepúlveda Torres 24 September 2015 (has links)
O número de estrangeiros interessados em aprender o português tem aumentado na última década, em consequência do crescimento da economia brasileira e do aumento da presença de multinacionais no Brasil. Esse fato se mostra pelo aumento do número de inscritos no exame de proficiência de português CELPE-Bras e de estudantes estrangeiros que ingressam nas universidades brasileiras. A maioria destes estudantes são de língua espanhola e precisam escrever seus textos acadêmicos em português. A proximidade das línguas portuguesa e espanhola apresenta-se tanto como um elemento positivo quanto como um obstáculo, pois oculta as diferenças e impede o domínio da língua portuguesa, mantendo, na fala e na escrita em português, interferências do espanhol. O maior número destas interferências acontece no nível lexical. Uma das alternativas para tratar os problemas em textos de aprendizes de uma língua é o emprego de ferramentas computacionais de pós-processamento e de suporte ao processo de escrita. No entanto, o número de recursos e ferramentas disponíveis para auxiliar a escrita de português como língua estrangeira é muito reduzido, diferentemente do cenário para a língua inglesa. Esta pesquisa propôs a criação de recursos e ferramentas de suporte à escrita no nível lexical como primeiro passo para a melhoria da qualidade linguística dos textos em português produzidos pelos nativos do espanhol. A Linguística de Córpus foi utilizada como metodologia para viabilizar a análise de erros de aprendizes. As ferramentas de auxílio utilizam léxicos bilíngues compilados por meio de técnicas de tradução, baseadas em alinhamento de córpus paralelos. Dado o número insuficiente de erros previamente anotados para suportar a detecção automática de erros, esta pesquisa propôs métodos baseados em modelo língua e na geração artificial de erros. A geração de erros artificiais se apresentou como um método eficiente para predizer erros lexicais dos aprendizes. As contribuições obtidas com a metodologia baseada em tradução automática para gerar auxílios à escrita entre línguas próximas, considerando a análise de erros lexicais extraídos de córpus de aprendizes, foco desta pesquisa, são: (i) do ponto de vista teórico, o levantamento e quantificação dos principais problemas causados pelas marcas do espanhol, deixadas nos textos acadêmicos em português escritos por nativos do espanhol; (ii) do ponto de vista de geração automática de recursos linguísticos, léxicos bilíngues de cognatos e falsos cognatos; léxico bilíngue de marcadores discursivos; léxico de expressões formulaicas que aparecem nos textos científicos e léxico bilíngue de verbos relacionados com pesquisa científica em português e, (iii) do ponto de vista da criação de subsídios para a área de auxílio à escrita científica, o projeto e avaliação de auxílios para suportar a escrita científica em português por nativos do espanhol. / In the last decade, as a result of Brazilian economic growth and the increased presence of multinationals in the country, the interest of foreigners in learning Portuguese rose. This fact is also noted by the number of students enrolled in the Portuguese proficiency exam, CELPE-Bras and the number of foreigner students entering at the Brazilian Universities. Most of these students are Spanish speakers and need to write the dissertation or thesis in Portuguese. The similarity between Portuguese and Spanish is considered as a positive element that often becomes an obstacle, because similarity and closeness frequently conceal differences and hinder learners from mastering the Portuguese, keeping interferences from their native Spanish both when speaking and writing in Portuguese. The largest number of this interference occurs at the lexical level. One alternative to deal with errors of second language learners is the use of computational post-edit tools and tools to support the writing process. However, the number of resources and tools available to help improve Portuguese writing as a foreign language is very small, unlike the scenario into English. This research proposed the creation of resources and writing support tools at the lexical level as a first step to improving the linguistic quality of the texts produced by Portuguese native Spanish. Corpus linguistics was used as a methodology to enable the learners error analysis. The writing support tools use bilingual lexicons compiled through translation techniques based on alignment parallel corpus. Given the insufficient number of errors previously annotated to support automatic error detection, this research proposed methods based on language model and artificial generation of errors. The generation of artificial errors introduced himself as an efficient method for predicting lexical errors of learners. The contributions obtained with the methodology based on automatic translation to generate written supports between similar languages, considering lexical error, extracted by the analysis of learners corpus, focus of this research are: (i) the theoretical point of view, the survey and quantification of the main problems caused by the Spanish marks, left in the academic texts written in Portuguese by native Spanish; (ii) the automatic generation of language resources point of view, bilingual lexicons of cognates and false cognates; bilingual lexicon of discourse markers; bilingual lexicon of formulaic expressions that appear in scientific texts and bilingual lexicon of verbs related to scientific research in Portuguese and, (iii) the point of view of creating subsidies for the area of support scientific writing, design and evaluation of aid to support scientific writing in Portuguese by native Spanish speakers.
14

Fanfictions, linguística de corpus e aprendizagem direcionada por dados : tarefas de produção escrita com foco no uso autêntico de língua e atividades que visam à autonomia dos alunos de letras em analisar preposições /

Garcia, William Danilo January 2020 (has links)
Orientador: Paula Tavares Pinto / Resumo: A relação da Linguística de Corpus com o Ensino de Línguas, apesar de receber foco mesmo antes do advento dos computadores, se intensificou por volta da década de 90, momento em que pesquisas em corpora de aprendizes e em Aprendizagem Direcionada por Dados foram enfatizadas. Considerado esse estreitamento, esta pesquisa objetiva compilar quatro corpora de aprendizes a partir do uso autêntico da língua com o intuito de desenvolver atividades didáticas direcionadas por dados dos próprios alunos que promovam nos discentes um perfil autônomo de investigação linguística (mais precisamente das preposições with, in, on, at, for e to). No tocante à fundamentação teórica, destacam-se Prabhu (1987), Skehan (1996), Willis (1996), Nunan (2004) e Ellis (2006) a respeito do Ensino de Línguas por Tarefas, Jenkins (2012) e Neves (2014) que discorrem sobre as ficções de fã. Já sobre a Linguística de Corpus, tem-se Sinclair (1991), Berber Sardinha (2000) e Viana (2011). Granger (1998, 2002, 2013) mais relacionado a Corpus de Aprendizes, e Johns (1991, 1994), Berber Sardinha (2011) e Boulton (2010) no que diz respeito à Aprendizagem Direcionada por Dados. Como metodologia, levantaram-se textos escritos pelos alunos a partir de uma tarefa de produção escrita em que eles redigiram uma ficção de fã. Em seguida, esses textos formaram dois corpora de aprendizes iniciais, que foram analisados com o auxílio da ferramenta AntConc (ANTHONY, 2018) no intuito de observar a presença ou não de inadequações ... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Although the relation between Corpus Linguistics and Language Teaching has been emphasized even before the advent of computers, it has been highlighted around the 90s. This was the moment when research on learner corpora and Data-Driven Learning was focused. Having said that, this study aimed to compile four learner corpora based on the authentic use of the language. This was done in order to develop data-driven teaching activities that could promote, among the students, an autonomous profile of linguistic investigation (more precisely about the prepositions with, in, on, at, for and to). Concerning the existing literature, we highlight the works of Prabhu (1987), Skehan (1996), Willis (1996), Nunan (2004) and Ellis (2006) about Task-Based Language Teaching, and Jenkins (2012) and Neves (2014) about fanfictions. In relation to Corpus Linguistics, this study is based on Sinclair (1991), Berber Sardinha (2000) and Viana (2011). Granger (1998, 2012, 2013) is referenced to define learner corpora, and Johns (1991, 1994), Berber Sardinha (2011) and Boulton (2010) to discuss Data-Driven Learning. The methodological approach involved the collection of the compositions from Language Teaching undergraduate students who developed a writing task in which they had to write a fanfiction. These texts composed two learner corpora, which were analyzed with the AntConc tool (ANTHONY, 2018) with the purpose of observing the occurrence of prepositions in English and whether they were accurately ... (Complete abstract click electronic access below) / Mestre
15

Prezentace číslovek ve výuce češtiny pro cizince / Presentation of Numerals in Teaching Czech as a Foreign Language

Synková, Kateřina January 2019 (has links)
This diploma thesis deals with the issues of numerals in the context of teaching Czech as a foreign language. The theoretical part describes the reasons why numerals are so problematic in the process of teaching and the common methodological recommendations for the teaching of numerals are described here as well. The goal of this thesis is to suggest the most suitable way to teach selected numerals along with the related grammatical cases. Numerals in the chosen textbooks of Czech for foreigners and the analysis of the chosen forms in the CzeSL-SGT learner corpora were analysed for this purpose. The analysis of the corpus helps to define the difficult cases in more detail. Based on the analyses, the worksheets were created for the chosen types of numerals that can be used in the teaching process. These materials also contain recommendations for working with the individual activities.
16

比較HAPPEN與其同義字: 以母語及學習者語料庫為基礎的非賓格存現動詞之研究 / Comparing unaccusative HAPPEN and its synonyms: a study of existence/appearance verbs based on native speaker and learner corpora

王亮鈞, Wang, Liang Chun Unknown Date (has links)
本研究,基於分辨非賓存現動詞及瞭解二語學習者如何讓習得此類動詞之需求,旨在分析一個高頻率之非賓格存現動詞 HAPPEN與其三個同義字(OCCUR,APPEAR,與EXIST)和中文同義字「發生」從語言使用者角度作比較。採用了母語語料庫 (英文採用英國國家語料庫 BNC;中文採用十億詞語料庫 GW 2.0)及學習者語料庫(含語言訓練與測驗中心學習者語料庫the LTTC,國際英語學習者語料庫the ICLE,及政治大學外語學習者語料庫the NCCU)作為第一部分的語料庫分析。此外,為了探索二語英文錯誤及母語中文遷移的關係,我們也進行了以語料庫為基礎的心理語言學實驗(兩個關於中英文HAPPEN句子結構的接受度判斷測驗)。 本研究結果發現,其一,就語料庫中的文法形式(Grammatical form)來分析HAPPEN、OCCUR、APPEAR與EXIST,英文母語語料庫中的高頻文法形式(例如:happened或happen)與學習者語料庫中有相同的現象。然而大部份的高頻文法形式都是二語學習者經常誤用之處,且容易與兩個常見非賓動詞錯誤—過度被動化錯誤(Overpassivization)和及物化錯誤(Transitivization)—共現(Collocated)。其二,從語料庫錯誤分析各種錯誤類型得知, HAPPEN與OCCUR較常出現過度被動化錯誤;APPEAR與 EXIST較常有及物化錯誤。此結果顯示每個非賓存現動詞可能會犯不同錯誤,也因此造成其錯誤的原因有所不同。其三,從分析心理語言實驗結果得知,我們發現母語中文文法句型(L1 Chinese grammatical patterns),例如:「V-了」-「出現了」;抑或是「V+N」-「發生車禍」、「發生戰爭」、「存在缺失」,都影響了二語學習者對英文非賓動詞之文法形式的正確判定。由此揭示了母語中文大多都對二語英文非賓動詞習得有所干擾。 基於所得結果,我們提出「完成體」(Perfectivity)及「及物性」(Transitivity)之不同來探討中英文間存現動詞用法之異同,並試著解釋造成二語非賓動詞學習複雜化的原因。 此研究克服了過去文獻中比較非賓存現動詞之困難也透過語料庫結合心理實驗研究法提供對非賓動詞習得之解釋方法。這些發現可進一步作為詮釋非賓動詞的假說,並將其應用於語言教材設計或被視為未來跨語言分析研究之基石。 / Owing to the necessity to identify unaccusative existence/appearance verbs and realize how they are acquired by L2 learners, this present thesis aims to analyze a highly frequent English unaccusative verb HAPPEN and compare it with its three other synonyms (OCCUR, APPEAR, and EXIST), as well as its Chinese counterpart發生 fāshēn ‘happen.’ Native speaker corpora (the British National Corpus (BNC) for English and Chinese Gigaword 2 Corpus (GW 2.0) for the Chinese), and L2 learner corpora (the Language Training and Testing Learner Corpus (the LTTC), International Corpus of Learner English 2.0 (the ICLE), and the National Chengchi University Foreign Language Learner Corpus (the NCCU)) are utilized to analyze the unaccusative verbs in the first main section. In addition, in order to discover the relationship between L2 English errors and L1 Chinese transfer, psycholinguistic experiments (two acceptability judgments tasks with comparable Chinese and English HAPPEN sentence constructions) based on the corpora data were conducted in this thesis. The results in this thesis showed that, first, the highly frequent grammatical forms of unaccusative verbs (e.g., happened or happen) in the English native speaker corpus share some similarities with those of L2 learner corpora. However, these grammatical forms were usually misused by L2 learners and were frequently collocated with the two common unaccusative errors (overpassivization, e.g., *What is happened? and trasitivization, e.g., *I happen a car accident.). Second, as for the distributions of unaccusative error types, HAPPEN and OCCUR were found to mainly co-occur with overpassivization errors, whereas APPEAR and EXIST were found to mainly co-occur with transitivization errors. This indicates that each unaccusative verb may have different potential for L2 unaccusative errors, and therefore the causes of these errors with different verbs may vary. Third, from the analysis of psycholinguistic experiments, we discover that the L1 Chinese grammatical patterns, such as the V-le grammatical pattern (e.g., 出現了chūxiànle ‘appear-le’) and the V+N grammatical pattern (e.g., 發生車禍fāshēngchēhuò ‘The car accident happened’, 發生戰爭 fāshēngzhànzhēng ‘The war occurred’, and存在缺失 cúnzàiquēshī ‘The pitfalls existed’) may influence L2 learners’ correct judgment as to the grammatical forms of unaccusative verbs. This reveals that generally L1 Chinese might have some interference with L2 unaccusative acquisition. Based on the results, we proposed that the perfectivity and transitivity differences between English and Chinese unaccusative existence/appearance verbs could distinguish the uses among the English HAPPEN and the Chinese發生 fāshēn ‘happen’ with their synonyms. These differences could also provide a possible reason for the cause of the problematic L2 unaccusative acquisition. This thesis overcomes the difficulties of comparing unaccusative existence/appearance verbs in the previous studies and attempts to unravel the enigma of acquiring this verb type from the integrated corpus-based and empirical findings. These findings in turn serve as the suggested assumptions to interpret unaccusative verbs, which can be applied to the design of language teaching materials or can be viewed as the basis of cross-language analysis in the future studies.
17

The Effectiveness of Corpus-Aided Instruction Using Lexical Bundles to Improve Academic Writing in Instructed Second Language Acquisition: A Multimethod Research Design

Park, Eun Jeong 27 September 2019 (has links)
No description available.
18

Sequenze ricorrenti in un corpus di comunicazioni mediate dal computer di apprendenti di inglese / RECURRENT SEQUENCES IN A LEARNER CORPUS OF COMPUTER-MEDIATED COMMUNICATION

PAVESI, CATERINA 12 March 2013 (has links)
La tesi si colloca nell'ambito di studi sulla fraseologia nell'inglese prodotto da apprendenti. Presenta uno studio empirico delle sequenze di parole più ricorrenti in un corpus di inglese prodotto da apprendenti di livello avanzato durante chat asincrone in contesto universitario italiano. Secondo la letteratura d'area, sia nella lingua scritta che in quella parlata, le sequenze di parole degli apprendenti rivelano una scarsa attenzione alla variazione del registro a seconda del mezzo di comunicazione usato. Al fine di verificare la presenza di questa caratteristica in un tipo di comunicazione che si trova in posizione intermedia tra i due poli del continuum esistente tra parlato e scritto, la presente ricerca ha analizzato quantitativamente e qualitativamente le sequenze di parole più frequenti nel corpus di comunicazioni mediate dal computer (CMC) raccolto nell'ambito della presente ricerca. Successivamente, le sequenze più frequenti sono state confrontate con quelle estratte da due corpora di interlingua inglese prodotta da apprendenti italofoni, uno di testi scritti (ICLE, Granger et al. 2002) e uno interviste orali (LINDSEI, Gilquin et al. 2010 ). Il confronto ha rivelato che le sequenze più ripetute dagli apprendenti hanno caratteristiche distintive nei vari media e supporta solo in parte i precedenti studi in materia. Ciò è probabilmente dovuto sia alle caratteristiche di informalità e immediatezza della comunicazione mediata dal computer, che ai vantaggi motivazionali e al diverso tipo di elaborazione linguistica connaturato alla CMC. Per l'apprendente la CMC non presenta la stessa pressione comunicativa del parlato e, allo stesso tempo, egli ha la possibilità di monitorare la propria produzione in quanto distanziata da sé dal mezzo elettronico. / The present dissertation contributes to studies of phraseology in learner English. It is an analysis of recurrent sequences of words in a corpus of learner Computer-mediated Communication. English, collected by means of asynchronous chats in an Italian university context. Previous research has argued that the use of recurrent word sequences plays a major role in learner English fluency both in writing and in speech, and is one of the factors behind learner English register failures. Using a corpus-driven approach, the study analyses the most frequent word sequences extracted from the specially compiled Learner Chat Corpus (LCC). To determine the level of adaptation of learner English to different registers, data regarding 3-word sequences from LCC is compared with the Italian subcomponents of a well-known corpus of learner writing (ICLE, Granger et al. 2002) and a corpus of learner speech (LINDSEI, Gilquin et al. 2010 ). The cross-corpus comparisons provide evidence that learners employ combinations which make their English suitable to the mode they are using for communication. Quantitative and qualitative findings from the present research support only in part previous studies of learner English in terms of recurrent sequences. This is probably due both to the informality and spoken-like quality of CMC, and to its motivational advantages and processing differences connected to the fact that learners can monitor their output while communicating because learner language production is distanced by the electronic means.

Page generated in 0.3074 seconds