Automatic Assessment of L2 Spoken EnglishBannò, Stefano 18 May 2023 (has links)
In an increasingly interconnected world where English has become the lingua franca of business, culture, entertainment, and academia, learners of English as a second language (L2) have been steadily growing. This has contributed to an increasing demand for automatic spoken language assessment systems for formal settings and practice situations in Computer-Assisted Language Learning. One common misunderstanding about automated assessment is the assumption that machines should replicate the human process of assessment. Instead, computers are programmed to identify, extract, and quantify features in learners' productions, which are subsequently combined and weighted in a multidimensional space to predict a proficiency level or grade. In this regard, transferring human assessment knowledge and skills into an automatic system is a challenging task since this operation should take into account the complexity and the specificities of the proficiency construct. This PhD thesis presents research conducted on methods and techniques for the automatic assessment and feedback of L2 spoken English, mainly focusing on the application of deep learning approaches. In addition to overall proficiency grades, the main forms of feedback explored in this thesis are feedback on grammatical accuracy and assessment related to particular aspects of proficiency (e.g., grammar, pronunciation, rhythm, fluency, etc.). The first study explores the use of written data and the impact of features extracted through grammatical error detection on proficiency assessment, while the second illustrates a pipeline which starts from disfluency detection and removal, passes through grammatical error correction, and ends with proficiency assessment. Grammar, as well as rhythm, pronunciation, and lexical and semantic aspects, is also considered in the third study, which investigates whether it is possible to use systems targeting specific facets of proficiency analytically when only holistic scores are available. Finally, in the last two studies, we investigate the use of self-supervised learning speech representations for both holistic and analytic proficiency assessment. While aiming at enhancing the performance of state-of-the-art automatic systems, the present work pays particular attention to the validity and interpretability of assessment both holistically and analytically and intends to pave the way to a more profound and insightful knowledge and understanding of automatic systems for speaking assessment and feedback.
Sequenze ricorrenti in un corpus di comunicazioni mediate dal computer di apprendenti di inglese / RECURRENT SEQUENCES IN A LEARNER CORPUS OF COMPUTER-MEDIATED COMMUNICATIONPAVESI, CATERINA 12 March 2013 (has links)
La tesi si colloca nell'ambito di studi sulla fraseologia nell'inglese prodotto da apprendenti. Presenta uno studio empirico delle sequenze di parole più ricorrenti in un corpus di inglese prodotto da apprendenti di livello avanzato durante chat asincrone in contesto universitario italiano. Secondo la letteratura d'area, sia nella lingua scritta che in quella parlata, le sequenze di parole degli apprendenti rivelano una scarsa attenzione alla variazione del registro a seconda del mezzo di comunicazione usato. Al fine di verificare la presenza di questa caratteristica in un tipo di comunicazione che si trova in posizione intermedia tra i due poli del continuum esistente tra parlato e scritto, la presente ricerca ha analizzato quantitativamente e qualitativamente le sequenze di parole più frequenti nel corpus di comunicazioni mediate dal computer (CMC) raccolto nell'ambito della presente ricerca. Successivamente, le sequenze più frequenti sono state confrontate con quelle estratte da due corpora di interlingua inglese prodotta da apprendenti italofoni, uno di testi scritti (ICLE, Granger et al. 2002) e uno interviste orali (LINDSEI, Gilquin et al. 2010 ). Il confronto ha rivelato che le sequenze più ripetute dagli apprendenti hanno caratteristiche distintive nei vari media e supporta solo in parte i precedenti studi in materia. Ciò è probabilmente dovuto sia alle caratteristiche di informalità e immediatezza della comunicazione mediata dal computer, che ai vantaggi motivazionali e al diverso tipo di elaborazione linguistica connaturato alla CMC. Per l'apprendente la CMC non presenta la stessa pressione comunicativa del parlato e, allo stesso tempo, egli ha la possibilità di monitorare la propria produzione in quanto distanziata da sé dal mezzo elettronico. / The present dissertation contributes to studies of phraseology in learner English. It is an analysis of recurrent sequences of words in a corpus of learner Computer-mediated Communication. English, collected by means of asynchronous chats in an Italian university context. Previous research has argued that the use of recurrent word sequences plays a major role in learner English fluency both in writing and in speech, and is one of the factors behind learner English register failures. Using a corpus-driven approach, the study analyses the most frequent word sequences extracted from the specially compiled Learner Chat Corpus (LCC). To determine the level of adaptation of learner English to different registers, data regarding 3-word sequences from LCC is compared with the Italian subcomponents of a well-known corpus of learner writing (ICLE, Granger et al. 2002) and a corpus of learner speech (LINDSEI, Gilquin et al. 2010 ). The cross-corpus comparisons provide evidence that learners employ combinations which make their English suitable to the mode they are using for communication. Quantitative and qualitative findings from the present research support only in part previous studies of learner English in terms of recurrent sequences. This is probably due both to the informality and spoken-like quality of CMC, and to its motivational advantages and processing differences connected to the fact that learners can monitor their output while communicating because learner language production is distanced by the electronic means.
CORRELAZIONI TRA SVILUPPO CONCETTUALE NELL'INFANZIA E ACQUISIZIONE DELLA PRIMA LINGUA / Relationships between conceptual development and first language acquisitionVERNICH, LUCA ANTONIO TOMMASO 23 March 2015 (has links)
L'obiettivo del presente lavoro è quello di esaminare criticamente le prospettive teoriche più note sul problema delle relazioni tra sviluppo concettuale del bambino ed acquisizione della prima lingua. Per quanto il lavoro si concentri in particolare sullo sviluppo della componente lessicale, ovvero sul legame tra concetti e apprendimento delle parole con cui gli stessi vengono codificati, verranno necessariamente trattati anche alcuni aspetti relativi alla competenza morfologica e sintattica. Dopo aver presentato sinteticamente le principali teorie proposte nell'ambito della linguistica acquisizionale e della psicologia dello sviluppo, procederemo ad una problematizzazione e discussione dei punti critici delle stesse alla luce dei risultati ottenuti in sede sperimentale negli ultimi anni. Partendo dalla consapevolezza che nell'ambito della linguistica, forse ancor più che in altre discipline, il contrasto tra impostazioni teoriche diverse si traduce spesso in discrepanze significative nell'interpretazione degli stessi dati empirici, abbiamo cercato di dare lo stesso spazio ai vari orientamenti teorici. L'obiettivo di questa tesi, infatti, non è quello di dare giudizi di merito sulla validità di una teoria in quanto tale rispetto ad un'altra, quanto di discutere in modo trasversale i nodi più problematici delle varie teorie e le implicazioni delle stesse. Questo intento è particolarmente evidente nelle conclusioni della tesi, strutturate intorno ad una serie di domande di ricerca. / This work provides a critical overview of the major theoretical perspectives on the relationships between conceptual development and first language acquisition. While our focus is on lexical development (ie. on the relation between learning a word and acquiring the relevant concept), we will also touch on some aspects which pertains more specifically to morphological and syntactical development. After briefly introducing the major theories developed in the field of first language acquisition and developmental psychology, we will discuss them in the light of experimental data collected in recent years. As the same empirical findings tend to be interpreted in completely different ways, in our work we tried to give voice to authors supporting different views. Our goal is not to assess the merits of these theores as such, but to take this comparison as an opportunity to discuss the implications and issues thereof. This will be particularly clear in the Conclusions of our work, which are structured as a series of research questions.
Bambine e ragazzi bilingui nelle classi multietniche di Torino / Il sistema scolastico a confronto con opportunità, complessità e sfide del plurilinguismoRitucci, Raffaella 24 October 2018 (has links)
L'anagrafe studenti del MIUR registra come oggi in Italia più di uno studente su dieci non è cittadino italiano, pur essendo la maggioranza di loro nata in questo paese. Numerose indagini statistiche mostrano come gli allievi "stranieri" presentino, rispetto a quelli italiani, ridotte competenze in italiano e minore successo scolastico.
Questa ricerca esplorativa svolta in alcune scuole di Torino (V elementare-III media) ha analizzato dati ottenuti tramite interviste semi-strutturate a 121 studenti e 26 genitori e 141 questionari compilati da 27 insegnanti di italiano e di lingua di famiglia. Da essa è emerso che molti studenti sono "nativi bilingui", poiché crescono usando l'italiano e un'altra lingua. Questo poliglottismo, valutato dagli intervistati assai positivamente, non si rispecchia però nella prassi scolastica: un supporto mirato in italiano e l'insegnamento della lingua di famiglia sono di regola una chimera.
All'interno del campione le più ampie competenze in italiano si trovano fra chi ha un genitore italofono e chi è arrivato in Italia in età prescolare frequentandovi la scuola materna; come constatato anche nei test INVALSI, chi è nato in Italia e vi ha frequentato l'asilo nido è leggermente svantaggiato. Rispetto alla lingua di famiglia risulta che il suo studio porta a migliori competenze in essa, senza nuocere all'italiano: anzi. Emerge quindi il ruolo significativo della lingua "altra" per un'educazione linguistica efficace.
L'invito al MIUR è quindi di integrare la propria anagrafe con dati linguistici, così da ridefinire i propri curricula secondo le Linee Guida Comunitarie, individuando procedure e risorse specifiche per le classi multilingui. Con un investimento ridotto, paragonato con il costo attuale dato da retrocessioni, ripetenze e abbandono scolastico, si riuscirebbe a sostenere il successo scolastico, le pari opportunità e il plurilinguismo, con conseguenze positive per i singoli e per l'economia nazionale. / Das Schulregister des Kultusministeriums MIUR verzeichnet, dass mehr als jede/r zehnte aller Schüler/innen in Italien keine italienische Staatsbürgerschaft hat, obwohl sie mehrheitlich dort geboren wurden. Zahlreiche Erhebungen weisen für sie im Vergleich zu den italienischen Mitschülern/innen geringere Italienischkenntnisse und weniger schulischen Erfolg auf.
Innerhalb dieser explorativen Feldforschung haben Einzelinterviews mit 121 Schülern/innen (5.-8. Klasse) in Turiner Schulen und mit 26 Eltern, sowie die Auswertung von 141 an 27 Italienisch- und Herkunftsprachlehrer/innen verteilten Fragebögen ergeben, dass viele Schüler/innen "zweisprachige Natives" sind, da sie mit Italienisch und einer anderen Sprache aufwachsen. Dieser Polyglottismus, den die Interviewten sehr positiv bewerteten, findet jedoch in der Schulpraxis keine Entsprechung: Gezielte Förderung im Italienischen und der Unterricht der Familiensprache sind meist Wunschdenken.
In der Kohorte haben die Schüler/innen mit den besten Italienischkenntnissen einen italophonen Elternteil bzw. kamen im Vorschulalter nach Italien und besuchten dort den Kindergarten. Dagegen sind, wie auch bei den INVALSI-Tests, die in Italien geborenen und die dann die Krippe besuchten, leicht benachteiligt. Was die Familiensprache angeht, verbessert ihr Erlernen die Kompetenzen darin, ohne dem Italienischen zu schaden: Im Gegenteil. Diese Ergebnisse bestätigen die wichtige Rolle der "anderen" Sprache für einen gelungen Spracherwerb.
Das MIUR sollte also sein Schulregister mit Sprachdaten ergänzen, um die Curricula im Sinn der EU-Vorgaben umzuschreiben und den sprachlich heterogenen Klassen gezielte Ressourcen und definierte Vorgehensweisen zur Verfügung zu stellen. Mit geringeren Mitteln, im Vergleich zu den jetzigen Kosten für Herunterstufung, Klassenwiederholung und Schulabbruch würde man Schulerfolg, Chancengerechtigkeit und Mehrsprachigkeit fördern, mit positiven Folgen für den Einzelnen sowie für die Volkswirtschaft. / The Italian Ministry of Education (MIUR) student register records that today in Italy more than one out of ten students is not an Italian citizen, although the majority of them were born there. Several statistical surveys indicate that "foreign" students, when compared to native students, show a poorer performance in Italian and in academic achievement.
This exploratory fieldwork carried out in schools in Turin (5th to 8th grade) analyzed data obtained through semi-structured interviews with 121 students and 26 parents as well as 141 questionnaires filled in by 27 teachers of Italian and family language. It showed that many students are "bilingual natives", as they grow up acquiring both Italian and another language; however, despite the fact that the interviewees rate polyglottism positively, schools don't usually offer targeted support in either language.
Within the cohort the broadest range of competences in Italian are found first among those with an Italian-speaking parent, then among those who arrived in Italy at pre-school age attending kindergarten there; this latter group shows higher competences than those born in Italy attending nursery there, as also in the INVALSI tests. As far as family language is concerned, data illustrate that its teaching increases its competences without affecting those in Italian: quite the opposite in fact. These results confirm the remarkable role played by the "other" language in successful language education.
MIUR is therefore called upon to include also linguistic data in its student register, so as to redefine its curricula according to EU Guidelines, and to identify specific procedures and resources for multilingual classes. This new policy would reduce the current cost of placing students in a lower grade, grade retention and drop-outs, and would promote school success, equal opportunities and multilingualism, with positive consequences both for the individuals and for the national economy.
