Plan Curricular del Instituto Cervantes (PCIC) es la versión española del Marco Común Europeo de Referencia para las lenguas (MCER). La meta con el estudio es investigar como son los niveles A1-C2 del PCIC desde una vista de la frecuencia de las palabras. Seleccionamos de distintos campos semánticos 318 palabras de 53 subgrupos y de los seis niveles A1-C2, para tener una amplia y fiable selección de datos. A continuación, para encontrar la frecuencia de las palabras se usa CORPES XXI, la versión 0.93 de 2021. En los resultados existe una grande superposición y desviación, y no hay límites claros que difieren los niveles A1-C2 entre sí. A pesar de esto, se puede concluir en general que una palabra del nivel A1 tiene una frecuencia más alta que una palabra de A2, que en su turno tiene más alta frecuencia que la de B1, y así sucesivamente, un descenso de frecuencia. Hemos visto un patrón general, de las medidas de tendencia central, que sirve como idea básica para calcular y concluir lo siguiente sobre las 318 palabras de este estudio: 74% de las palabras A1-A2 caben dentro de las 3 mil más frecuentes palabras. 81% de las palabras B1-B2 caben dentro de las 10 mil más frecuentes palabras, mientras 75% de las palabras C1-C2 caben dentro de las 17 mil más frecuentes palabras. En total, más de 90% de todas las palabras en el estudio caben dentro de las 20 mil palabras más frecuentes. Esta cantidad, 20 mil, sería a su vez una aproximación al vocabulario que pertenece al aprendiente de segunda lengua. / Plan Curricular del Instituto Cervantes (PCIC) is the Spanish version of the Common European Framework of Reference for Languages (CEFR). The purpose of this study is to observe the A1-C2 levels of PCIC regarding the frequency of words. In PCIC, 318 words were selected from different semantic fields in 53 subgroups and the six levels A1-C2 to give a wide and reliable selection of data. Then, to find the frequency of the words, they were compared with CORPES XXI, version 0.93 from 2021. The results show that there are no clear boundaries that separate the different levels A1-C2 from each other, they overlap, and there are large deviations and variations. Nevertheless, one can generally conclude that a word at A1 level has a higher frequency than a word in A2, which in turn has a higher frequency than in B1, and so on, a decrease in frequency. Using measures of central tendency, it was possible to distinguish a general pattern and calculate the following about the 318 words in this study: 74% of the A1-A2 words fit within the 3,000 most frequent words. 81% of the B1-B2 words fit within the 10,000 most frequent words, while 75% of the C1-C2 words fit within the 17,000 most frequent words. In total, over 90% of all words in the study fit within the 20,000 most frequent words. This number, 20,000, is possibly something close to the vocabulary that could be attributed to the second language learner.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-458837 |
Date | January 2021 |
Creators | Haraldson, Jakob |
Publisher | Uppsala universitet, Institutionen för moderna språk |
Source Sets | DiVA Archive at Upsalla University |
Language | Spanish |
Detected Language | Spanish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0027 seconds