Granger, Sylviane; Gilquin, Gäetanelle & Fanny Meunier. 2015. The Cambridge Handbook of Learner Corpus Research. Cambridge: Cambridge University Press.
Banco de datos, normalmente en formato electrónico, que contén mostras da produción oral e/ou escrita tanto de estudantes dunha lingua estranxeira dada como de falantes nativos desa mesma lingua. O fin último da análise do corpus é a mellora das prácticas docentes, así como dos materiais de ensino da lingua estranxeira en cuestión.
Trátase dun campo recente de estudo, que ten as súas orixes nos estudos de adquisición dunha segunda lingua e na lingüística de corpus. Mentres que moitos investigadores en adquisición de segundas linguas estudan o proceso de aprendizaxe a través dos procesos mentais do estudante (intuicións sobre a L2, informe verbal, procedemento de pensamento en voz alta), a lingüística de corpus propiciou a análise cuantitativa e cualitativa da produción lingüística dos estudantes en distintos niveis de análises (fonolóxico, gramatical, léxico, discursivo, pragmático, etc.).
No deseño dun corpus de produción de estudantes séguense unha serie de variables que teñen que ver con: a) a lingua representada no corpus: medio (falado, escrito), xénero textual, tema, tipo de tarefa, etc.; e b) o estudante: idade, sexo, lingua materna (L1), coñecementos doutras linguas, nivel de partida na L2, tempo de estadía previa no país da L2, etc.
Os datos proporcionados por estes medios transcríbense ortograficamente, informatízanse e etiquétanse con distintos tipos de información lingüística (morfolóxica, sintáctica, prosódica, etc.), para poder ser despois tratados por programas informáticos que elaboran índices, concordancias, etc.
O corpus de estudantes facilita tipos de investigación como os seguintes:
- Comparar de forma cuantitativa e cualitativa os trazos propios da interlinguaxe dos estudantes de L2 co uso que fan da lingua os falantes nativos. A devandita comparación porá de relevo os erros na produción dos estudantes, así como as diferenzas na frecuencia de uso de elementos léxicos, gramaticais e discursivos, e que teñen que ver co seu uso excesivo ou ben co seu infrautilización por parte dos estudantes.
- Comparar o estado que presenta a interlinguaxe de estudantes cunha mesma L1 pero diferentes en canto a idade, sexo, nivel lingüístico de partida, etc.
- Comparar o estado que presenta a interlinguaxe de estudantes que parten dunha L1 diferente. Neste caso trátase de descubrir se o comportamento lingüístico dun estudante se ve influído pola L1 de partida (transferencia negativa) ou ben é un trazo universal que non depende da L1 en si.
- Estudar de forma lonxitudinal as distintas etapas polas que pasa a interlinguaxe dun mesmo estudante ao longo do tempo, o que se verá reflectido nos datos de dúas mostras comparables recollidas en momentos diferentes.
Entre os corpus de estudantes de linguas xa confeccionados e de maior importancia podemos sinalar os seguintes: ICLE (International Corpus of Learner English), CLC (Cambridge Learner Corpus), LLC (Longman Learner Corpus), PELCRA (Polish-English Language Corpus Research and Applications), USE (Uppsala Student English Project), e CBACLE (Corpus-Based Analysis of Chinese Learner English Corpus).
Guilquin, G. & Granger, S. 2015. "Learner language", in Biber, D. & Reppen, R. (eds.). The Cambridge Handbook of English Corpus Linguistics. Cambridge: Cambridge University Press, pp. 418-436.
Palacios Martínez, I. M. 2005. “Las nuevas tecnologías y la investigación en el campo de la adquisición de segundas lenguas”, en Cal Varela, M., Núñez Pertejo, P. & Palacios Martínez, I. (eds). 2005. Nuevas Tecnologías en Lingüística, Traducción y Enseñanza de lenguas. Santiago de Compostela: Universidad de Santiago de Compostela, pp. 205-225.