Granger, Sylviane; Gilquin, Gäetanelle & Fanny Meunier. 2015. The Cambridge Handbook of Learner Corpus Research. Cambridge: Cambridge University Press.
Banco de datos, normalmente en formato electrónico, que contiene muestras de la producción oral y/o escrita tanto de estudiantes de una lengua extranjera dada como de hablantes nativos de esa misma lengua. El fin último del análisis del corpus es la mejora de las prácticas docentes, así como de los materiales de enseñanza de la lengua extranjera en cuestión.
Se trata de un campo reciente de estudio, que tiene sus orígenes en los estudios de adquisición de una segunda lengua y en la lingüística de corpus. Mientras que muchos investigadores en adquisición de segundas lenguas estudian el proceso de aprendizaje a través de los procesos mentales del estudiante (intuiciones sobre la L2, informe verbal, procedimiento de pensamiento en voz alta), la lingüística de corpus ha propiciado el análisis cuantitativo y cualitativo de la producción lingüística de los estudiantes en distintos niveles de análisis (fonológico, gramatical, léxico, discursivo, pragmático, etc.).
En el diseño de un corpus de producción de estudiantes se siguen una serie de variables que tienen que ver con:
- la lengua representada en el corpus: medio (hablado, escrito), género textual, tema, tipo de tarea, etc.; y
- el estudiante: edad, sexo, lengua materna (L1), conocimientos de otras lenguas, nivel de partida en la L2, tiempo de estancia previa en el país de la L2, etc.
Los datos proporcionados por estos medios se transcriben ortográficamente, se informatizan y se etiquetan con distintos tipos de información lingüística (morfológica, sintáctica, prosódica, etc.), para luego poder ser tratados por programas informáticos que elaboran índices, concordancias, etc.
El corpus de estudiantes facilita tipos de investigación como los siguientes:
- Comparar de forma cuantitativa y cualitativa los rasgos propios de la interlengua de los estudiantes de L2 con el uso que hacen de la lengua los hablantes nativos. Dicha comparación pondrá de relieve los errores en la producción de los estudiantes, así como diferencias en la frecuencia de uso de elementos léxicos, gramaticales y discursivos, y que tienen que ver con su uso excesivo o bien con su infrautilización por parte de los estudiantes.
- Comparar el estado que presenta la interlengua de estudiantes con una misma L1 pero diferentes en cuanto a edad, sexo, nivel lingüístico de partida, etc.
- Comparar el estado que presenta la interlengua de estudiantes que parten de una L1 diferente. En este caso se trata de descubrir si el comportamiento lingüístico de un estudiante se ve influido por la L1 de partida (transferencia negativa) o bien es un rasgo universal que no depende de la L1 en sí.
- Estudiar de forma longitudinal las distintas etapas por las que pasa la interlengua de un mismo estudiante a lo largo del tiempo, lo que se verá reflejado en los datos de dos muestras comparables recogidas en momentos diferentes.
Entre los corpus de estudiantes de lenguas ya confeccionados y de mayor importancia podemos señalar los siguientes: ICLE (International Corpus of Learner English), CLC (Cambridge Learner Corpus), LLC (Longman Learner Corpus), PELCRA (Polish-English Language Corpus Research and Applications), USE (Uppsala Student English Project), y CBACLE (Corpus-Based Analysis of Chinese Learner English Corpus).
Guilquin, G. & Granger, S. 2015. "Learner language", in Biber, D. & Reppen, R. (eds.). The Cambridge Handbook of English Corpus Linguistics. Cambridge: Cambridge University Press, pp. 418-436.
Mackey, A. & Gass, S. M. 2012. Research Methods in Second Language Acquisition: A Practical Guide. Chichester: John Wiley & Sons, Ltd.
Palacios Martínez, I. M. 2005. “Las nuevas tecnologías y la investigación en el campo de la adquisición de segundas lenguas”, en Cal Varela, M., Núñez Pertejo, P. & Palacios Martínez, I. (eds). 2005. Nuevas Tecnologías en Lingüística, Traducción y Enseñanza de lenguas. Santiago de Compostela: Universidad de Santiago de Compostela, pp. 205-225.