Boulton, A. 2011. "Data-driven learning: The perpetual enigma", in Goźdź-Roszkowski, S. (ed.). Explorations across Languages and Corpora. Frankfurt: Peter Lang, pp. 563-580.
En la enseñanza de lenguas, el aprendizaje basado en datos se refiere a un tipo de actividades en las que los discentes exploran un conjunto de ejemplos de lengua auténticos con el propósito de responder a alguna cuestión lingüística por sus propios medios. Son tareas que suelen implicar el empleo de herramientas propias de la lingüística de corpus o sus productos más característicos, tales como, por ejemplo, líneas de concordancia (listas de ejemplos de una palabra o una expresión determinada junto con una porción del contexto en el que aparecen) o combinaciones frecuentes de palabras (colocaciones). Otra alternativa es emplear materiales generados con estas herramientas, adaptándolos a los objetivos y necesidades de un grupo de estudiantes concreto.
Se trata, por tanto, de un método pedagógico de carácter constructivista, en el que el aprendiente toma la iniciativa y, a través del diálogo colaborativo con sus compañeros y el profesor en torno a los datos observados, llega por procedimientos esencialmente inductivos a comprender reglas gramaticales e identificar pautas de uso lingüístico comunes.
La exposición intensiva a múltiples ejemplos de uso que no han sido simplificados o modificados con fines pedagógicos favorece la familiarización del aprendiente con la lengua auténtica que conserva intacta la variabilidad propia de situaciones comunicativas reales. El énfasis en el proceso de investigación y descubrimiento mejora la capacidad de observación y análisis, contribuye a desarrollar la autonomía, estimula la curiosidad e incrementa la motivación al aprendizaje.
En la actualidad, los recursos necesarios para implementar este tipo de actividades en el aula suelen estar disponibles libremente en la red. Son cada vez más las lenguas que cuentan con grandes corpus accesibles a través de interfaces de fácil manejo y, en todo caso, el desarrollo de internet y la mejora permanente de las tecnologías de la información y la comunicación hacen hoy posible la compilación de corpus ad hoc y su exploración por medio de herramientas básicas como, por ejemplo, AntConc (disponible gratuitamente desde el sitio web de su propio creador, Laurence Anthony: https://www.laurenceanthony.net/software/antconc/).
Flowerdew, L. 2015. "Data-driven learning and language learning theories: Whither the twain shall meet", in Leńko-Szymańska, A. & Boulton, A. (eds.). Multiple affordances of language corpora for data-driven learning. Amsterdam/Philadelphia: John Benjamins, pp. 15-36.
Johns, T. F. 2002. "Data-driven learning: The perpetual challenge", in Kettermann, B. & Marko, G. (eds.). Teaching and learning by doing corpus analysis: Proceedings of the Fourth International Conference on Teaching and Language Corpora, Graz 19-24 July, 2000. Amsterdam ; New York: Rodopi, pp. 107-117.
Tribble, C. 2015. "Teaching and language corpora: Perspectives from a personal journey", in Leńko-Szymańska, A. & Boulton, A. (eds.). Multiple affordances of language corpora for data-driven learning. Amsterdam/Philadelphia: John Benjamins, pp. 37-62.