Boulton, A. 2011. "Data-driven learning: The perpetual enigma", in Goźdź-Roszkowski, S. (ed.). Explorations across Languages and Corpora. Frankfurt: Peter Lang, pp. 563-580.
No ensino de linguas, a aprendizaxe baseada en datos se refire a un tipo de actividades nas que os discentes exploran un conxunto de exemplos de lingua auténticos co propósito de responder a algunha cuestión lingüística polos seus propios medios. Son tarefas que adoitan implicar o emprego de ferramentas propias da lingüística de corpus ou os seus produtos máis característicos, tales como, por exemplo, liñas de concordancia (listas de exemplos dunha palabra ou unha expresión determinada xunto cunha porción do contexto no que aparecen) ou combinacións frecuentes de palabras (colocacións). Outra alternativa é empregar materiais xerados con estas ferramentas, adaptándoos aos obxectivos e necesidades dun grupo de estudantes concreto.
Trátase, por tanto, dun método pedagóxico de carácter construtivista, no que o aprendente toma a iniciativa e, a través do diálogo colaborativo cos seus compañeiros e o profesor ao redor dos datos observados, chega por procedementos esencialmente indutivos a comprender regras gramaticais e identificar pautas de uso lingüístico comúns.
A exposición intensiva a múltiples exemplos de uso que non foron simplificados ou modificados con fins pedagóxicos favorece a familiarización do aprendente coa lingua auténtica que conserva intacta a variabilidade propia de situacións comunicativas reais. A énfase no proceso de investigación e descubrimento mellora a capacidade de observación e análise, contribúe a desenvolver a autonomía, estimula a curiosidade e incrementa a motivación á aprendizaxe.
Na actualidade, os recursos necesarios para implementar este tipo de actividades na aula adoitan estar dispoñibles libremente na rede. Son cada vez máis as linguas que contan con grandes corpus accesibles a través de interfaces de fácil manexo e, en todo caso, o desenvolvemento da internet e a mellora permanente das tecnoloxías da información e a comunicación fan hoxe posible a compilación de corpus ad hoc e a súa exploración por medio de ferramentas básicas como, por exemplo, AntConc (dispoñible gratuitamente desde o sitio web do seu propio creador, Laurence Anthony: https://www.laurenceanthony.net/software/antconc/).
Flowerdew, L. 2015. "Data-driven learning and language learning theories: Whither the twain shall meet", in Leńko-Szymańska, A. & Boulton, A. (eds.). Multiple affordances of language corpora for data-driven learning. Amsterdam/Philadelphia: John Benjamins, pp. 15-36.
Johns, T. F. 2002. "Data-driven learning: The perpetual challenge", in Kettermann, B. & Marko, G. (eds.). Teaching and learning by doing corpus analysis: Proceedings of the Fourth International Conference on Teaching and Language Corpora, Graz 19-24 July, 2000. Amsterdam ; New York: Rodopi, pp. 107-117.
Tribble, C. 2015. "Teaching and language corpora: Perspectives from a personal journey", in Leńko-Szymańska, A. & Boulton, A. (eds.). Multiple affordances of language corpora for data-driven learning. Amsterdam/Philadelphia: John Benjamins, pp. 37-62.