Alderson, J. C., Clapham, C. & Wall, D. 1995. Language Test Construction and Evaluation. Cambridge: Cambridge University Press. (También existe una traducción al español en la misma editorial publicada en Madrid, 1998).
Grao de validez dunha proba que se basea en recoller relatos de estudantes / candidatos sobre o seu comportamento e os seus pensamentos durante o proceso de realización dun exame. Normalmente, en canto os candidatos rematan unha proba fáiselles unha entrevista sobre as razóns polas que deron as respostas que deron. A investigación amosa aspectos moi interesantes referentes á actuación nunha proba a través de estas narracións. Por exemplo, a introspección durante unha proba de encher ocos amosará se o estudante responde a unha pregunta concreta empregando as destrezas de lectura que pretende medir o redactor da proba ou se, pola contra, o que pon en práctica é algún tipo de coñecemento da estrutura gramatical da oración na que aparece o oco. De igual xeito, a introspección durante unha tarefa de lectura pode poñer ao descuberto puntos débiles das preguntas; por exemplo, casos nos que os candidatos á proba responden a unha pregunta de forma incorrecta mesmo comprendendo o sentido global do texto.
Henning, G. 1987. A Guide to English Language Testing. Cambridge, Mass.: Newbury House.