Alderson, J. C., Clapham, C. & Wall, D. 1995. Language Test Construction and Evaluation. Cambridge: Cambridge University Press. (También existe una traducción al español en la misma editorial publicada en Madrid, 1998).
Grado de validez de una prueba que se basa en recoger relatos de estudiantes/candidatos sobre su comportamiento y sus pensamientos durante el proceso de realización de un examen. Normalmente, una vez que los candidatos han respondido a una prueba, se les entrevista sobre las razones por las que dieron las respuestas que dieron. La investigación ha revelado aspectos muy interesantes referentes a la actuación en una prueba a través de estas narraciones. Por ejemplo, la introspección durante una prueba de rellenar espacios en blanco mostrará si el estudiante responde a un ítem concreto utilizando las destrezas de lectura que pretende medir el redactor de la prueba o si, por el contrario, lo que pone en práctica es algún tipo de conocimiento de la estructura gramatical de la oración en la que aparece el ítem. De igual forma, la introspección durante una tarea de lectura puede poner al descubierto puntos débiles de los ítems; por ejemplo, casos en que los candidatos a la prueba responden a un ítem de forma incorrecta aun a pesar de comprender el sentido global del texto.
Henning, G. 1987. A Guide to English Language Testing. Cambridge, Mass.: Newbury House.