Alderson, J. C., Clapham, C. & Wall, D. 1995. Language Test Construction and Evaluation. Cambridge: Cambridge University Press. (También existe una traducción al español en la misma editorial publicada en Madrid, 1998).
Grado en el que un examen parece medir lo que se supone debe medir, basándose en una opinión intuitiva de personas que carecen de conocimientos sobre evaluación y que ni siquiera han participado en su elaboración: los administradores de la prueba, las personas que investigan los resultados de la misma o los propios estudiantes. Es por ello que los resultados no pueden determinarse empíricamente. Sin embargo, desde la aparición de la evaluación de la lengua como comunicación, algunos expertos propugnan que un examen comunicativo de idiomas ha de parecerse a lo que se hace en el mundo real de la lengua.
Heaton, J. B. 1975. Writing English Language Tests. London: Longman.
Hughes, A. 1989. Testing for Language Teachers. Cambridge: Cambridge University Press.