Alderson, J. C., Clapham, C. & Wall, D. 1995. Language Test Construction and Evaluation. Cambridge: Cambridge University Press. (También existe una traducción al español en la misma editorial publicada en Madrid, 1998).
En exámenes y estadística, la fiabilidad se refiere a la estabilidad de los resultados obtenidos cuando una misma prueba de evaluación es realizada por los mismos individuos en distintas ocasiones o por diferentes individuos de niveles similares. Por ejemplo, si tres grupos de estudiantes del mismo curso hacen el mismo examen y obtienen puntuaciones parecidas, ese examen será fiable. La fiabilidad se relaciona con la validez, ya que si una prueba no es fiable tampoco será válida (es decir, no cumplirá con su objetivo de medir lo que pretende medir). Las pruebas que consisten en entrevistas o composiciones escritas tienen distintos grados de validez, pero por lo general son poco fiables. La fiabilidad de una prueba puede calcularse mediante diversos procedimientos estadísticos. Normalmente se expresa en términos de correlación, por ejemplo, entre las puntuaciones obtenidas por los mismos alumnos en dos exámenes equivalentes (Fiabilidad por formas equivalentes o paralelas), o las correspondientes a las dos mitades del mismo examen. Si las dos puntuaciones son idénticas o poseen diferencias regulares y predecibles, la correlación será perfecta y la prueba tendrá un grado máximo de fiabilidad (el valor obtenido es 1,00 o próximo a 1,00); por el contrario, la ausencia de correlación será un signo de que la prueba es poco fiable. En este último caso, existen varios métodos para incrementar la fiabilidad: por ejemplo, una prueba de preguntas de elección múltiple puede hacerse más fiable si se aumenta el número de preguntas o se mejora la efectividad de las opciones de distracción, con lo que se minimiza la influencia del factor azar.
Bachman, L. F. 1990. Fundamental Considerations in Language Testing. Oxford: Oxford University Press.
Bisquerra Alzina, R. 1989. Métodos de investigación educativa. Guía práctica. Barcelona: CEAC.
Consejo de Europa. 2001. Common European Framework of Reference for Languages: Learning, Teaching, Assessment. Cambridge: Cambridge University Press. (Existe también una traducción-adaptación española del 2002 por parte del Instituto Cervantes, publicada en Madrid por el Ministerio de Educación, Cultura y Deporte, y la editorial Anaya).
Fulcher, G. 2010. Practical Language Testing. London: Hodder Education.
Lado, R. 1972. Language Testing. The Construction and Use of Foreign Language Tests. London: Longman. 7th impression.