Getting your Trinity Audio player ready... |
Dedicamos este artículo al análisis de las ventajas e inconvenientes de las rúbricas de evaluación de Lengua castellana y Literatura. Vaya por delante que nos encontramos ante herramientas con un alto impacto en los resultados de evaluaciones de todo tipo. Asimismo, sintetizamos las aportaciones de los estudios e investigaciones más recientes sobre la adecuación de estas herramientas a los principios de una evaluación objetiva y equitativa.
¿En qué consisten las rúbricas de evaluación de Lengua castellana y Literatura? ¿Cuál es el papel de los profesores?
El Diseño Curricular Base de la LOGSE (1988) otorgaba a las rúbricas la propiedad de ser instrumentos de evaluación fundamentales. Se trata de mecanismos que podemos utilizar los profesores en todos los contextos. Los criterios de valoración de las rúbricas de evaluación de Lengua castellana y Literatura son muy adecuados para medir de forma equitativa y progresiva (aquí los profesores jugamos un papel muy importante) el nivel de logro alcanzado en determinadas actividades o tareas. La evaluación competencial y de calidad reclama una correcta orientación de los aprendizajes, pero también una reordenación de las formas de aprender. Esto significa que, cuando los procedimientos son los adecuados, las rúbricas serán un instrumento apto para conseguir la pretendida calidad educativa y, sobre todo, la equidad.
Si los estudiantes no confían en los métodos de evaluación, por considerarlos sesgados y parciales, se producirá una pérdida de confianza en los mismos. Esto provoca una consiguiente caída en la percepción positiva del procedimiento. De los procesos de evaluación, por tanto, dependerá la calidad de los aprendizajes adquiridos, condicionando su nivel y profundidad.
Evaluar es un proceso en el que los profesores recogemos información, analizamos, emitimos un juicio y tomamos decisiones para atribuir un valor al mérito. Este mecanismo procesual potencia y orienta el aprendizaje a través del denominado “ feedback” . La evaluación competencial, por consiguiente, se diferencia de una calificación que, por su marcado carácter sumativo y cuantitativo, no contribuye como debería a la mejora y adquisición de aprendizajes (Calle-Álvarez, 2020; Hamodi et al. , 2015).
¿Por qué la evaluación tiene un carácter transformador?
La UNESCO (2021) considera que la evaluación es el motor del cambio de la enseñanza. Esto se debe a sus capacidades para conducir y regular un elevado número de procesos formativos de manera conjunta. Además, el claro carácter polisémico de las competencias clave, derivado de su diversidad y variedad, exige métodos de evaluación modernos. Las rúbricas de evaluación de Lengua castellana y Literatura nos permiten a los profesores y evaluadores identificar el nivel de logro alcanzado en cada una de ellas . Para evitar la ambigüedad en la enunciación de indicadores, debemos ser capaces de superar la barrera de los conocimientos. También será necesario aprovechar el impacto positivo en la consecución de nuevas habilidades y el desarrollo de estrategias orientadas a una formación competencial integral (vid. Fernández-Cruz y Gijón, 2012). Una evaluación coherente debe contribuir a las metodologías didácticas competenciales favoreciendo los tiempos y los resultados de aprendizaje.
Algunos hallazgos de una reciente investigación sobre las rúbricas
Sintetizamos a continuación los elementos del estudio realizado por los profesores Rubén Fernández Alonso, Pamela Woitschach y José Muñiz (octubre-noviembre 2019) : “Las rúbricas no neutralizan el efecto de los correctores. Una estimación con el modelo de facetas múltiples de Rasch”, Revista de Educación (389), 89-107. Este estudio, como veremos, llegó a la conclusión de que es imposible sustraerse de la variable «efecto corrector». En otras palabras, es muy difícil sortear la completa objetividad que el profesor debe tener en la aplicación de calificaciones objetivas mediante rúbricas de evaluación en la materia de Lengua castellana y Literatura.
Planteamiento de las pruebas
Este experimento se llevó a cabo con ítems de respuesta construida (rúbricas) ampliamente utilizados en evaluaciones de todo tipo.
El experimento consideró 13 tribunales con 4 miembros cada uno que rotaron entre sí, de manera que se consiguió un balanceo absoluto, rebajando el sesgo derivado de la agrupación de los correctores.
El ejercicio a evaluar consistía en leer un texto con información de tres ciudades. Los alumnos y alumnas debían seleccionar una de ellas y escribir un texto para convencer a sus compañeros y compañeras sobre la necesidad de realizar un viaje de estudios a dicha ciudad.
La rúbrica con la que se evaluó la actividad fue la siguiente:

Resultados y conclusiones del estudio
Un reto de la evaluación mediante rúbricas es el de eliminar el sesgo que se produce siempre que interviene el factor humano o criterio del profesor. Esto permitiría alcanzar un alto índice de objetividad y equidad en las calificaciones. La valoración objetiva y rigurosa de los ensayos e ítems de respuesta construida constituye un verdadero desafío.
En aras de la mejora y de la eliminación de las principales desviaciones, el estudio proponía varias actuaciones:
- El entrenamiento de los correctores en la correcta interpretación de las rúbricas de evaluación de Lengua castellana y Literatura y la puntuación numérica otorgada a cada una de ellas.
- Autores como Fernández Alonso y Muñiz (2011) establecen las ventajas e inconvenientes del uso de diseños en base al grado de completitud. Rúbricas más exhaustivas podrían eliminar posibles desviaciones, pues responden a enunciaciones de los estándares más concretas y con un menor grado de ambigüedad.
- Los problemas que pudieran producirse en la desviación de las calificaciones entre los evaluadores se deben, más que a una baja fiabilidad en la objetividad , a problemas estructurales de las rúbricas en sí. Este elemento lo encontramos, incluso, en rúbricas elaboradas por diversas administraciones públicas educativas, como la de Canarias.
- En la literatura están documentados problemas que consideran los efectos del corrector en la variación de los resultados y su variación significativa en las puntuaciones los resultados de algunos estudiantes, que pueden variar significativamente (Lunz et al., 1990; Wang y Yao, 2013).
- Se trata, en suma, de complementar un conjunto de medidas que conjuguen el entrenamiento de los estudiantes evaluados con la comprensión de la herramienta que se aplica para evaluarlos.
Algunas fuentes de error de estas rúbricas de evaluación de Lengua castellana y Literatura
Las fuentes de error están muy identificadas: el tipo de evaluador, nivel de exigencia, trayectoria académica y profesional, formación, nivel académico, entrenamiento, implicación, etc. En la materia evaluada influye su posible generalidad y subjetividad de sus conceptualizaciones y dominios de conocimiento.
El estudio juzga como importante, el denominado sesgo del factor severidad, que modula los resultados al alza o a la baja, según las restricciones correctoras.

En el gráfico I, la distribución de las calificaciones de 2 tribunales aleatorios se encuentran muy correlacionadas y próximas. Algunas de ellas llegan a coincidir. Apreciamos, por tanto, una correcta y efectiva aplicación de la herramienta.
Sin embargo, en el siguiente gráfico, las distribuciones de las calificaciones de los tribunales 6 y 12 nos indican que el sesgo de la severidad de este último tribunal ha sido más elevado.

Concluimos que, como en todo instrumento de evaluación, en las rúbricas de evaluación de Lengua castellana y Literatura es muy difícil erradicar al completo los elementos que propician algún tipo de sesgo o desviación. Este viene introducido, casi siempre, por el componente valorativo, humano, de los profesores. Como ponen de relieve las investigaciones del artículo, las rúbricas no neutralizan el efecto de los correctores. No podemos afirmar, por lo tanto, que nos encontremos ante una herramienta que nos permita medir resultados con absoluta objetividad. Sí, por el contrario, permite que nos aproximemos, en algunos casos, a la máxima objetividad, uniformidad y homogeneidad en las calificaciones. Esto invita a pensar en que los ítems de respuesta construida son una herramienta de medición objetiva en relación al conjunto de otras más subjetivas.