Saltar al contenido

Qué son las rúbricas de evaluación y cuáles son sus ventajas e inconvenientes

    Dedicamos este artículo al análisis de las ventajas e inconvenientes de las rúbricas de evaluación, por tratarse de herramientas con un alto impacto en los resultados de evaluaciones de todo tipo. Asimismo, sintetizamos las aportaciones de los estudios e investigaciones más recientes sobre la adecuación de esta herramienta a los principios de una evaluación objetiva y equitativa.

    ¿Cómo se realiza la evaluación competencial mediante rúbricas de evaluación? ¿Cuál es el papel de los profesores?

    El Diseño Curricular Base de la LOGSE (1988) otorgaba a las rúbricas la propiedad de ser instrumentos de evaluación adecuados para medir de forma equitativa y progresiva (aquí los profesores jugamos un papel muy importante) el nivel de logro alcanzado en determinadas actividades o tareas. La evaluación competencial y de calidad  reclama una correcta orientación de los aprendizajes, pero también una reordenación de las formas de aprender. Esto significa que, cuando los procedimientos son los adecuados, las rúbricas serán un instrumento apto para conseguir la pretendida calidad educativa y, sobre todo, la equidad.

    Si los estudiantes no confían en los métodos de evaluación, por considerarlos sesgados y parciales, se producirá una pérdida de confianza en los mismos con la consiguiente caída en la percepción positiva del procedimiento. De los procesos de evaluación, por tanto, dependerá la calidad de los aprendizajes adquiridos, condicionando su nivel y profundidad.

    Evaluar es un proceso en el que recogemos información, analizamos, emitimos un juicio y tomamos decisiones para atribuir un valor al mérito. Este mecanismo procesual  potencia y orienta el aprendizaje  a  través  del denominado “ feedback” . La evaluación competencial, por  consiguiente,  se diferencia de una calificación que, por su marcado carácter sumativo y cuantitativo, no contribuye como debería a la mejora y adquisición de aprendizajes  (Calle-Álvarez,  2020;  Hamodi  et  al. ,  2015). 

    ¿Por qué la evaluación tiene un carácter transformador?

    La UNESCO (2021)  considera que la evaluación es el motor del cambio de la enseñanza por sus capacidades para conducir y regular un elevado número de procesos formativos de manera conjunta. Además, el claro carácter polisémico de las competencias clave,  derivado  de su diversidad y variedad, exige métodos de evaluación modernos que nos permitan identificar el nivel de logro alcanzado en cada una de ellas . Para evitar la ambigüedad en la enunciación de indicadores, debemos ser capaces de superar la barrera de los conocimientos, aprovechando el impacto positivo en la consecución de nuevas habilidades y el desarrollo de estrategias orientadas a una formación competencial integral (vid. Fernández-Cruz  y  Gijón,  2012).  Una evaluación coherente debe contribuir a las metodologías didácticas competenciales favoreciendo los tiempos y los resultados de aprendizaje.

    Algunos hallazgos de una reciente investigación sobre las rúbricas

    Sintetizamos a continuación los elementos del estudio realizado por los profesores Rubén Fernández Alonso, Pamela Woitschach y José Muñiz (octubre-noviembre 2019) : “Las rúbricas no neutralizan el efecto de los correctores: una estimación con el modelo de facetas múltiples de Rasch”, Revista de Educación (389), 89-107. Este estudio, como veremos, llegó a la conclusión de que es imposible sustraerse de la variable «efecto corrector» o, en otras palabras, la completa objetividad en la aplicación de calificaciones por parte de los evaluadores y evaluadoras.

    Planteamiento de las pruebas

    Este experimento se llevó a cabo con ítems de respuesta construida (rúbricas) ampliamente utilizados en evaluaciones de todo tipo.

    El experimento consideró 13 tribunales con 4 miembros cada uno que rotaron entre sí, de manera que se consiguió un balanceo absoluto, rebajando el sesgo derivado de la agrupación de los correctores.

    El ejercicio a evaluar consistía en leer un texto con información de tres ciudades. Los alumnos y alumnas debían seleccionar una de ellas y escribir un texto para convencer a sus compañeros y compañeras sobre la necesidad de realizar un viaje de estudios a dicha ciudad.

    La rúbrica con la que se evaluó la actividad fue la siguiente:

    Resultados y conclusiones del estudio

    Un reto de la evaluación mediante rúbricas es el de eliminar el sesgo que se produce siempre que interviene el factor humano o criterio del profesor y poder así alcanzar un alto índice de objetividad y equidad en las calificaciones. La valoración objetiva y rigurosa de los ensayos e ítems de respuesta construida constituye un verdadero desafío.

    En aras de la mejora y de la eliminación de las principales desviaciones, el estudio proponía varias actuaciones:

    • El entrenamiento de los correctores en la correcta interpretación de las rúbricas de los procesos cognitivos a evaluar y la puntuación numérica otorgada a cada una de ellas.
    • Autores como Fernández Alonso y Muñiz (2011) establecen las ventajas e inconvenientes del uso de diseños en base al grado de completitud. Rúbricas más exhaustivas podrían eliminar posibles desviaciones, pues responden a enunciaciones de los estándares más concretas y con un menor grado de ambigüedad.
    • Los problemas que pudieran producirse en la desviación de las calificaciones entre los jueces se deben, más que a una baja fiabilidad en la objetividad de los jueces, a problemas estructurales de las rúbricas en sí.
    • En la literatura están documentados problemas que consideran los efectos del corrector en la variación de los resultados y su variación significativa en las puntuaciones los resultados de algunos estudiantes, que pueden variar significativamente (Lunz et al., 1990; Wang y Yao, 2013).
    • Se trata, en suma, de complementar un conjunto de medidas que conjuguen el entrenamiento de los estudiantes evaluados con la comprensión de la herramienta que se aplica para evaluarlos.

    Algunas fuentes de error

    Las fuentes de error están muy identificadas: el tipo de evaluador, nivel de exigencia, trayectoria académica y profesional, formación, nivel académico, entrenamiento, implicación, etc. En la materia evaluada influye su posible generalidad y subjetividad de sus conceptualizaciones y dominios de conocimiento.

    El estudio juzga como importante, el denominado sesgo del factor severidad, que modula los resultados al alza o a la baja, según las restricciones correctoras.

    En el gráfico I, la distribución de las calificaciones de 2 tribunales aleatorios se encuentran muy correlacionadas y próximas. Algunas de ellas llegan a coincidir. Apreciamos, por tanto, una correcta y efectiva aplicación de la herramienta.

    Sin embargo, en el siguiente gráfico, las distribuciones de las calificaciones de los tribunales 6 y 12 nos indican que el sesgo de la severidad de este último tribunal ha sido más elevado.

    Concluimos que, como en todo instrumento de evaluación, es muy difícil erradicar al completo los elementos que propician algún tipo de sesgo o desviación, introducido, casi siempre, por la el componente valorativo, humano, de los profesores. Como ponen de relieve las investigaciones del artículo, las rúbricas no neutralizan el efecto de los correctores, por cuanto no podemos afirmar que nos encontremos ante una herramienta que nos permita medir resultados con absoluta objetividad. Sí, por el contrario, permite que nos aproximemos, en algunos casos, a la máxima uniformidad y homogeneidad en las calificaciones, hecho que invita a pensar en que los ítems de respuesta construida son una herramienta de medición objetiva en relación al conjunto de otras más subjetivas.

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.