BLOG
Futuro Educativo

Temas

¿Puede un robot corregir un ensayo? La nueva frontera de la evaluación educativa

En América Latina durante la última década hubo un furor de las evaluaciones estandarizadas de alumnos. Exámenes como el SIMCE en Chile, ENLACE en México o SABER en Colombia definen nuevos incentivos para las escuelas. En Brasil el ENEM lo toman casi 10 millones de alumnos por año y decide su futuro universitario. Estas pruebas tienen un gigantesco dilema en sus manos: ¿cómo enseñar a pensar críticamente y a la vez controlar masivamente los resultados de aprendizaje?

En Colombia el dilema entre un currículum por competencias y las evaluaciones estandarizadas es quizás el eje más decisivo de la política educativa de los próximos años.

Las pruebas masivas cualitativas requieren demasiados correctores (imposibles de conseguir y de pagar) y, ante su inviabilidad, se convierten en esquemáticos ejercicios de opciones múltiples. Pero ¿qué pasaría si las máquinas pudiesen reemplazar a los humanos y corregir cualitativamente? Esa es la frontera que está empezando a correrse en Estados Unidos. Consigo vienen numerosas preguntas y posibles revoluciones.

Está llegando la era de las máquinas educativas. La Inteligencia Artificial (AI) para corregir ensayos de escritura de los alumnos ya está entre nosotros. Pearson, el gigante educativo mundial, desarrolló un área llamada Automated Language Assestment. Allí hay soluciones para corregir a los alumnos en diversos niveles, estilos y géneros narrativos.

McGraw-Hill Education y CTB crearon Writing Roadmap, un software que promete ahorrar 100 horas anuales de corrección a los docentes y administra más de un millón de pruebas por año. Funciona imitando el comportamiento racional de un corrector humano y tiene un 95% de acuerdo con correctores humanos de ensayos de escritura.

Algo similar hace la empresa LightSide, centrada exclusivamente en la corrección automática de la escritura de los alumnos. Otras iniciativas similares son E-Rater, PaperRater o Measure Incorporated.

Estas soluciones ofrecen feedback automático a los alumnos. Un alumno escribe un ensayo por consigna de un profesor o de manera autónoma. Las plataformas brindan una respuesta automática de su nivel de escritura en dimensiones como “organización”, “estructura”, “desarrollo”, “variedad lingüística”, “claridad”, “uso de evidencia”, etc. Otorgan un puntaje que funciona como una respuesta inmediata para el alumno. Algunos sistemas están “gamificados” y brindan también medallas y motivaciones para seguir trabajando.

Los administradores de los AES (Automated Essay Scoring) pueden utilizar esta tecnología para corregir centenares, miles o millones de exámenes. El software permite mapear la situación de cada alumno en comparación con sus pares, lo cual puede ser usado para supervisar docentes y escuelas. En varios estados de Estados Unidos se están usando ya para corregir a los alumnos en pruebas de alto impacto (High Stakes). El GMAT, por ejemplo, utiliza un corrector artificial y un humano para cada prueba y utiliza a un segundo humano en caso de discrepancias.

Algunos de los sistemas, como el de LightSide y EASE (de los MOOC de EdX) son de código abierto, lo cual brinda más transparencia acerca de los algoritmos utilizados para corregir a los alumnos. Después de todo, un alumno tiene derecho a saber qué tipo de razonamiento usó la computadora para calificarlo. Algo similar pedía Gary Kasparov a Deep Blue, cuando enfrentó el desafío más conocido de la historia del ajedrez entre humanos y máquinas.

Las pruebas corregidas por computadoras desataron una gran polémica, como era de esperar. Un grupo de especialistas lanzó una iniciativa en 2013 para detener la corrección automática de los ensayos en pruebas de alto impacto para los alumnos. Allí argumentaban que la tecnología no estaba lista para tomar decisiones de tanto peso en la vida de los alumnos, como qué carrera y en qué universidad podían estudiar. La resistencia se basa en que las máquinas son (todavía) triviales, reduccionistas, imprecisas, injustas, secretas e incapaces de realizar diagnósticos predictivos confiables basados en ensayos escritos.

Las respuestas no se hicieron esperar. Las empresas señalan que las mediciones son igual o más precisas que aquellas corregidas por humanos, además de resultar infinitamente más baratas. Otros, más cuidadosos, indican que se trata de un aporte complementario a los correctores humanos. Es una tecnología que da una primera revisión en escasos segundos y funciona como un asistente de los profesores para ahorrarles tiempo y permitirles focalizarse en lo más importante de la corrección humana, como la creatividad, el esfuerzo y la ayuda que puede brindar un docente a sus alumnos.

¿Sirven los robots para corregir ensayos? ¿Pueden los países de América Latina confiar en que la tecnología está a punto de entrar en una fase de consolidación que permita corregir pruebas abiertas a millones de alumnos?

Estas preguntas son decisivas para el futuro de la educación en la región.

Las máquinas pueden llevarnos a un nuevo laberinto: ¿qué pasa si los algoritmos son predecibles y millones de alumnos empiezan a preparar su escritura para lograr buenas notas en ellos sin aprender a escribir con capacidad argumentativa y criterio propio? ¿Qué pasa si los alumnos desisten de esforzarse al saber que ningún humano leerá lo que están escribiendo? ¿El camino es más pruebas y correctores más sofisticados o esto no es más que una vía muerta para la creatividad y la escritura no predictiva, base esencial del lenguaje humano?

La oportunidad de la eficiencia trae potenciales ventajas que obligan a llevar a estas preguntas a todos los terrenos de discusión más serios y plurales posibles. ¿Se podrá ahorrar una inmensa cantidad de tiempo de los docentes para destinarla a cuestiones más importantes o para aumentar sus salarios trabajando menos horas? ¿Se podrá ayudar a los alumnos de forma inmediata y personalizada a potenciar sus aprendizajes?

La llegada de las máquinas inteligentes es un gran interrogante. Cuanto antes comencemos a discutirlo en términos concretos y filosóficos más respuestas colectivas podremos ofrecer. Si las máquinas se basan en acumular grandes cantidades de respuestas humanas para tomar sus decisiones, quizás nosotros podamos imitarlas para decidir qué tanto y cómo queremos que nos ayuden.


Graduate XXI & Futuro Educativo
© 2017 - Todos los Derechos Reservados
Conoce al equipo de GXXI

  • Graduate XXI

¡Hablan de nosotros!


¡Tweets en vivo!

¿Es posible crear comunidades de #aprendizaje en línea para los #estudiantes escolares? http://lvWFVMi7md http://SFpscmUSME

@graduatexxi
#ArtThinking: Conoce a las dos #profesoras que usan el arte para revolucionar la #educación http://qDgTqR3KzShttp://BdlQtY6yNV

@graduatexxi