El estudiante Dan Roth (izq.) y su profesor Subhro Roy. Fuente: Universidad de Illinois
La asignatura de matemáticas siempre ha sido un hueso duro de roer, para los niños y para sus padres. Muchos estudiantes no comprenden correctamente el enunciado de los problemas o, por el contrario, los realizan de memoria o de forma automática, fijándose únicamente en palabras claves para saber qué operación realizar. Es esta una estrategia que puede desarrollar por inercia incluso un niño de ocho años, pero no así un ordenador.
O dicho de otro modo, si Johnny tiene cinco manzanas y siete naranjas, y quiere compartirlas con sus tres amigos, ¿puede un ordenador entender el texto para averiguar cuántas piezas de fruta corresponden a cada persona? Probablemente el niño lo resolvería.
Ahora, gracias a un nuevo software desarrollado en la Universidad de Illinois, en Estados Unidos, se capacitará a las máquinas para entender el razonamiento matemático expresado en forma de palabras. De esta forma se podría mejorar en gran medida tanto los motores de búsqueda como el acceso a datos, al tiempo que se daría un nuevo impulso a la enseñanza de las matemáticas.
De ello se han encargado el profesor de ciencias de la computación Dan Roth y el estudiante Subhro Roy, cuyo trabajo se publicó recientemente en la revista Transactions of the Association for Computational Linguistics. En un comunicado de la universidad, Roth señala que existe gran cantidad de datos disponibles en archivos de noticias y registros públicos, pero lamenta que no se pueda acceder a ellos de forma coherente.
"Por ejemplo, si alguien quiere saber qué porcentaje del presupuesto del Estado se ha gastado en educación en los últimos 20 años, no conseguirá el resultado deseado con una búsqueda de palabras clave realizada en un motor de búsqueda como Google”, explica. Sin embargo, el profesor añade que si el motor fuera capaz de hacer el razonamiento cuantitativo, deduciría a partir del texto el tipo de información que el usuario está buscando. “Podría encontrar los números, calcular los porcentajes o lo que hiciera falta hasta obtener el resultado", puntualiza.
O dicho de otro modo, si Johnny tiene cinco manzanas y siete naranjas, y quiere compartirlas con sus tres amigos, ¿puede un ordenador entender el texto para averiguar cuántas piezas de fruta corresponden a cada persona? Probablemente el niño lo resolvería.
Ahora, gracias a un nuevo software desarrollado en la Universidad de Illinois, en Estados Unidos, se capacitará a las máquinas para entender el razonamiento matemático expresado en forma de palabras. De esta forma se podría mejorar en gran medida tanto los motores de búsqueda como el acceso a datos, al tiempo que se daría un nuevo impulso a la enseñanza de las matemáticas.
De ello se han encargado el profesor de ciencias de la computación Dan Roth y el estudiante Subhro Roy, cuyo trabajo se publicó recientemente en la revista Transactions of the Association for Computational Linguistics. En un comunicado de la universidad, Roth señala que existe gran cantidad de datos disponibles en archivos de noticias y registros públicos, pero lamenta que no se pueda acceder a ellos de forma coherente.
"Por ejemplo, si alguien quiere saber qué porcentaje del presupuesto del Estado se ha gastado en educación en los últimos 20 años, no conseguirá el resultado deseado con una búsqueda de palabras clave realizada en un motor de búsqueda como Google”, explica. Sin embargo, el profesor añade que si el motor fuera capaz de hacer el razonamiento cuantitativo, deduciría a partir del texto el tipo de información que el usuario está buscando. “Podría encontrar los números, calcular los porcentajes o lo que hiciera falta hasta obtener el resultado", puntualiza.
Identificar y entender
El primer obstáculo, y el mayor desafío al que se enfrentaron en esta investigación, fue entrenar al ordenador para identificar cantidades y unidades dentro del texto, independientemente de la forma en que se expresan, algo que los humanos hacen de forma inconsciente al leer. En segundo lugar, el software tenía que decidir qué hacer con los números identificados.
Volviendo al ejemplo de Johnny, el equipo tiene que entender que tanto las manzanas y las naranjas son las frutas a repartir; que las palabras cinco, siete y tres equivalen a los valores numéricos 5, 7 y 3; determinar qué tipo de operación requiere la pregunta -en este caso, la suma y la división- y en qué orden llevarlas a cabo. Una vez que el programa convierte el texto en una ecuación, se puede calcular fácilmente que a Johnny y a cada uno de sus amigos les corresponden tres piezas de fruta.
Sin embargo, el ordenador también debe determinar el cálculo en función del contexto. Así, en el mismo caso, el software tiene en cuenta si el texto matiza que el chico quiere dividir la fruta entre sus tres amigos, en lugar de compartirla con ellos. O lo que es lo mismo, un cambio muy sutil en el lenguaje implica que cada amigo recibe cuatro piezas de fruta, mientras Johnny se queda sin ninguna.
El mismo razonamiento complejo se requiere para las consultas de búsqueda. Al acceder a un texto relativo a ingresos financieros, por ejemplo, el equipo tiene que determinar si una cantidad es exacta o aproximada, estática o dinámica, un rango presentado en relación a otra cosa, y todas las otras pistas contextuales que un lector entendería por inercia.
"El ordenador lee dos libras, pero ¿dos libras de qué?, ¿se está refiriendo a la moneda?, ¿qué pasa con las conversiones monetarias?" se cuestiona Roth. Si se habla de fechas, la cosa es aún más difícil. “Yo podría decir la semana después de Acción de Gracias, la primera semana de diciembre, o el 3 de diciembre. Para ti y para mí significa lo mismo, pero una búsqueda por palabra clave no puede ponerse a ese nivel", subraya el profesor.
Los investigadores evaluaron las capacidades de su software para identificar y normalizar cantidades numéricas en el texto, para realizar búsquedas relacionadas con divisas monetarias, y para comprender y resolver problemas matemáticos a nivel de una clase de Primaria. El resultado fue positivo, ya que la herramienta realizó correctamente todas las tareas. Incluso superó al estudiante promedio de nivel elemental en la resolución de problemas, obteniendo el 87 por ciento de respuestas correctas.
El primer obstáculo, y el mayor desafío al que se enfrentaron en esta investigación, fue entrenar al ordenador para identificar cantidades y unidades dentro del texto, independientemente de la forma en que se expresan, algo que los humanos hacen de forma inconsciente al leer. En segundo lugar, el software tenía que decidir qué hacer con los números identificados.
Volviendo al ejemplo de Johnny, el equipo tiene que entender que tanto las manzanas y las naranjas son las frutas a repartir; que las palabras cinco, siete y tres equivalen a los valores numéricos 5, 7 y 3; determinar qué tipo de operación requiere la pregunta -en este caso, la suma y la división- y en qué orden llevarlas a cabo. Una vez que el programa convierte el texto en una ecuación, se puede calcular fácilmente que a Johnny y a cada uno de sus amigos les corresponden tres piezas de fruta.
Sin embargo, el ordenador también debe determinar el cálculo en función del contexto. Así, en el mismo caso, el software tiene en cuenta si el texto matiza que el chico quiere dividir la fruta entre sus tres amigos, en lugar de compartirla con ellos. O lo que es lo mismo, un cambio muy sutil en el lenguaje implica que cada amigo recibe cuatro piezas de fruta, mientras Johnny se queda sin ninguna.
El mismo razonamiento complejo se requiere para las consultas de búsqueda. Al acceder a un texto relativo a ingresos financieros, por ejemplo, el equipo tiene que determinar si una cantidad es exacta o aproximada, estática o dinámica, un rango presentado en relación a otra cosa, y todas las otras pistas contextuales que un lector entendería por inercia.
"El ordenador lee dos libras, pero ¿dos libras de qué?, ¿se está refiriendo a la moneda?, ¿qué pasa con las conversiones monetarias?" se cuestiona Roth. Si se habla de fechas, la cosa es aún más difícil. “Yo podría decir la semana después de Acción de Gracias, la primera semana de diciembre, o el 3 de diciembre. Para ti y para mí significa lo mismo, pero una búsqueda por palabra clave no puede ponerse a ese nivel", subraya el profesor.
Los investigadores evaluaron las capacidades de su software para identificar y normalizar cantidades numéricas en el texto, para realizar búsquedas relacionadas con divisas monetarias, y para comprender y resolver problemas matemáticos a nivel de una clase de Primaria. El resultado fue positivo, ya que la herramienta realizó correctamente todas las tareas. Incluso superó al estudiante promedio de nivel elemental en la resolución de problemas, obteniendo el 87 por ciento de respuestas correctas.
Accesibilidad
Roth espera que esta capacidad para entender los números según el contexto favorezca la accesibilidad a la información para todos, desde los investigadores que buscan correlaciones a inversores en busca de datos financieros claros, pasando por los estudiantes que quieran mejorar sus habilidades de razonamiento cuantitativo.
"A medida que avanzamos y queremos ayudar a los niños a comprender las matemáticas, tiene sentido utilizar la tecnología", subraya Roth. Haciendo una consulta en cualquier motor de búsqueda hoy en día, aparecen un montón de páginas web que ayudan a niños y padres con las tareas de matemáticas, lo que significa que existe la demanda y que supone un reto, tanto para los escolares como para su familia.
Si un programa informático fuera capaz de comprender los problemas en el sentido de localizar las variables y saber en qué centrarse, ayudaría a mucha gente a aprender mejor y, además, de una manera que hasta ahora no se podía.
Roth espera que esta capacidad para entender los números según el contexto favorezca la accesibilidad a la información para todos, desde los investigadores que buscan correlaciones a inversores en busca de datos financieros claros, pasando por los estudiantes que quieran mejorar sus habilidades de razonamiento cuantitativo.
"A medida que avanzamos y queremos ayudar a los niños a comprender las matemáticas, tiene sentido utilizar la tecnología", subraya Roth. Haciendo una consulta en cualquier motor de búsqueda hoy en día, aparecen un montón de páginas web que ayudan a niños y padres con las tareas de matemáticas, lo que significa que existe la demanda y que supone un reto, tanto para los escolares como para su familia.
Si un programa informático fuera capaz de comprender los problemas en el sentido de localizar las variables y saber en qué centrarse, ayudaría a mucha gente a aprender mejor y, además, de una manera que hasta ahora no se podía.