Robots que aprenden equivocándose, igual que los humanos

Una serie de algoritmos permite a sistemas robóticos adquirir capacidades motoras mediante ensayo y error


Investigadores de la Universidad de California en Berkeley (EEUU) han desarrollado algoritmos que permitirán a los robots aprender nuevas habilidades motrices con el método de ensayo y error. El proceso es similar al que utilizan los seres humanos en su aprendizaje, lo que supone un hito en el desarrollo de sistemas de inteligencia artificial. Por Jorge Lázaro.


Jorge Lázaro
27/05/2015

El equipo de investigación de la Universidad de California en Berkeley posa junto al robot BRETT. Fuente: Laboratorio de Aprendizaje Robótico en la UC Berkeley.
Los robots son máquinas muy interesantes, pero tienen una incapacidad básica: solo funcionan bien haciendo aquellas cosas para las que están programados. Para superar este punto, los científicos tratan de enseñarlos a aprender por sí mismos.

En esta dirección, un equipo de investigadores de la Universidad de California en Berkeley (EEUU) ha dado un paso importante, que podría suponer un hito en el desarrollo de sistemas de inteligencia artificial: Han desarrollado algoritmos que permitirán a los robots aprender nuevas habilidades motrices con el método de ensayo y error. El proceso es similar al que utilizan los seres humanos en su aprendizaje.

El primer robot que utiliza este sistema responde al nombre de BRETT (Berkeley Robot for the Elimination of Tedious Tasks, o Robot Berkeley para la Eliminación de Tareas Tediosas).

En una prueba realizada con él en la universidad, los investigadores demostraron que BRETT era capaz de completar una serie de tareas (colgar ropa, montar un avión de juguete, o desenroscar un tapón) sin que se le hubieran programado datos sobre su entorno.

Para lograr esta hazaña, BRETT tuvo que ser programado con una serie de algoritmos basados en el concepto de aprendizaje profundo, que busca crear una robótica de mayor autonomía intelectual, que no tenga que ser programada con tanta asiduidad, y que pueda mejorar en su desempeño por sí misma.

Nueva aproximación al concepto de aprendizaje

El objetivo de la presente investigación es desarrollar nuevos métodos de aprendizaje para los robots, para así “no tener que volver a programarlos cuando se encuentren con algo nuevo”, explica el profesor Pieter Abbeel, del Departamento de Ingeniería Eléctrica y Ciencias de la Computación de la Universidad de California en Berkeley  (EEUU).

Hasta ahora, la principal línea de investigación se centraba en programar todos los escenarios posibles a los que se enfrentara el robot, o crear entornos simulados donde operara; el estudio de Berkeley, en cambio, hace uso del aprendizaje profundo, una rama de la inteligencia artificial inspirada en las conexiones neuronales del cerebro humano, y en su manera de interactuar con el mundo.

Los implicados en el proyecto han preferido centrarse en esta línea de investigación, al considerar que el pensamiento robótico tiene que asemejarse más al humano, que “no nace con un repertorio de comportamientos que se despliega como una navaja suiza; y que tampoco está programado”.

La capacidad humana para aprender de manera constante es el núcleo del aprendizaje profundo, y sus programas se basan en la creación de “redes neuronales”, donde se superponen capas de neuronas artificiales que captan datos sensoriales, sean estos sonidos o imágenes.

El reto de los investigadores de Berkeley ha estado en aplicar estos conceptos a la resolución de tareas motrices, pues no bastaba con el reconocimiento de los estímulos, sino que estos tenían que llevar a una respuesta práctica. El hecho fundamental es que, al desarrollarse la actividad del robot en un ámbito físico, saliendo del entorno en 3D sin estructuras reales, no existen soluciones previas a los problemas que permitan al robot tener una referencia.

Enseñanza con incentivos

Una vez planteado el sistema, resolver los problemas de las capacidades motrices ha sido una cuestión de práctica. A BRETT se le plantearon tareas motrices reguladas con un sistema de puntuación: si sus acciones le acercaban a la solución del problema, los puntos aumentaban.

Los resultados de la puntuación se guardan en la “red neuronal”; así, el algoritmo que controla su programación le permite aprender para completar nuevas tareas en apenas 10 minutos, si conoce la ubicación de los objetos, y en tres horas, si tiene que hacer uso de sus propios sistemas de visión para encontrarlos.

Para Abbeel, los avances que se verán con este proceso serán enormes, y estarán ligados al aumento de datos que pueda procesar el robot. “Con más datos puedes aprender acciones más complejas”, afirma el investigador, que destacó que aún queda un largo camino antes de que los robots puedan “limpiar una casa o hacer la colada”.

Sin embargo, se muestra optimista con los resultados iniciales, que en su opinión apuntan a un gran avance en las capacidades de aprendizaje de los robots en los próximos 10 años.

Aplicaciones en la vida real

Por su parte, Trevor Darrell, director del Centro de Visión y Aprendizaje de Berkeley, destaca la importancia de este nuevo software que el robot utiliza para programar su aprendizaje y todas las tareas que se le encomiendan, pues “la mayoría de aplicaciones de los robots están en entornos controlados donde los objetos están en lugares predecibles”.

“El reto”, concluye, “está en llevar los robots a la vida real, a hogares u oficinas, donde el entorno sufre cambios constantes y el robot tiene que ser capaz de percibirlos y adaptarse a ellos”.



Jorge Lázaro
Artículo leído 3844 veces



Más contenidos