Vicarious intenta despertar la imaginación de la Inteligencia Artificial

Esta empresa, afincada en San Francisco, lleva años trabajando en una revolucionaria aproximación, que la comunidad científica está deseosa de conocer


Hasta ahora, los sistemas de Inteligencia Artificial han aprendido a partir del procesamiento de enormes cantidades de datos. Pero existe una alternativa de aprendizaje que también se está contemplando: el desarrollo de la imaginación en estos sistemas. En esto trabaja la empresa Vicarious de San Francisco desde hace años. Por Javier Molina.


Javier Molina
09/06/2016

Esquema básico de una red neuronal artificial. Fuente: wikipedia
Google, facebook, Microsoft...  Las grandes empresas trabajan en la resolución de problemas mediante Inteligencia Artificial: reconocimiento de imágenes, procesamiento del lenguaje natural, traducción entre idiomas, etc.

En todas estas disciplinas, los mejores resultados se han dado en sistemas que hacían uso de las colecciones de datos más extensas.

Por eso se habla de que la Inteligencia Artificial, a día de hoy, está guiada por contenidos más que por algoritmos.

Redes neuronales artificiales y el aprendizaje clásico

Las redes neuronales artificiales existen desde los años 80, época en que se formuló su forma más básica, el Perceptrón Multicapa. La revolución ha llegado más tarde, cuando hemos tenido colecciones de datos suficientemente grandes como para hacer aprender a estos sistemas de una forma fiable.

Las redes neuronales se pueden entender como una colección de nodos  conectados entre sí con unos pesos (valores que multiplican a cada señal que llega al nodo). Dentro del nodo se realiza una operación también definida por pesos.

Imaginemos una red cuya salida es un numero entre 0 y 1 y que quiere detectar, por ejemplo, si en una imagen hay una cara (>0.5) o no (<0.5). El aprendizaje hará uso de miles de imágenes con caras y sin ellas, variando iterativamente los pesos de la red, hasta el momento que esta funcione con imágenes nuevas. Está técnica se llama retropropagación. Una vez la red ha sido entrenada, cuando llega una nueva imagen, la información ya solo fluye de entrada hacia salida, en una sola dirección.

La necesidad de tantísimos datos etiquetados para entrenar una red neuronal es una enorme limitación. Sin ir más lejos, en muchos casos son las empresas que tienen acceso a millones de casos anotados (e.g. imágenes de caras, imágenes con textos) las que consiguen desarrollar las mejores soluciones.

Siguiendo con el ejemplo de detectar caras en imágenes: A ojos de una red neuronal clásica, no es lo mismo una cara sonriente que una sorprendida. Luego, si queremos que el sistema detecte caras sonrientes y sorprendidas habremos de "alimentar" a la red con ambos tipos de caras en el proceso de aprendizaje. Podemos decir lo mismo del color de piel, del pelo, la distancia entre los ojos, el tipo de nariz, la barba o falta de barba....

Esta problemática hace que no baste con un puñado de imágenes de caras para entrenar una red. La anotación de estas imágenes es un proceso tedioso que requiere de muchas horas hombre.

Imagen: geralt. Fuente: Pixabay.
Una alternativa: simular la imaginación

A día de hoy, no son muchas las iniciativas que intentan esquivar esta dependencia de las grandes colecciones de datos. La empresa Vicarious  promete espectaculares resultados, si bien desde 2013 trabaja con mucho secretismo.

No ha realizado ninguna publicación científica ni patente, incluso es discreta con respecto a la localización de sus laboratorios. Los inversores en esta empresa son pesos pesados con cierta credibilidad (como Mark Zuckerberg, fundador de facebook, Elon Musk, fundador de SpaceX, Tesla Motors y otras empresas) y el capital hasta ahora conseguido asciende ni más ni menos que a 73 millones de dólares.

Después de estos años de silencio, la empresa promete demostraciones innovadoras. Su estrategia es la de intentar hacer a las redes neuronales imaginar, esto es, siguiendo con el ejemplo de las caras, dada una imagen de una cara sonriente, ser capaz de imaginar la apariencia de  esta con otras expresiones, o peinados, o colores...

En 2013, los fundadores de Vicarious aplicaron esta idea a la resolución de captchas con impresionates resultados. La idea es el uso de una red neuronal en la que la información fluye en ambas direcciones, no como en las configuraciones clásicas.

En la comunidad científica, son muchas las expectativas en que las investigaciones de Vicarious ha despertado.  Ávida por conocer los entresijos de esta nueva aproximacíón, esta comunidad espera una pronta publicación al respecto. Quizá ya falte poco.



Javier Molina
Artículo leído 5241 veces



Más contenidos