Dos algoritmos avanzan en el reconocimiento facial por parte de los ordenadores

Uno reconoce un rostro a partir de una sola imagen y el otro identifica expresiones en tiempo real


Dos nuevas investigaciones han permitido avanzar en el desarrollo de algoritmos punteros en el reconocimiento facial por parte de ordenadores. Por un lado, el informático Hung-Son Le, de la Universidad de Umea, en Suecia, ha creado un software que permite al ordenador la posibilidad de reconocer un rostro a partir de una única imagen, aunque la calidad de ésta sea deficiente. Por otro lado, investigadores del Departamento de Inteligencia Artificial (DIA) de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM), en colaboración con la Universidad Rey Juan Carlos de Madrid, han desarrollado un algoritmo que es capaz de reconocer expresiones faciales en tiempo real (procesando 30 imágenes por segundo), asignando a la persona observada una de las seis expresiones prototípicas: enfado, asco, miedo, alegría, tristeza y sorpresa. Por Raúl Morales.


Raúl Morales
20/02/2008

Dos investigaciones llevadas a cabo por un lado por informáticos de la universidad sueca de Umea, y por otro por la Universidad Politécnica de Madrid, en colaboración con la Rey Juan Carlos, han permitido, avanzar en el desarrollo de software especializados en el reconocimiento facial por parte de los ordenadores.

Normalmente, los sistemas ideados para reconocer rostros han sido “entrenados” mediante una base de datos que contiene una gran colección de imágenes de caras en diferentes circunstancias de iluminación y gestuales. Conseguir esa cantidad de imágenes para que un ordenador pueda identificar la cara de una persona lleva mucho tiempo y es muy caro. Aún así, los sistemas actuales tienen problemas muchas veces debido a la mala calidad de las fotos o la variedad de ángulos o iluminaciones.

Como recoge un comunicado de la Universidad de Umea, el algoritmo creado por Hung- Son Le , permite que los sistemas de reconocimiento puedan reconocer un rostro a partir de una única imagen. Según su creador, el algoritmo mejora de manera muy apreciable la efectividad de estos sistemas cuando se tiene en cuenta las condiciones de luz o las diferentes expresiones faciales.

Su algoritmo usa un método que mejora el contraste en fotografías subexpuestas o superexpuestas. Esos detalles se hacen visibles, cuando de otra manera un ordenador no lo hubiera podido hacer.

Los experimentos llevados a cabo con este algoritmo han sido parte de la tesis doctoral de Le. Dichos experimentos han sido llevados a cabo teniendo en cuenta estándares internacionales como la base de datos FERET o la base de datos de Yale y han demostrado que el sistema funciona y que supera a otros. Las aplicaciones comerciales basadas en esta investigación están ya en fase desarrollo.

En tiempo real

En el mismo campo, investigadores del DIA de la Facultad de Informática de la Universidad Politécnica de Madrid, en colaboración con la Universidad Rey Juan Carlos de Madrid, han desarrollado otro algoritmo que puede reconocer expresiones faciales en tiempo real.

Los resultados de esta investigación han sido publicados en la edición de enero de la revista Pattern Analysis and Applications

Como informa la Facultad de Informática en un comunicado, aplicando el algoritmo de reconocimiento de expresiones faciales, el prototipo desarrollado es capaz de procesar una secuencia de imágenes de una persona en posición frontal y en movimiento, reconociendo la expresión de su rostro.

El software puede aplicarse a secuencias de vídeo en situaciones realistas, permitiendo identificar la expresión facial de una persona situada frente a la pantalla de un ordenador. Aunque de momento es sólo un prototipo, el software es capaz de realizar su trabajo en un ordenador de sobremesa e incluso en un ordenador portátil.

Cuando una persona se coloca delante de una cámara conectada a un ordenador en el que se ejecuta el prototipo, su rostro es analizado por el sistema (hasta 30 imágenes por segundo) a través de unos recuadros que se fijan al rostro del usuario en una pequeña ventana. Estos recuadros siguen el movimiento del rostro del usuario hasta determinar cuál es la expresión de su cara comparándola con las expresiones realizadas por diferentes personas (333 secuencias) dentro de la base de datos Cohn-Kanade.

La mayoría de sistemas parecidos desarrollados por otros investigadores trabajan únicamente sobre la parte de reconocimiento de expresiones, sin embargo el prototipo desarrollado realiza la tarea completa. En primer lugar localizar y seguir el rostro en la imagen con un algoritmo propio que funciona a pesar de los cambios de iluminación o el movimiento del usuario. Además, clasifica la expresión facial del usuario. Por último, también incorpora un algoritmo original que calcula las probabilidades de evolución de las expresiones faciales de la persona que está siendo analizada.

La tasa de aciertos del sistema sobre la propia base de datos de Cohn-Kanade es del 89% y puede trabajar en condiciones adversas como grandes cambios de la apariencia de la cara producidos de la iluminación ambiental, pequeños movimientos del rostro o movimientos de la cámara.

Interfaces persona-máquina

Las aplicaciones de este software son diversas: desarrollo de interfaces avanzadas entre las personas y las máquinas, potenciación de las relaciones con el consumidor que compra a través de Internet, y dotación a los avatares de los metaversos de una capacidad inédita de relación con su personaje.

Las interfaces avanzadas hombre máquina pueden enriquecerse con este software porque permitiría construir avatares que simulan realmente las expresiones del rostro de una persona, posibilidad que es realmente atractiva para sectores específicos como los videojuegos.

El comercio electrónico también podría beneficiarse de esta tecnología, ya que en el momento de comprar por Internet, el ordenador sería capaz de identificar los gestos de la persona que se interesa por un producto, de determinar su intención real de compra e incluso de medir su nivel de satisfacción por un producto o servicio, ya que el sistema podría ayudar a reducir las ambigüedades del lenguaje hablado o escrito.











Raúl Morales
Artículo leído 26466 veces



Más contenidos