Un sistema de visión por ordenador imita la percepción humana en 3-D

La tecnología, que se basa en principios físicos y ecuaciones matemáticas, permitirá a las máquinas ver como las personas


Un equipo de investigadores de la Universidad de Purdue ha desarrollado dos nuevas técnicas de visión por ordenador que emulan la manera en que los humanos percibimos las formas tridimensionales de inmediato, reconociendo objetos sin importar lo torcidos o doblados que estén. El avance podría ayudar a las máquinas a ver como las personas. Por Elena Higueras.


Elena Higueras
22/06/2011

El gráfico ilustra la tecnología de visión por ordenador, basada en la física y ecuaciones matemáticas relacionadas con la difusión del calor sobre superficies. Imagen: Karthik Ramani y Yi Fang. Fuente: Universidad de Purdue.
Científicos de la Universidad de Purdue, en Estados Unidos, en colaboración con el University College de Londres, han creado un sistema de visión por ordenador que imita a la percepción humana de las figuras en tres dimensiones, publica la Universidad de Purdue en un comunicado.

Las técnicas, llamadas mapeo de calor y distribución de calor, aplican métodos matemáticos para permitir que las máquinas perciban objetos en tres dimensiones, algo que hasta ahora no había sido demasiado fácil para los ordenadores.

Según reconoce Karthik Ramani, profesor de Ingeniería Mecánica de la Universidad de Purdue y autor principal de la investigación: “Los seres humanos pueden percibir formas en 3-D, pero eso no es tan sencillo para un ordenador. El ser humano puede dividir fácilmente un objeto, como una mano, en sus segmentos - la palma y los cinco dedos -, sin embargo, esta división resulta una operación muy difícil para las computadoras”.

Desde Fourier hasta nuestros días

Ambas técnicas, basadas en la física básica y en las ecuaciones matemáticas, tienen que ver con la forma en que el calor se difunde a lo largo de superficies.

"Albert Einstein hizo contribuciones al conocimiento de esta difusión, y en el siglo XVIII el físico Jean Baptiste Joseph Fourier desarrolló la ley de Fourier, utilizada para obtener la ecuación del calor. Nosotros nos sostenemos sobre los hombros de gigantes de la creación de algoritmos para estos nuevos enfoques, utilizando la ecuación del calor", afirma Ramani.

El investigador explica, además, la tesis básica de su idea: “Del mismo modo que el calor se difunde sobre una superficie a la que acompaña, capturando los contornos precisos de una forma, nuestro sistema se aprovecha de esta "inteligencia del calor" y simula el calor que fluye de un punto a otro, consiguiendo caracterizar la forma de un objeto a lo largo del proceso”.

Sin información previa

Una de las principales limitaciones de los métodos existentes es que requieren información previa acerca de una forma, para poder analizarla. Ramani ilustra esta condición con el ejemplo siguiente: "Con el fin de hacer una segmentación, usted tiene que avisar antes a su ordenador del número de segmentos que tiene el objeto. Hay que decirle que está esperando, por ejemplo, 10 ó 12 segmentos”.

Frente a estos sistemas convencionales, los nuevos métodos imitan la capacidad humana para percibir correctamente los objetos, ya que no requieren una idea preconcebida de estos segmentos.

Imagen de un centauro con la que los investigadores probaron las nuevas técnicas. Fuente: Universidad de Purdue.
"Estamos tratando de acercarnos lo más posible a la forma de segmentación humana. Un área de moda ahora son las máquinas de aprendizaje sin supervisión. Esto significa que una máquina, como un robot, puede percibir y aprender sin tener ninguna formación previa. Somos capaces de estimar la segmentación en lugar de dar un determinado número de segmentos”, apunta el investigador.

Las aplicaciones potenciales de estos nuevos métodos son muchas, como un motor de búsqueda en 3-D para encontrar piezas mecánicas (por ejemplo, componentes de automoción) en una base de datos; visión y navegación robótica; imágenes médicas en 3-D, aviones militares, juegos multimedia, creación y manipulación de personajes animados en la producción de cine o en la ayuda a cámaras 3-D a comprender los gestos humanos para mejorar los juegos interactivos, entre otras.

Todas ellas son solo una pequeña muestra de las inmensas posibilidades que ofrecen estas nuevas técnicas desarrolladas por la Universidad de Purdue y que contribuirán al progreso de las áreas de ciencias e ingeniería relacionadas con el reconocimiento de patrones, el aprendizaje automático y la visión por ordenador.

Mapas de calor

La primera de las técnicas de la investigación se llama “mapeo de calor”. Ésta comienza por romper un objeto en una malla de triángulos, la forma más simple que puede caracterizar las superficies, y luego calcula el flujo de calor sobre estos triángulos. El método simula el flujo de calor con principios matemáticos bien establecidos.

Estos “mapas de calor” permiten que un ordenador pueda reconocer un objeto, como una mano o una nariz, sin importar si los dedos se doblan o la nariz está deformada. Es decir, es capaz de ignorar el "ruido" introducido por un escaneo láser imperfecto u otros datos erróneos.

"No importa cómo se mueven los dedos o cómo se deforma la palma de la mano, porque cualquier persona puede ver que es una mano, pero para un equipo decir que eso es todavía una mano es complicado. Se necesita un marco, un algoritmo consistente y robusto que funcione independientemente de si se deforma la nariz o si se trata de tu nariz o de la mía”, afirma Ramani.

El método simula con precisión cómo el calor fluye por la superficie del objeto al tiempo que revela su estructura y distingue los puntos únicos necesarios para realizar la segmentación, mediante el cálculo de lo que denominan en la investigación “la firma de calor medio". Conocer esta firma permite al ordenador determinar el centro de cada segmento, asignar un "peso" a los segmentos específicos, y definir la forma general del objeto.

"Ser capaces de asignar un peso a los segmentos es fundamental porque algunos puntos son más importantes que otros en términos de comprensión de una forma. La punta de la nariz es más importante que otros de sus puntos, por ejemplo, para percibir correctamente su forma, del mismo modo que las puntas de los dedos son más importantes que muchos otros puntos de la mano para su percepción", señala el profesor.

Distribución de calor

En la segunda de las técnicas, la distribución de la temperatura, el flujo de calor se utiliza para determinar un histograma o una firma de todo el objeto. "Un histograma es un mapa de dos dimensiones de una figura de tres dimensiones. Por lo tanto, no importa la forma en que un perro se dobla o se tuerce, ya que proporciona la misma firma" explica Ramani.

En la técnica de distribución de la temperatura también se utiliza una malla de triángulos para percibir formas en 3-D. Ambas técnicas, que podrían combinarse en el mismo sistema, requieren una potencia de ordenador muy modesta para reconocer formas rápidamente, según apuntan los investigadores en el comunicado.

Los científicos probaron su método en ciertas formas complejas, incluyendo las manos, la forma humana y la de un centauro, una criatura mítica mitad hombre, mitad caballo. Los resultados se detallan en dos documentos presentados durante la conferencia IEEE de Reconocimiento de Patrones y Visión por Ordenador que se celebra estos días en la ciudad de Colorado Springs.

El documento es obra de Ramani, los estudiantes de doctorado de la Universidad de Purdue Yi Fang y Mengtian Sun, y el profesor de matemáticas del University College de Londres Minhyong Kim. El trabajo ha sido financiado en parte por la Fundación Nacional de la Ciencia de EEUU y está a punto de salir al mercado una patente sobre esta tecnología.



Elena Higueras
Artículo leído 5964 veces



Más contenidos