Primer software que reconoce bocetos mejor que una persona

El programa tiene en cuenta las singularidades del trazado frente a otro tipo de dibujos


Investigadores británicos aseguran haber desarrollado el primer programa informático que puede identificar objetos en bocetos mejor de lo que puede hacerlo el hombre. Según los informes, Sketch-a-Net ha conseguido una tasa de acierto del 74,9 por ciento, frente al 73,1 por ciento humano. La evolución de la tecnología podría tener un enorme impacto para el trabajo de reconocimiento de la policía científica, el uso de pantallas táctiles o la recuperación de imágenes. Por Patricia Pérez.


Patricia Pérez Corrales
22/07/2015

El programa distinguió variantes de ave como una gaviota y una paloma. Fuente: QMUL
Los bocetos se pueden considerar como una de las más primitivas herramientas de comunicación y de expresión artística. De hecho, se usan desde tiempos prehistóricos, como ha quedado constancia en las numerosas pinturas rupestres que han llegado hasta nuestros días. No es de extrañar por tanto que siempre haya sido un interesante área de estudio que vive un nuevo auge ahora, con el aumento en el uso de pantallas táctiles.

El dibujo, y en concreto el boceto, se ha convertido en una tarea mucho más fácil, por lo que proliferan quienes hacen sus pinitos en teléfonos y tabletas. Paralelamente se ha creado una nueva línea de mercado en torno al boceto, con lápices digitales y aplicaciones de dibujo que aprovechan precisamente la inexactitud del trazo para realizar dibujos y bocetos bastante sorprendentes.

Sin embargo, ¿se puede distinguir con exactitud un boceto digital del realizado con lápiz y papel? Un nuevo software es capaz de diferenciarlo e incluso ir a más, pues se trata del primer programa informático que puede reconocer bocetos dibujados a mano mejor que los humanos. Sketch-a-Net, como se ha llamado a esta herramienta desarrollada en la Universidad Queen Mary de Londres (QMUL), es capaz de identificar correctamente el tema de los dibujos con una tasa de acierto del 74,9 por ciento, frente al 73,1 conseguido por el hombre.

Según un comunicado de la universidad, la evolución de la tecnología podría ser de gran utilidad como base para nuevas formas de interacción hombre-máquina. Y es que, a medida que aumenta el uso de pantallas táctiles, el dibujo se vuelve más relevante. De esta forma, si el dispositivo entiende lo que el usuario dibuja con los dedos, se podría utilizar como método de búsqueda, mucho más natural y específico para ciertos ámbitos que la búsqueda por palabras clave.

Por ejemplo, sería de gran utilidad para encontrar artículos como muebles o accesorios de moda en una búsqueda esbozando unos trazos simples. También para ayudar a las fuerzas del orden en la realización de retratos robots que, si bien ya recurren a la tecnología en lugar de a dibujantes expertos, se trata de una técnica limitada, al menos en España. Ello pese a que el uso de retratos robot permite resolver más de un 20 por ciento de los casos pendientes en el país.

Pequeños detalles

La investigación, cuyos resultados se darán a conocer en septiembre en la British Machine Vision Conference (BMVC), uno de los eventos internacionales más importantes sobre visión artificial, demostró también que el programa funciona mejor en pequeños detalles decisivos de los bocetos. Así, fue capaz de distinguir con éxito entre variantes de ave como una gaviota y una paloma, o un pájaro que vuela frente a otro que está de pie con el 42,5 por ciento de precisión, en comparación con un porcentaje humano mucho más bajo, del 24,8 por ciento.

En particular, según recogen los investigadores en el informe, la categoría 'gaviota' es la que peores resultados tiene entre los humanos, con una precisión de apenas un 2,5 por ciento, ya que en su mayoría se confunde con otros tipos de pájaros. Por el contrario, Sketch-a-Net llegó al 23,9%, que es casi 10 veces mejor.

Los bocetos son muy intuitivos para el hombre y se han utilizado a lo largo de miles de años como herramienta de comunicación. Sin embargo, reconocer dibujos realizados a mano alzada es un reto, ya que son icónicos y abstractos, variados y formados por un entramado de líneas en blanco y negro, en lugar de por píxeles de colores como una foto. Por tanto, automatizar el reconocimiento de bocetos manuales dará lugar a una mejor comprensión científica de la percepción visual.

Singularidades del boceto

Y es que Sketch-a-Net actúa como una red neuronal profunda, pues se trata de un tipo de programa informático diseñado para emular el procesamiento del cerebro humano. Su éxito reside en prestar atención a las singularidades que presenta el boceto frente a otro tipo de dibujos, teniendo en cuenta por ejemplo el orden en que se dieron las pinceladas. Se trata de información ignorada hasta ahora, pero que resulta de especial valor para el reconocimiento de dibujos en pantallas táctiles.

Para conseguirlo, la arquitectura de red del software está diseñada para bocetos, en lugar de para fotografías. Además, un sistema multicanal codifica el orden secuencial seguido al realizar el dibujo, y una red multiescala da cuenta de los diferentes niveles de abstracción que se exhiben en bocetos realizados a mano alzada.

De esta forma los investigadores demuestran que la tecnología diseñada específicamente para fotos de objetos naturales deja de funcionar bien para el reconocimiento de bocetos, sin importar si se ha entrenado utilizando fotos o dibujos. Además, su sistema no sólo ofrece mejor rendimiento, sino que también es mucho más eficiente, recurriendo sólo a la CPU.

El estudio se llevó a cabo a gran escala con más de 20.000 bocetos realizados a manos alzada procedentes de la base de datos de la Universidad Técnica de Berlín, que posee el recurso más grande y comúnmente utilizado de trazados de este tipo. Contiene 250 categorías de objetos cotidianos con 80 bocetos por categoría. A través de Amazon Mechanical Turk (AMT) se seleccionó a los 1.350 participantes.

De momento las pruebas hablan de un software que puede resolver tareas incluso mejor que el hombre, por lo que Timothy Hospedales, coautor del estudio y profesor en la Escuela de Ingeniería Electrónica e Informática de la QMUL, ya augura el enorme impacto que puede suponer para el trabajo de la policía científica, el uso de pantallas táctiles, la recuperación de imágenes y, en última instancia, para conocer todos los detalles de la comprensión visual.



Patricia Pérez Corrales
Artículo leído 5969 veces



Más contenidos