Aficiones, intereses o creencias comunes, rebeldía, moda o una combinación de ellas son los motivos que llevan fundamentalmente a los jóvenes a formar parte de una determinada tribu o subcultura social. Su pertenencia a la misma lleva aparejado un fuerte simbolismo, expresado en hábitos, comportamientos e incluso apariencias físicas comunes a todos los miembros; algo aparentemente fácil de detectar para el hombre, pero no así para la máquina.
Es el reto de la Visión Artificial, cuya investigación se ha visto beneficiada por el boom de las imágenes compartidas a través de las redes sociales en áreas como el reconocimiento facial, de texto o escena. Sabedores de ello, un equipo de investigadores de la Universidad de California en San Diego (UC San Diego), en Estados Unidos, se plantea un interrogante: "Si las personas obtienen un montón de información implícita en el aspecto visual de un grupo, ¿por qué no puede una máquina determinar de forma automática a qué subcultura social pertenecen?".
Ese es el objetivo del estudio de Serge Belongie, profesor de Ciencias de la Computación en la Escuela de Ingeniería Jacobs de la UC San Diego, y sus colegas. Para conseguirlo han desarrollado un algoritmo que utiliza fotos de grupos en diferentes eventos sociales en busca de elementos asociables a una determinada tribu urbana.
Hasta el momento el sistema tiene un promedio de precisión del 48 por ciento que, aunque no es muy alto, al menos es mejor que dejarlo al azar, cuando las respuestas correctas bajan al nueve por ciento. Con todo, el objetivo de la investigación es conseguir un algoritmo tan exacto como la visión humana.
"Esto es sólo un primer paso", subraya Belongie en un comunicado de la UC San Diego, donde admite además que un índice de exactitud del 48 por ciento es en realidad un buen resultado. Las conclusiones del estudio se presentaron recientemente en la Conferencia británica de Visión Artificial (BMVC), celebrada en Bristol.
Es el reto de la Visión Artificial, cuya investigación se ha visto beneficiada por el boom de las imágenes compartidas a través de las redes sociales en áreas como el reconocimiento facial, de texto o escena. Sabedores de ello, un equipo de investigadores de la Universidad de California en San Diego (UC San Diego), en Estados Unidos, se plantea un interrogante: "Si las personas obtienen un montón de información implícita en el aspecto visual de un grupo, ¿por qué no puede una máquina determinar de forma automática a qué subcultura social pertenecen?".
Ese es el objetivo del estudio de Serge Belongie, profesor de Ciencias de la Computación en la Escuela de Ingeniería Jacobs de la UC San Diego, y sus colegas. Para conseguirlo han desarrollado un algoritmo que utiliza fotos de grupos en diferentes eventos sociales en busca de elementos asociables a una determinada tribu urbana.
Hasta el momento el sistema tiene un promedio de precisión del 48 por ciento que, aunque no es muy alto, al menos es mejor que dejarlo al azar, cuando las respuestas correctas bajan al nueve por ciento. Con todo, el objetivo de la investigación es conseguir un algoritmo tan exacto como la visión humana.
"Esto es sólo un primer paso", subraya Belongie en un comunicado de la UC San Diego, donde admite además que un índice de exactitud del 48 por ciento es en realidad un buen resultado. Las conclusiones del estudio se presentaron recientemente en la Conferencia británica de Visión Artificial (BMVC), celebrada en Bristol.
Las imágenes con bordes verdes se etiquetaron correctamente, mientras las rojas fallaron. Fuente: UC San Diego
Fotos grupales
A diferencia de otros proyectos relacionados con la Visión Artificial, en este trabajo los investigadores centraron su atención en fotos grupales en lugar de individuales, con la esperanza de captar mejor las señales sociales, tales como ropa y peinados, para determinar las tribus en función de aquellos elementos coincidentes en más de una persona.
Algo reconocible para los humanos de un solo vistazo, pero que implica todo un proceso para las máquinas. En primer lugar el algoritmo divide a cada persona en seis secciones: cara, cabeza, parte superior de la cabeza, cuello, torso y brazos. Este método es un ejemplo de investigación por partes y atributos, que se analizan de forma individual primero y después como la suma de todas ellas, incluyendo cortes de pelo, tintes, accesorios, maquillaje, joyas o tatuajes. El sistema analiza además otros factores como los colores y texturas.
A partir de ahí los datos hacen el trabajo, etiquetando las fotos según la tribu urbana que el equipo entiende que representan -hipsters, surferos, moteros, góticos, etc- mediante una técnica común de aprendizaje automático. Con este método el programa de visión artificial determinó con precisión a qué tribu urbana pertenecían en un 48 por ciento de las ocasiones. El siguiente paso será comprobar el acierto humano con la misma galería de imágenes.
Paralelamente, los investigadores de la UC San Diego están trabajando con Lubomir Bourdev, de la Universidad de Berkeley, y Peter Belhumeur de Columbia, ambas en EEUU, para mejorar el análisis de los rasgos faciales y otros atributos del sistema. Entre los miembros del equipo destaca además la española Ana Cristina Murillo, de la Universidad de Zaragoza, actualmente profesora visitante en la UC San Diego.
A diferencia de otros proyectos relacionados con la Visión Artificial, en este trabajo los investigadores centraron su atención en fotos grupales en lugar de individuales, con la esperanza de captar mejor las señales sociales, tales como ropa y peinados, para determinar las tribus en función de aquellos elementos coincidentes en más de una persona.
Algo reconocible para los humanos de un solo vistazo, pero que implica todo un proceso para las máquinas. En primer lugar el algoritmo divide a cada persona en seis secciones: cara, cabeza, parte superior de la cabeza, cuello, torso y brazos. Este método es un ejemplo de investigación por partes y atributos, que se analizan de forma individual primero y después como la suma de todas ellas, incluyendo cortes de pelo, tintes, accesorios, maquillaje, joyas o tatuajes. El sistema analiza además otros factores como los colores y texturas.
A partir de ahí los datos hacen el trabajo, etiquetando las fotos según la tribu urbana que el equipo entiende que representan -hipsters, surferos, moteros, góticos, etc- mediante una técnica común de aprendizaje automático. Con este método el programa de visión artificial determinó con precisión a qué tribu urbana pertenecían en un 48 por ciento de las ocasiones. El siguiente paso será comprobar el acierto humano con la misma galería de imágenes.
Paralelamente, los investigadores de la UC San Diego están trabajando con Lubomir Bourdev, de la Universidad de Berkeley, y Peter Belhumeur de Columbia, ambas en EEUU, para mejorar el análisis de los rasgos faciales y otros atributos del sistema. Entre los miembros del equipo destaca además la española Ana Cristina Murillo, de la Universidad de Zaragoza, actualmente profesora visitante en la UC San Diego.
Aplicaciones
Para definir las tribus urbanas en el estudio, los científicos recurrieron a Wikipedia, seleccionando las ocho categorías más populares en el apartado de subculturas de la enciclopedia online, algunas de ellas de índole internacional y otras más comunes en Estados Unidos. No faltan en la lista los moteros, góticos, countrys, heavys, hiphoperos, hipters, ravers o surferos. También incluyeron fotografías de tres categorías habituales para locales sociales: eventos formales, discotecas y pubs.
Como consecuencia de su investigación, el equipo ha elaborado una amplia base de datos de tribus urbanas con cientos de imágenes, que tienen previsto poner a disposición de otros grupos de investigación.
Pero sobre todo, una herramienta de este tipo sería de gran utilidad por ejemplo para generar los resultados de búsqueda y anuncios más relevantes para cada tribu, lo que permitiría a las redes sociales ofrecer mejores recomendaciones y contenido. Asimismo, hay un creciente interés en el análisis de imágenes de cámaras instaladas en espacios públicos para identificar grupos en lugar de individuos, otra salida exponencial para el algoritmo.
Para definir las tribus urbanas en el estudio, los científicos recurrieron a Wikipedia, seleccionando las ocho categorías más populares en el apartado de subculturas de la enciclopedia online, algunas de ellas de índole internacional y otras más comunes en Estados Unidos. No faltan en la lista los moteros, góticos, countrys, heavys, hiphoperos, hipters, ravers o surferos. También incluyeron fotografías de tres categorías habituales para locales sociales: eventos formales, discotecas y pubs.
Como consecuencia de su investigación, el equipo ha elaborado una amplia base de datos de tribus urbanas con cientos de imágenes, que tienen previsto poner a disposición de otros grupos de investigación.
Pero sobre todo, una herramienta de este tipo sería de gran utilidad por ejemplo para generar los resultados de búsqueda y anuncios más relevantes para cada tribu, lo que permitiría a las redes sociales ofrecer mejores recomendaciones y contenido. Asimismo, hay un creciente interés en el análisis de imágenes de cámaras instaladas en espacios públicos para identificar grupos en lugar de individuos, otra salida exponencial para el algoritmo.