Las redes sociales manejan información de personas que no las usan

Investigadores de la Universidad de Heidelberg consiguen deducir relaciones entre individuos no registrados en estos medios, a partir de datos de los usuarios


Cuando a una persona que se registra en una red social le piden acceso a su agenda de contactos de e-mail, están obteniendo datos de gente que no ha dado su consentimiento. Con este tipo de información, científicos de la Universidad de Heidelberg, en Alemania, han conseguido, mediante aprendizaje automático, deducir relaciones entre individuos no-miembros de redes sociales. Por Carlos Gómez Abajo.


02/05/2012

Las relaciones entre no-miembros cuyo e-mail ha sido revelado por un miembro (líneas rojas) pueden deducirse a partir de las relaciones entre miembros (líneas negras) y las relaciones de miembros con no-miembros (líneas verdes). Imagen: Ágnes Horvát (IWR).
¿Qué pueden saber las redes sociales de Internet acerca de las personas que son amigos de sus miembros, pero no tienen un perfil de usuario propio? Investigadores del Centro Interdisciplinario de Computación Científica (IWR) de la Universidad de Heidelberg han estudiado esta cuestión.

Su trabajo muestra que, a través de herramientas de análisis de redes y aprendizaje automático, de las relaciones entre los miembros y los patrones de conexión con no-miembros se pueden extraer conclusiones sobre estos últimos.

Utilizando datos de contacto es posible, bajo ciertas condiciones, predecir correctamente que dos no-miembros se conocen entre sí, con aproximadamente un 40% de probabilidad.

En una nota de prensa emitida por dicho Centro se explica que, mediante algoritmos de predicción adecuados, el análisis computacional puede obtener gran cantidad de datos. En una red social, la información no divulgada por un miembro, como la orientación sexual o las preferencias políticas, se puede "calcular" con un alto grado de exactitud, si un número suficiente de sus amigos proporcionaron dicha información sobre sí mismos.

"Una vez se conocen las amistades confirmadas, la predicción de ciertas propiedades desconocidas ya no es un gran desafío para el aprendizaje de una máquina", afirma el profesor Fred Hamprecht, co-fundador de la Colaboración Heidelberg para Procesamiento de Imágenes (HCI).

Hasta ahora este tipo de estudios se restringía a los usuarios de redes sociales, es decir, personas con un perfil de usuario publicado que aceptaron las condiciones de privacidad. "Los no-miembros, sin embargo, no tienen ningún acuerdo de este tipo. Por ello, estudiamos su vulnerabilidad a la generación automática de los denominados “perfiles en la sombra", explica la profesora Katharina Zweig, quien hasta hace poco trabajó en el IWR.

En una red social online es posible inferir información acerca de los no miembros, por ejemplo mediante el uso de las denominadas aplicaciones busca-amigos. Cuando un nuevos miembro de Facebook se registra, se le pide que ponga a disposición la lista completa de contactos de correo electrónico, incluso de aquellas personas que no son miembros de Facebook.

"Este conocimiento muy básico de que quién está relacionado con quién tanto dentro como fuera de la red puede ser utilizado para deducir una parte sustancial de las relaciones entre los no-miembros ", explica Agnes Horvat, que realiza investigaciones en el IWR.

Perfil de Facebook. Fuente: Flickr.
Aprendizaje automático

Para hacer sus cálculos, los investigadores de Heidelberg utilizaron un procedimiento estándar de aprendizaje automático basado en las propiedades de las redes.

Como los datos necesarios para el estudio no eran de libre acceso, los investigadores trabajaron con redes de amistad de Facebook reales y anónimas.

La división entre los miembros y no-miembros se simuló mediante una amplia gama posible de modelos. Usando ordenadores normales los investigadores fueron capaces de calcular en tan sólo unos días cuáles de los no-miembros era más probable que fueran amigos de otros no-miembros.

Los científicos de Heidelberg se quedaron asombrados de que todos los métodos de simulación produjeron el mismo resultado cualitativo. "Basándonos en hipótesis realistas sobre el porcentaje de población que pertenece a una red social y la probabilidad con la que subirán sus agendas de correo electrónico, los cálculos nos permitieron predecir con precisión del 40% las relaciones entre los no-miembros." Según Michael Hanselmann, de la HCI, esto es 20 veces más que lo que se consigue adivinando al azar.

"Nuestra investigación dejó claro el potencial de las redes sociales para inferir información acerca de los no-miembros. Los resultados también sorprendentes, ya que se basan en meros datos de contacto", subraya Hamprecht.

Muchas plataformas de redes sociales, además, tienen muchos más datos sobre los usuarios, tales como edad, ingresos, educación, o donde viven. Con estos datos, y con una infraestructura técnica adecuada, los investigadores creen que la precisión de la predicción podría mejorarse significativamente.

"En general nuestro proyecto pone de manifiesto que, como sociedad, tenemos que llegar a un acuerdo acerca de hasta qué punto pueden usarse los datos sobre relaciones de personas que no han prestado su consentimiento para ello", concluye el profesor Zweig.



Artículo leído 10978 veces



Más contenidos