Los estados de Facebook delatan la edad, sexo y personalidad de los usuarios

Se comprobó mediante un análisis informático del lenguaje empleado en actualizaciones


Investigadores de la Universidad de Pensilvania, en Estados Unidos, han sometido las actualizaciones de estado de 75.000 personas en Facebook a un análisis informático que ha permitido predecir su edad, sexo e incluso el tipo de personalidad basándose únicamente en las palabras que usaron. El éxito de la investigación abre las puertas a nuevos modelos de estudios psicológicos que sustituirán las tradicionales encuestas por el reclutamiento de voluntarios anónimos en las redes sociales. Por Patricia Pérez.


Patricia Pérez
02/10/2013

Nubes de palabras más comunes en las actualizaciones de Facebook entre mayores de 30 años. Fuente: UPenn
El concepto de vida privada es cada vez más difícil de delimitar, sobre todo una vez que se accede al floreciente universo de las redes sociales. Aunque muchos usuarios se guarden de exponer ciertos datos personales, el simple hecho de comunicarse por esta vía puede revelar mucho más de lo que parece. Y es que si hace unos meses se descubría que de los ‘Me gusta’ de la red social se podía deducir la etnia, orientación sexual o ideología de un usuario, ahora basta con decir unas palabras.

Esa es la conclusión a la que ha llegado un grupo de investigadores de la Universidad de Pensilvania (UPenn) en Estados Unidos, al cuestionarse si un análisis informático del lenguaje empleado en Facebook puede proporcionar una idea sobre la personalidad de alguien más verídica que la obtenida mediante métodos tradicionales utilizados por los psicólogos, como encuestas y cuestionarios.

Según explica Upenn en un comunicado, el equipo interdisciplinar contó con 75.000 cuestionarios de personalidad respondidos voluntariamente por usuarios de Facebook a través de una aplicación de la propia red social, en la que además pusieron sus actualizaciones de estado a disposición de la investigación. A partir de ahí, los investigadores buscaron patrones lingüísticos generales en el lenguaje de los internautas.

De esta forma generaron modelos computacionales capaces de predecir la edad, el género e incluso las respuestas a los cuestionarios de personalidad realizados. Además, con una precisión sorprendente, como denota que acertaran el género de los voluntarios en el 92 por ciento de los casos, basándose únicamente en el lenguaje empleado en las actualizaciones de estado.

El estudio, publicado recientemente en la revista científica Public Library of Science (PLoS ONE), forma parte del proyecto World Well-Being (traducido como Bienestar Mundial), llevado a cabo por un grupo de investigación más amplio de UPenn que analiza el lenguaje utilizado en las redes sociales para comprender mejor la satisfacción con la vida de los internautas. Para ello contaron con la colaboración del http://www.psychometrics.cam.ac.uk/productsservices/you-are-what-you-like de la Universidad de Cambridge (Reino Unido), encargados de recoger los datos de los usuarios de Facebook.

Esquema del modelo predictivo de la personalidad basado en el lenguaje. Fuente: UPenn
Del enfoque cerrado al abierto

Esta investigación se incluye en una larga lista de análisis del lenguaje como forma de entender sentimientos y estados mentales, con la diferencia del uso del enfoque de vocabulario abierto en lugar de cerrado para examinar los datos.

Hasta ahora los psicólogos elegían una lista de palabras que consideraban señal de emoción positiva, como ‘contento’, ‘entusiasmado’ o ‘maravilloso’, para comprobar con qué frecuencia se usaban y medir así la felicidad de una persona. Es lo que se conoce como enfoque cerrado. Sin embargo, esta visión tiene varias limitaciones, entre ellas que no siempre mide lo que pretende medir.

En unos casos influye el uso de palabras o expresiones con varias acepciones, que pueden ser positivas en unos casos y negativas en otros. Otra limitación es que se basa en un conjunto de palabras fijo y preconcebido. Como consecuencia, este tipo de estudios puede confirmar que una persona deprimida usa palabras esperadas (como ‘triste’) con mayor frecuencia, pero no aporta nuevas ideas (por ejemplo, si habla menos de deportes o actividades sociales que las personas felices).

Los estudios psicológicos del lenguaje se basaban en este tipo de enfoque debido a las dificultades de aplicar el de vocabulario abierto en muestras pequeñas. Sin embargo, con los más de 700 millones de palabras, frases y temas procedentes de los estados de Facebook, los investigadores han obtenido datos suficientes para ir más allá de lo común y encontrar patrones más específicos.

Este volumen de información es fundamental para poder aplicar la técnica específica utilizada por el equipo, conocida como Análisis del lenguaje diferencial o DLA. Con ella aislaron palabras y frases agrupadas en torno a las características proporcionadas por los cuestionarios de los voluntarios: edad, sexo y rasgos personales siguiendo el Modelo de los Cinco Grandes –una teoría que se utiliza en psicología para analizar la personalidad como la composición de cinco factores: O (Openness o apertura a nuevas experiencias), C (Conscientiousness o responsabilidad), E (Extraversión o extroversión), A (Agreeableness o amabilidad) y N (Neuroticism o inestabilidad emocional).

Se eligió este modelo porque se trata de un método común y bien contrastado para cuantificar rasgos de personalidad, aunque se podría haber aplicado a modelos que miden otras características, como la depresión o la felicidad.

Nubes de palabras que comparan el lenguaje de los extrovertidos (arriba) y los introvertidos (abajo) en la red social. Fuente: UPenn
Nubes de palabras

Para visualizar los resultados, los investigadores crearon nubes de palabras asociadas con un rasgo de personalidad, de mayor tamaño a medida que son más determinantes. Así, una nube que muestra el lenguaje utilizado por extrovertidos incluye expresiones como ‘fiesta’, ‘gran noche’ y ‘chute’, mientras una sobre introvertidos contiene referencias a redes, avatares y emoticonos a la japonesa, donde prima más el anonimato en la vida virtual.

Además, para poner a prueba la precisión con que se captan los rasgos de personalidad a través de un enfoque abierto, los investigadores dividieron a los voluntarios en dos grupos para comprobar si el modelo estadístico obtenido de uno de ellos podría utilizarse para inferir los rasgos del otro. Así, con tres cuartas partes de los usuarios se usaron técnicas de aprendizaje automático para construir un modelo de palabras y frases capaces de predecir las respuestas al cuestionario. A continuación, utilizaron ese modelo para augurar la edad, el sexo y la personalidad de la cuarta parte restante, basándose en sus actualizaciones de Facebook.

De esta forma acertaron el sexo de los voluntarios en el 92 por ciento de los casos y previeron la edad en más de la mitad. “Las predicciones sobre personalidad son inherentemente menos precisas, pero son casi tan buenas como usar el resultado del cuestionario personal de un día para predecir las respuestas al mismo cuestionario otro día", matiza el investigador Andrew Schwartz.

Una vez demostrado que el enfoque abierto puede ser igual o más predictivo que el cerrado, el equipo utilizó las nubes de palabras para explorar la relación entre ciertas expresiones y la personalidad. Por ejemplo, los participantes que puntuaron bajo en la escala neurótica (es decir, los que tienen mayor estabilidad emocional) usaron más palabras que hacen referencia a actividades sociales, tales como ‘snowboard’, ‘encuentro’ o ‘baloncesto’.

“Esto no garantiza que los deportes hagan a la gente menos neurótica; podría ser que el neuroticismo propicie que se evite su práctica", señala el profesor Lyle Ungar. “Pero sí sugiere que debemos explorar la posibilidad de que los individuos neuróticos serían más estables emocionalmente si practicaran más deporte”, añade.

Con la construcción de un modelo predictivo de la personalidad basado en el lenguaje de las redes sociales, los investigadores pueden acercarse ahora más fácilmente a tales preguntas. Esto cambiará además las herramientas de estudio en el futuro, sustituyendo las encuestas tradicionales por el reclutamiento de voluntarios anónimos en Facebook o Twitter. Se abre así una nueva ventana que refleja la vida en la era de las redes sociales.



Patricia Pérez
Artículo leído 7654 veces



Más contenidos