Una plataforma analiza automáticamente las opiniones sobre productos vertidas en la Red

Investigadores del grupo SINAI de la Universidad de Jaén. Fuente: Fundación Descubre.

Un equipo del grupo de Sistemas Inteligentes de Acceso a la Información (SINAI) de la Universidad de Jaén, junto con las universidades de Sevilla y Alicante, ha desarrollado una plataforma de monitorización de opinión en la web basada en Tecnologías del Lenguaje Humano (TLH).

Los expertos aplican técnicas computacionales para analizar los textos de forma que extraen si se vierte una opinión positiva, negativa o neutra sobre el tema que analicen, como un hotel o un nuevo producto.

“Esto implica que el sistema es capaz de procesar de manera automática el lenguaje. No resulta una tarea fácil, porque la plataforma debe comprender lo que lee y detectar la ambigüedad o la ironía, pero tiene la capacidad automática de discernir si un fragmento de texto expresa un sentimiento positivo o negativo”, aclara el responsable de la investigación Luis Alfonso Ureña, de la Universidad de Jaén, en una nota de prensa de la Fundación Descubre, de la que se hace eco Sinc.

Los investigadores han creado ATTOS, la plataforma de monitorización de la Web 2.0 que genera información sobre tendencias de opinión relacionadas con un tema. Los expertos han identificado dos posibles escenarios donde aplicar su sistema para tomar decisiones: el análisis de mercados y el turismo. De hecho, el sistema podría ayudar a instituciones o empresas a tomar decisiones estratégicas.

“Nuestro sistema podría responder a qué se está opinando sobre un nuevo producto disponible en el mercado o cuál es la evolución de esa opinión, si existen diferencias de opinión en distintas regiones del país. En cuanto al turismo, detectaría cuál es la imagen que tienen de una ciudad sus visitantes o cuál es la opinión sobre la oferta hostelera”, apunta el investigador.

Algunas de las técnicas se han aplicado para analizar y clasificar opiniones positivas, negativas o neutras de los usuarios de Twitter, según un estudio que publica la revista Computer Speech and Language.

A la dificultad de detectar los matices de la lengua, se suma la multitud de canales estudiados. "La Web 2.0 y los medios sociales posibilitan que cualquier usuario pueda publicar sus propios contenidos, con su propio punto de vista sobre un tema. En estos nuevos canales de información predomina el lenguaje espontáneo, como son los diferentes registros de uso con diferentes grados de formalidad/informalidad”, explica el investigador.

Por eso, el análisis comienza seleccionando las fuentes donde reside la opinión, como foros o medios sociales. Procesan una ingente cantidad de datos no estructurados. De esta forma, disponen de un gran volumen de información digital en el que se combinan múltiples lenguas y registros de uso con diferentes grados de formalidad (formal/informal) y especialización, emitidos desde diferentes actitudes subjetivas y desde diferentes situaciones de espacio y tiempo.

Sistemas inteligentes

“Todo ello debe ser analizado y comprendido por sistemas inteligentes, teniendo en cuenta parámetros como la intensidad de la opinión, ubicación geográfica y perfil de usuario, entre otros factores, para su adecuada explotación por organizaciones y particulares”, indica el investigador. A continuación seleccionan los textos relevantes y construyen colecciones de datos para evaluar los sentimientos de forma automática.

La creciente presencia de opiniones en internet conlleva que cada vez es mayor el número de usuarios que consultan información sobre un determinado servicio, producto, empresa o persona. “Nos fiamos más de los comentarios de los usuarios que los de una agencia de viajes, por ejemplo, porque se acercan más a la realidad que la fuente más institucional”, reconoce Ureña.

Según exponen las investigadores, se crea así una comunidad generadora de información constituida tanto por personas anónimas como por personalidades, instituciones y empresas de todo tipo que han adoptado estas formas de comunicación con objetivos claros que van más allá del simple entretenimiento.

Referencia bibliográfica:

Montejo-Raez, A.; Martinez-Camara, E.; Martin-Valdivia, MT.; Urena-Lopez, LA. Ranked Word Net graph for Sentiment Polarity Classification in Twitter. Computer Speech and Language (2014). DOI: 10.1016/j.csl.2013.04.001.

Una plataforma analiza automáticamente las opiniones sobre productos vertidas en la Red

Se basa en tecnologías del lenguaje humano

{{date}} {{title}}