Bitácora
Los métodos para detectar el sentido de opiniones de una manera más o menos automática son objeto de investigación en todo el mundo. Una vuelta de tuerca es la detección no del sentido, si no de las razones de una opinión. La detección automática de argumentos de opiniones es un problema pendiente de resolución.
Antes de pasar a seguir contándoles el “inventario” que interrumpí por los comentarios derivados del accidente ferroviario, quiero aprovechar mis últimos comentarios sobre la tecnología como soporte de los sistemas democráticos en el futuro cercano, para contarles algo en lo que mi grupo de investigación está involucrado hace dos o tres años por invitación del prestigioso investigador José María Moreno Jiménez de la universidad de Zaragoza, uno de los mayores expertos españoles en el tema de la “e-democracy” es decir, la democracia electrónica. Cuando empezamos la colaboración, él junto a sus colaboradores habían conseguido diseñar unos modelos matemáticos para estimar las tendencias de voto, o tendencias de opinión a partir de foros de opinión en la que los usuarios esbozaban unas opiniones en base a unos parámetros.
Sin embargo, él tenía la intuición de que si complementase su modelo con técnicas de “text mining” (minería de textos) los resultados podrían mejorar sustancialmente. El problema cuando nos lo planteó pareció más sencillo de lo que luego fue. El lenguaje utilizado en los foros, más que un tipo de jerga es errático y mal escrito, la ortografía brilla por su ausencia y la redacción de los comentarios es muy pobre. A pesar de ello, utilizamos técnicas casi del único tipo que las conocidas hasta ese momento para este tipo de cosas [este “tipo de cosas” se denomina genéricamente “sentiment analysis” cuya traducción más certera sería “análisis de opinión”.] Los resultados fueron interesantes. Todos están publicados (si buscan bibliografía reciente con nuestros nombres les saldrán cosas). En resumen, más del 80% de las opiniones vertidas eran detectadas correctamente por el sistema de minería de textos cuando la opinión era positiva. Muchas menos (menos del 40%) de las opiniones negativas eran correctamente captadas por el modelo nuestro. Es una cuestión curiosa pues parece como si las personas al tener que explicar una opinión, no fueran demasiado agresivas (marcando poco la negatividad) si eran negativas y sin embargo el voto luego era negativo. Es todo un tema a seguir estudiando.
Sin embargo, las aproximaciones basadas en procesamiento del lenguaje natural son difíciles de aplicar a estos foros, donde como ya hemos comentado el lenguaje es tan incorrecto y tan errático que a veces ni siquiera una lectura directa por una persona es capaz de entender bien el sentido de una opinión allí vertida.
La siguiente vuelta de tuerca donde José María Moreno nos sugirió trabajar era algo mucho más difícil aún. Ya no íbamos a ir a buscar el sentido de unas opiniones sino las razones que sustentan una opinión. Que en definitiva es lo que puede interesar a un político para saber por qué un ciudadano está de acuerdo o en desacuerdo con una medida, o una empresa para saber por qué un producto se vende o no se vende. Es un paso más allá donde las dificultades son aún extremas. Hasta el momento estamos trabajando bastante solos, en sentido de que hay muy poco escrito sobre este tema aunque se reconozca el enorme interés. Muy recientemente la revista (journal) “Computers in human behavior” ha aceptado para publicación un artículo nuestro donde al menos contamos la metodología a seguir para comenzar a estudiar estos temas. El área de trabajo la hemos denominado “arguments' extraction” o extracción de argumentos de opiniones. A pesar de todo, los primeros experimentos han resultado prometedores. Seguiremos trabajando y haciendo lo que podamos a base de nuestro tiempo. Nos ha tocado una mala época para la investigación en nuestro país. Pero seguiremos…..cuando tengamos algo más se lo iré contando.
Aunque es una cosa muy actual en nuestras investigaciones creemos que el tema es de suficiente relevancia. ¿Se imaginan ustedes que nuestros dirigentes políticos supieran las razones que motivan un voto positivo o negativo? No sé qué decirles, quizás a ellos les encantaría porque para atraer votos bastaría con prometer todo lo que saliese como carencia. Otra cosa es que tras prometerlo lo cumpliesen. Pero imaginemos por un momento que el político tiene intención real de hacer cosas acorde a los deseos de los ciudadanos, sería una de esas herramientas que comentábamos en el artículo anterior que serían bases para una democracia real. De hecho este proyecto inicial comenzó a partir de una subvención de la Diputación General de Aragón. Seguiremos trabajando, José María con sus modelos matemáticos y nosotros con nuestro modelos de Ingeniería Lingüística.
Sin embargo, él tenía la intuición de que si complementase su modelo con técnicas de “text mining” (minería de textos) los resultados podrían mejorar sustancialmente. El problema cuando nos lo planteó pareció más sencillo de lo que luego fue. El lenguaje utilizado en los foros, más que un tipo de jerga es errático y mal escrito, la ortografía brilla por su ausencia y la redacción de los comentarios es muy pobre. A pesar de ello, utilizamos técnicas casi del único tipo que las conocidas hasta ese momento para este tipo de cosas [este “tipo de cosas” se denomina genéricamente “sentiment analysis” cuya traducción más certera sería “análisis de opinión”.] Los resultados fueron interesantes. Todos están publicados (si buscan bibliografía reciente con nuestros nombres les saldrán cosas). En resumen, más del 80% de las opiniones vertidas eran detectadas correctamente por el sistema de minería de textos cuando la opinión era positiva. Muchas menos (menos del 40%) de las opiniones negativas eran correctamente captadas por el modelo nuestro. Es una cuestión curiosa pues parece como si las personas al tener que explicar una opinión, no fueran demasiado agresivas (marcando poco la negatividad) si eran negativas y sin embargo el voto luego era negativo. Es todo un tema a seguir estudiando.
Sin embargo, las aproximaciones basadas en procesamiento del lenguaje natural son difíciles de aplicar a estos foros, donde como ya hemos comentado el lenguaje es tan incorrecto y tan errático que a veces ni siquiera una lectura directa por una persona es capaz de entender bien el sentido de una opinión allí vertida.
La siguiente vuelta de tuerca donde José María Moreno nos sugirió trabajar era algo mucho más difícil aún. Ya no íbamos a ir a buscar el sentido de unas opiniones sino las razones que sustentan una opinión. Que en definitiva es lo que puede interesar a un político para saber por qué un ciudadano está de acuerdo o en desacuerdo con una medida, o una empresa para saber por qué un producto se vende o no se vende. Es un paso más allá donde las dificultades son aún extremas. Hasta el momento estamos trabajando bastante solos, en sentido de que hay muy poco escrito sobre este tema aunque se reconozca el enorme interés. Muy recientemente la revista (journal) “Computers in human behavior” ha aceptado para publicación un artículo nuestro donde al menos contamos la metodología a seguir para comenzar a estudiar estos temas. El área de trabajo la hemos denominado “arguments' extraction” o extracción de argumentos de opiniones. A pesar de todo, los primeros experimentos han resultado prometedores. Seguiremos trabajando y haciendo lo que podamos a base de nuestro tiempo. Nos ha tocado una mala época para la investigación en nuestro país. Pero seguiremos…..cuando tengamos algo más se lo iré contando.
Aunque es una cosa muy actual en nuestras investigaciones creemos que el tema es de suficiente relevancia. ¿Se imaginan ustedes que nuestros dirigentes políticos supieran las razones que motivan un voto positivo o negativo? No sé qué decirles, quizás a ellos les encantaría porque para atraer votos bastaría con prometer todo lo que saliese como carencia. Otra cosa es que tras prometerlo lo cumpliesen. Pero imaginemos por un momento que el político tiene intención real de hacer cosas acorde a los deseos de los ciudadanos, sería una de esas herramientas que comentábamos en el artículo anterior que serían bases para una democracia real. De hecho este proyecto inicial comenzó a partir de una subvención de la Diputación General de Aragón. Seguiremos trabajando, José María con sus modelos matemáticos y nosotros con nuestro modelos de Ingeniería Lingüística.
Jesús Cardeñosa
Comentarios
Sábado, 7 de Septiembre 2013
Tags :
análisis de foros de opinión
information extraction
opinion mining
sentiment analysis
text mining
Editado por
Jesús Cardeñosa
El Profesor Jesús Cardeñosa es Ingeniero Aeronáutico por la Universidad Politécnica de Madrid, así como Master de Ingeniería del Conocimiento. Desde 1988 desarrolla su trabajo en el Departamento de Inteligencia Artificial de la Facultad de Informática de la Universidad Politécnica de Madrid, de la que en la actualidad es profesor titular y Director del Grupo de Validación y Aplicaciones Industriales. Desde1996 representa a la lengua española en el proyecto de la Universidad de las Naciones Unidas UNL (Universal Networking Language) para crear sistemas de soporte al multilingüismo en Internet. Miembro del Consejo Editorial de Tendencias21 desde sus orígenes, Jesús Cardeñosa forma en la actualidad un consorcio internacional con varios países de Latinoamérica para generar textos escolares en lenguas indígenas. Aparte de diversos proyectos nacionales e internacionales, su dedicación actual es impulsar la catedra UNESCO para utilizar tecnologias avanzadas en la generación de contenidos multilingües destinados a la educacion de comunidades indigenas.
Secciones
Últimos apuntes
Archivo
Enlaces
Blog Inteligencia Artificial de Tendencias21