La ingeniería lingüística es el tratamiento de la lengua desde el punto de vista de la ingeniería informática, explica en esta entrevista el profesor del Departamento de Inteligencia Artificial de la Facultad de Informática de la Universidad Politécnica de Madrid, Jesús Cardeñosa.
Añade que la ingeniería lingüística es una disciplina que está muy avanzada a nivel de laboratorio, pero que no está muy presente en el mercado porque es difícil encontrar personas que sean al mismo tiempo lingüistas e ingenieros informáticos.
Esto ha llevado a Jesús Cardeñosa a preparar un Master en Ingeniería Lingüística que enseñe a los alumnos estadística, algorítmica y lingüística.
Explica asimismo Cardeñosa que la ingeniería lingüística es tremendamente útil para buscar información concreta en medio de un volumen considerable de textos.
Para que la búsqueda sea precisa, es necesario desarrollarla en entornos controlados. El problema de los actuales buscadores de Internet es que operan en espacios abiertos, donde todo el mundo pone contenidos y donde abunda también la basura informativa.
Por eso considera necesario introducir inteligencia en los sistemas de búsqueda de información, ya que hay tecnologías que lo permiten y que cualquiera puede demandar que se apliquen a los campos más diversos.
Señala Cardeñosa que su equipo ha desarrollado ya un extractor terminológico, usado ya en universidades, que se puede aplicar a todas las fuentes de información sobre las que queramos saber algo. Este extractor permite conocer qué y dónde se habla de una persona o empresa en millones de documentos en un reducido espacio de tiempo.
En la misma línea, su equipo está desarrollando una herramienta de ingeniería lingüística para medios de comunicación, que permite encontrar en un montón de periódicos y revistas qué se dice de una persona o empresa y en qué medios, y facilitar así la labor de clipping para empresas e instituciones.
Añade que su equipo está en condiciones de desarrollar motores de búsqueda a medida en entornos controlados.
Refiriéndose a Google, señala que muestra demasiada información inútil porque opera en un entorno abierto como es Internet, a pesar de que introduce algo de inteligencia para destacar páginas que estén referenciadas por otras fuentes. También es verdad, añade, que luego salen en primer lugar los que han pagado, por lo que Google es un motor de búsqueda condicionado por criterios comerciales.
Por último, indica que hay que introducir inteligencia en los motores de búsqueda para perfeccionar las búsquedas y hacerlas más precisas. Hoy no hay un buscador que responda a la pregunta de dónde nació Picasso, sin embargo, si la búsqueda se realiza en un contexto limitado, aunque sea de millones de documentos, el buscador puede ofrecer la respuesta.
Añade que la ingeniería lingüística es una disciplina que está muy avanzada a nivel de laboratorio, pero que no está muy presente en el mercado porque es difícil encontrar personas que sean al mismo tiempo lingüistas e ingenieros informáticos.
Esto ha llevado a Jesús Cardeñosa a preparar un Master en Ingeniería Lingüística que enseñe a los alumnos estadística, algorítmica y lingüística.
Explica asimismo Cardeñosa que la ingeniería lingüística es tremendamente útil para buscar información concreta en medio de un volumen considerable de textos.
Para que la búsqueda sea precisa, es necesario desarrollarla en entornos controlados. El problema de los actuales buscadores de Internet es que operan en espacios abiertos, donde todo el mundo pone contenidos y donde abunda también la basura informativa.
Por eso considera necesario introducir inteligencia en los sistemas de búsqueda de información, ya que hay tecnologías que lo permiten y que cualquiera puede demandar que se apliquen a los campos más diversos.
Señala Cardeñosa que su equipo ha desarrollado ya un extractor terminológico, usado ya en universidades, que se puede aplicar a todas las fuentes de información sobre las que queramos saber algo. Este extractor permite conocer qué y dónde se habla de una persona o empresa en millones de documentos en un reducido espacio de tiempo.
En la misma línea, su equipo está desarrollando una herramienta de ingeniería lingüística para medios de comunicación, que permite encontrar en un montón de periódicos y revistas qué se dice de una persona o empresa y en qué medios, y facilitar así la labor de clipping para empresas e instituciones.
Añade que su equipo está en condiciones de desarrollar motores de búsqueda a medida en entornos controlados.
Refiriéndose a Google, señala que muestra demasiada información inútil porque opera en un entorno abierto como es Internet, a pesar de que introduce algo de inteligencia para destacar páginas que estén referenciadas por otras fuentes. También es verdad, añade, que luego salen en primer lugar los que han pagado, por lo que Google es un motor de búsqueda condicionado por criterios comerciales.
Por último, indica que hay que introducir inteligencia en los motores de búsqueda para perfeccionar las búsquedas y hacerlas más precisas. Hoy no hay un buscador que responda a la pregunta de dónde nació Picasso, sin embargo, si la búsqueda se realiza en un contexto limitado, aunque sea de millones de documentos, el buscador puede ofrecer la respuesta.
JESÚS CARDEÑOSA
Jesús Cardeñosa, Ingeniero Aeronáutico y Master de Ingeniería del Conocimiento, es profesor del Departamento de Inteligencia Artificial de la Facultad de Informática de la Universidad Politécnica de Madrid y Director del Grupo de Investigación en Validación y Aplicaciones Industriales. Desde1996 representa a la lengua española en el proyecto de la Universidad de las Naciones Unidas UNL para crear sistemas de soporte al multilingüismo en Internet. Cardeñosa es socio fundador de Dail Software, empresa tecnológica surgida de la UPM con la misión de crear aplicaciones informáticas para el tratamiento automatizado de la lengua y facilitar el trabajo de lexicógrafos, traductores, documentalistas, investigadores y profesores de lenguas con un énfasis especial en la lengua española y en especial de empresas de gestión documental, análisis de reputación, corrección de estilo, etc. Ha sido recientemente nombrado Director de la Catedra UNESCO TECLIN (Tecnologias Linguisticas) de la Universidad Politécnica de Madrid, con un proyecto dedicado a generar textos escolares en lenguas indígenas de América Latina por medio de las más avanzadas tecnologías. Jesús Cardeñosa es el editor del blog Inteligencia Artificial de Tendencias21.