El prototipo permite describir verbalmente el contenido de una comida. Ilustración: José Luis Olivares / MIT
Perder peso es uno de los propósitos más populares, una meta que requiere de mucha constancia y precisión. En los últimos años la tecnología ha facilitado la tarea con aplicaciones que tratan de suplir o complementar la labor de un nutricionista o un entrenador personal. Por ejemplo, registrando la cantidad de calorías consumidas y otra información nutricional de cada comida. Sin embargo, los usuarios de estas herramientas no siempre tienen el tiempo necesario para encontrar y registrar toda la información requerida, por lo que acaban desistiendo.
Ahora, el trabajo conjunto de un equipo de nutricionistas de la Universidad de Tufts e investigadores del Laboratorio de Informática e Inteligencia Artificial (CSAIL) del Instituto Tecnológico de Massachusetts (MIT), ambos en Estados Unidos, podría facilitar el proceso. Los primeros comenzaron a experimentar hace unos años con aplicaciones móviles para el registro de la ingesta calórica, pero su idea iba más allá, al pretender que la información se pudiera registrar mediante el lenguaje hablado. De ello se han encargado los segundos, creando un prototipo controlado por voz.
El funcionamiento es sencillo, según explica el MIT en un comunicado. El usuario describe verbalmente el contenido de una comida y el sistema analiza la descripción, recuperando automáticamente los datos nutricionales correspondientes desde una base de datos online mantenida por el Departamento de Agricultura de EEUU (USDA).
Los resultados se muestran acompañados por imágenes de la comida y menús desplegables que se pueden editar, para precisar por ejemplo las porciones exactas de cada alimento. Unas mejoras que también se pueden hacer verbalmente. Así, si el usuario comienza diciendo que para el desayuno tomó un tazón de cereales, plátanos y un zumo de naranja, después puede añadir que sólo tomó la mitad de un plátano; el sistema actualizará la información que muestra sobre los plátanos, dejando el resto sin cambios.
De esta forma se presenta una herramienta más intuitiva que las disponibles hasta el momento, que no sólo requieren tiempo, sino también paciencia, pues en algunos casos no tienen registrada la preparación de las comidas, por lo que debe completarse la información de forma manual. Al introducir los datos por voz, la actualización será mucho más fácil y precisa.
Ahora, el trabajo conjunto de un equipo de nutricionistas de la Universidad de Tufts e investigadores del Laboratorio de Informática e Inteligencia Artificial (CSAIL) del Instituto Tecnológico de Massachusetts (MIT), ambos en Estados Unidos, podría facilitar el proceso. Los primeros comenzaron a experimentar hace unos años con aplicaciones móviles para el registro de la ingesta calórica, pero su idea iba más allá, al pretender que la información se pudiera registrar mediante el lenguaje hablado. De ello se han encargado los segundos, creando un prototipo controlado por voz.
El funcionamiento es sencillo, según explica el MIT en un comunicado. El usuario describe verbalmente el contenido de una comida y el sistema analiza la descripción, recuperando automáticamente los datos nutricionales correspondientes desde una base de datos online mantenida por el Departamento de Agricultura de EEUU (USDA).
Los resultados se muestran acompañados por imágenes de la comida y menús desplegables que se pueden editar, para precisar por ejemplo las porciones exactas de cada alimento. Unas mejoras que también se pueden hacer verbalmente. Así, si el usuario comienza diciendo que para el desayuno tomó un tazón de cereales, plátanos y un zumo de naranja, después puede añadir que sólo tomó la mitad de un plátano; el sistema actualizará la información que muestra sobre los plátanos, dejando el resto sin cambios.
De esta forma se presenta una herramienta más intuitiva que las disponibles hasta el momento, que no sólo requieren tiempo, sino también paciencia, pues en algunos casos no tienen registrada la preparación de las comidas, por lo que debe completarse la información de forma manual. Al introducir los datos por voz, la actualización será mucho más fácil y precisa.
Retos
Aunque los investigadores del MIT han desarrollado un sistema de reconocimiento de voz específico para manejar terminología relacionada con la alimentación, ese no ha sido el foco principal de su trabajo. De hecho, una demostración online de la herramienta utiliza en su lugar una aplicación gratuita de reconocimiento de voz de Google.
La investigación se centró por contra en otros dos problemas. Por un lado el rol funcional de la identificación de palabras, de forma que el sistema reconozca qué información es pertinente en cada ocasión. De otra parte debía conciliar las entradas del usuario con las contenidas en la base de datos del USDA.
Para abordar el primer problema, los investigadores utilizaron el aprendizaje automático. A través de la plataforma de crowdsourcing de Amazon Mechanical Turk, reclutaron trabajadores que simplemente debían describir sus comidas más recientes, marcando a continuación qué palabra correspondía con el nombre del alimento, cual a la cantidad o la marca, y así sucesivamente. Una vez que consiguieron etiquetar unas 10.000 descripciones de comidas, utilizaron algoritmos de aprendizaje automático para encontrar patrones en las relaciones sintácticas entre las palabras que identificarían los roles funcionales.
Para poder combinar las descripciones de los usuarios con las etiquetas de la base de datos, los investigadores recurrieron a Freebase, una comunidad de usuarios que mediante sus contribuciones crean bases de datos abiertas de diferentes temáticas, entre ellas la alimenticia. Esta cuenta con más de 8.000 alimentos comunes, muchos de los cuales incluyen sinónimos. Donde faltaban, una vez más recurrieron a trabajadores reclutados en Mechanical Turk para aportarlos.
Aunque los investigadores del MIT han desarrollado un sistema de reconocimiento de voz específico para manejar terminología relacionada con la alimentación, ese no ha sido el foco principal de su trabajo. De hecho, una demostración online de la herramienta utiliza en su lugar una aplicación gratuita de reconocimiento de voz de Google.
La investigación se centró por contra en otros dos problemas. Por un lado el rol funcional de la identificación de palabras, de forma que el sistema reconozca qué información es pertinente en cada ocasión. De otra parte debía conciliar las entradas del usuario con las contenidas en la base de datos del USDA.
Para abordar el primer problema, los investigadores utilizaron el aprendizaje automático. A través de la plataforma de crowdsourcing de Amazon Mechanical Turk, reclutaron trabajadores que simplemente debían describir sus comidas más recientes, marcando a continuación qué palabra correspondía con el nombre del alimento, cual a la cantidad o la marca, y así sucesivamente. Una vez que consiguieron etiquetar unas 10.000 descripciones de comidas, utilizaron algoritmos de aprendizaje automático para encontrar patrones en las relaciones sintácticas entre las palabras que identificarían los roles funcionales.
Para poder combinar las descripciones de los usuarios con las etiquetas de la base de datos, los investigadores recurrieron a Freebase, una comunidad de usuarios que mediante sus contribuciones crean bases de datos abiertas de diferentes temáticas, entre ellas la alimenticia. Esta cuenta con más de 8.000 alimentos comunes, muchos de los cuales incluyen sinónimos. Donde faltaban, una vez más recurrieron a trabajadores reclutados en Mechanical Turk para aportarlos.
Prototipo
Superados los dos retos, el resultado es un prototipo destinado principalmente a demostrar la viabilidad del procesamiento de lenguaje natural. Así, de momento se informa de la cantidad de calorías, aunque aún no se suman de forma automática. Cuando esté completa, los investigadores de Tufts tienen previsto llevar a cabo un estudio de usuarios para determinar si en efecto facilita el registro nutricional.
"El registro es de gran ayuda, pues hace que la gente sea más consciente de lo que come”, señala la investigadora de Tufs Susan Roberts. Sin embargo, lamenta lo “tedioso” que resulta en la actualidad introducir manualmente los datos en programas como MyFitnessPal. "Un sistema de voz que se puede utilizar en el teléfono permitiría realizar el registro dondequiera que estén comiendo, con menos trabajo", añade.
Superados los dos retos, el resultado es un prototipo destinado principalmente a demostrar la viabilidad del procesamiento de lenguaje natural. Así, de momento se informa de la cantidad de calorías, aunque aún no se suman de forma automática. Cuando esté completa, los investigadores de Tufts tienen previsto llevar a cabo un estudio de usuarios para determinar si en efecto facilita el registro nutricional.
"El registro es de gran ayuda, pues hace que la gente sea más consciente de lo que come”, señala la investigadora de Tufs Susan Roberts. Sin embargo, lamenta lo “tedioso” que resulta en la actualidad introducir manualmente los datos en programas como MyFitnessPal. "Un sistema de voz que se puede utilizar en el teléfono permitiría realizar el registro dondequiera que estén comiendo, con menos trabajo", añade.