La nueva aplicación de voz puede ayudar a controlar el peso

Un elemento clave de la pérdida de peso es contar cada caloría consumida. Si bien la tarea parece fácil, documentar todas las calorías se convierte en una tarea difícil cuando se cena en un restaurante, se come bocadillos sobre la marcha o incluso cuando se sienta a comer en casa.

La técnica requiere consistencia y precisión, y cuando falla, generalmente se debe a que las personas no tienen el tiempo o los medios para encontrar y registrar toda la información que necesitan.

Ahora, investigadores del Instituto de Tecnología de Massachusetts (MIT) han desarrollado una aplicación que permite a las personas iniciar sesión en los alimentos y bebidas que consumieron mediante un sistema controlado por voz.

El concepto surgió hace unos años cuando un equipo de nutricionistas de la Universidad de Tufts se acercó a los investigadores del MIT con la idea de una aplicación de lenguaje hablado que facilitaría el registro de comidas.

Esta semana, en la Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales en Shanghai, los investigadores del MIT están presentando su prototipo basado en la Web de un sistema de registro de nutrición controlado por voz.

Con él, el usuario describe verbalmente el contenido de una comida, y el sistema analiza la descripción y recupera automáticamente los datos nutricionales pertinentes de una base de datos en línea mantenida por el Departamento de Agricultura de EE. UU. (USDA).

Los datos se muestran junto con imágenes de los alimentos correspondientes y menús desplegables que permiten al usuario refinar sus descripciones, seleccionando, por ejemplo, cantidades precisas de alimentos. Pero esos refinamientos también se pueden hacer verbalmente.

Un usuario que comienza diciendo: "Para el desayuno, tomé un tazón de avena, plátanos y un vaso de jugo de naranja", puede realizar la enmienda "Tomé medio plátano" y el sistema actualizará los datos que muestra. sobre los plátanos, dejando el resto sin cambios.

"Lo que [los nutricionistas de Tufts] han experimentado es que las aplicaciones que estaban disponibles para ayudar a las personas a intentar registrar las comidas solían ser un poco tediosas y, por lo tanto, la gente no las seguía", dice James Glass, investigador principal .

"Así que buscaban formas precisas y fáciles de introducir información".

La primera autora del nuevo artículo es Mandy Korpusik, una estudiante graduada del MIT en ingeniería eléctrica e informática. A ella se une Glass, que es su asesor de tesis; su compañero de estudios de posgrado Michael Price; y por Calvin Huang, investigador universitario del grupo de Glass.

En el documento, los investigadores informan los resultados de experimentos con un sistema de reconocimiento de voz que desarrollaron específicamente para manejar la terminología relacionada con los alimentos.

Sin embargo, ese no fue el enfoque principal de su trabajo, ya que la demostración en línea de su sistema de registro de comidas utiliza la aplicación gratuita de reconocimiento de voz de Google.

Su investigación se concentró en otros dos problemas. Uno es identificar la función funcional de las palabras: el sistema debe reconocer que si el usuario registra la frase "tazón de avena", la información nutricional sobre la avena es pertinente, pero si la frase es "galleta de avena", no lo es.

El otro problema es conciliar la redacción del usuario con las entradas en la base de datos del USDA. Por ejemplo, los datos del USDA sobre la avena se registran bajo el título "avena"; la palabra "avena" no aparece en ninguna parte de la entrada.

Para abordar el primer problema, los investigadores utilizaron el aprendizaje automático.

A través de la plataforma de crowdsourcing de Amazon Mechanical Turk, reclutaron trabajadores que simplemente describieron lo que habían comido en comidas recientes. Luego etiquetaron las palabras pertinentes en la descripción como nombres de alimentos, cantidades, nombres de marca o modificadores de los nombres de los alimentos.

En "tazón de avena", "tazón" es una cantidad y "avena" es un alimento, pero en "galleta de avena", la avena es un modificador.

Una vez que tuvieron aproximadamente 10,000 descripciones de comidas etiquetadas, los investigadores utilizaron algoritmos de aprendizaje automático para encontrar patrones en las relaciones sintácticas entre palabras que identificarían sus roles funcionales.

Luego, los investigadores utilizaron una base de datos de código abierto llamada Freebase para traducir entre las descripciones de los usuarios y las etiquetas en la base de datos del USDA. La base de datos en sí tiene entradas sobre más de 8.000 alimentos comunes, muchos de los cuales incluyen sinónimos.

Cuando faltaban sinónimos, nuevamente reclutaron trabajadores de Mechanical Turk para que los proporcionaran.

La versión del sistema presentada en la conferencia está destinada principalmente a demostrar la viabilidad de su enfoque del procesamiento del lenguaje natural. El sistema informa los recuentos de calorías, pero aún no los totaliza automáticamente.

Sin embargo, se está trabajando en una versión que sí lo haga, y cuando esté completa, los investigadores de Tufts planean realizar un estudio de usuarios para determinar si realmente facilita el registro de nutrición.

Fuente: MIT

!-- GDPR -->