Los anuncios por megafonía suelen ser difíciles de entender. Fuente: Fraunhofer IDMT/Daniel Schmidt
La aglomeración de gente, un sistema de megafonía de dudosa calidad o la acústica del edificio pueden impedir que un anuncio se escuche correctamente, con el consiguiente perjuicio que puede ocasionar. Por ejemplo, el aviso por megafonía de la llegada de un tren a la vía de salida. Investigadores del Proyecto Group Hearing, Speech and Audio Technology del Instituto Fraunhofer en Alemania han desarrollado un software capaz de mejorar significativamente la inteligibilidad del habla, incluyendo las voces de los oradores en conferencias o durante conversaciones telefónicas.
La clave del software, al que han llamado ADAPT DRC, es el análisis continuo del ruido ambiental a través de un micrófono, lo que le permite ajustar el discurso a cada situación en tiempo real. Según explica la institución en un comunicado, en estos casos no basta con elevar el volumen y hacer más fuerte la voz por el altavoz o el teléfono móvil para ahogar el ruido. “El habla es mucho más compleja”, subraya el director del proyecto, el doctor Jan Rennies-Hochmuth.
De hecho esa tecnología ya se usa por ejemplo en las radios de coche, con el sistema SVC, que adapta el volumen del sonido en función de la velocidad y, por tanto, del ruido en el interior del vehículo. Sin embargo, eso no implica que necesariamente se entienda mejor, pues al elevar el volumen los altavoces pueden llegar al límite y comenzar a vibrar.
La clave del software, al que han llamado ADAPT DRC, es el análisis continuo del ruido ambiental a través de un micrófono, lo que le permite ajustar el discurso a cada situación en tiempo real. Según explica la institución en un comunicado, en estos casos no basta con elevar el volumen y hacer más fuerte la voz por el altavoz o el teléfono móvil para ahogar el ruido. “El habla es mucho más compleja”, subraya el director del proyecto, el doctor Jan Rennies-Hochmuth.
De hecho esa tecnología ya se usa por ejemplo en las radios de coche, con el sistema SVC, que adapta el volumen del sonido en función de la velocidad y, por tanto, del ruido en el interior del vehículo. Sin embargo, eso no implica que necesariamente se entienda mejor, pues al elevar el volumen los altavoces pueden llegar al límite y comenzar a vibrar.
Dinámica de la voz
Por el contrario, el nuevo software se centra en primer lugar en reforzar ciertos tonos y frecuencias de forma dirigida. Las vocales son componentes largos y profundos, fáciles de entender, mientras las consonantes como "p", "t" y "k" son muy cortas y tienen frecuencias más altas. A pesar de que son muy importantes para comprender el mensaje, en general cuesta entenderlas, y más en entornos ruidosos.
Para combatirlo, el algoritmo permite dar prioridad a ciertas frecuencias y reforzarlas en el momento adecuado, precisamente aquellos donde cobra más protagonismo el ruido ambiente.
En segundo lugar, el software tiene en cuenta las partes del mensaje donde la señal de voz registra diferentes volúmenes. Es lo que se conoce como dinámica de la voz, las distintas graduaciones en la intensidad del sonido, desde unos grados más fuertes a otros más suaves. En concreto, la inteligibilidad del habla aumenta cuando las partes más fuertes se suavizan y las más bajas se amplifican, lo que se consigue con la técnica de Compresión de rango dinámico (DRC). Esto también puede resultar de interés, por ejemplo, durante una conversación por teléfono móvil cuando se está en una calle ruidosa.
La aplicación ADAPT DRC ya está disponible para su uso, en principio para socios industriales. En el caso de los equipos de sonido para conferencias o teléfonos móviles más novedosos, ya cuentan con micrófonos incorporados, por lo que los dispositivos están preparados para grabar el ruido ambiente. Sin embargo, en el caso de los sistemas de megafonía de estaciones de tren o aeropuertos tendrán que instalarse primero micrófonos adicionales para hacer uso de la tecnología.
Por el contrario, el nuevo software se centra en primer lugar en reforzar ciertos tonos y frecuencias de forma dirigida. Las vocales son componentes largos y profundos, fáciles de entender, mientras las consonantes como "p", "t" y "k" son muy cortas y tienen frecuencias más altas. A pesar de que son muy importantes para comprender el mensaje, en general cuesta entenderlas, y más en entornos ruidosos.
Para combatirlo, el algoritmo permite dar prioridad a ciertas frecuencias y reforzarlas en el momento adecuado, precisamente aquellos donde cobra más protagonismo el ruido ambiente.
En segundo lugar, el software tiene en cuenta las partes del mensaje donde la señal de voz registra diferentes volúmenes. Es lo que se conoce como dinámica de la voz, las distintas graduaciones en la intensidad del sonido, desde unos grados más fuertes a otros más suaves. En concreto, la inteligibilidad del habla aumenta cuando las partes más fuertes se suavizan y las más bajas se amplifican, lo que se consigue con la técnica de Compresión de rango dinámico (DRC). Esto también puede resultar de interés, por ejemplo, durante una conversación por teléfono móvil cuando se está en una calle ruidosa.
La aplicación ADAPT DRC ya está disponible para su uso, en principio para socios industriales. En el caso de los equipos de sonido para conferencias o teléfonos móviles más novedosos, ya cuentan con micrófonos incorporados, por lo que los dispositivos están preparados para grabar el ruido ambiente. Sin embargo, en el caso de los sistemas de megafonía de estaciones de tren o aeropuertos tendrán que instalarse primero micrófonos adicionales para hacer uso de la tecnología.
Asistencia auditiva personalizada
De otra parte, el estudio ha demostrado que el nuevo software puede facilitar la comprensión a personas con discapacidad auditiva tanto de los anuncios por megafonía como de las voces en sus teléfonos móviles. Normalmente esta enfermedad afecta de forma diferente a cada persona, de ahí la necesidad de ajustar los audífonos individualmente. Sin embargo, con ADAPT RDC “nos sorprendió gratamente que parece mejorar en general su entendimiento del lenguaje hablado”, destaca Rennies-Hochmuth.
Pero no es esta la única aplicación que el grupo de estudio alemán ha dedicado a los problemas auditivos. De hecho reconocen que cada persona tiene su propia percepción auditiva, así como unas preferencias de sonido y sensación de ruido diferentes. A ello se suma la edad, pues según los expertos la capacidad auditiva empieza a deteriorarse a partir de los 50.
Para tratar de paliarlo, los investigadores han desarrollado algoritmos de procesamiento de señales e interfaces de usuario que adaptan la reproducción de audio en dispositivos electrónicos a los requisitos auditivos individuales. Por otra parte, utilizando métodos de procesamiento de señales propios de la tecnología de los audífonos, han creado soluciones de software que se pueden integrar en sistemas de telefonía o auriculares para optimizar la calidad del sonido y la inteligibilidad de la voz.
De otra parte, el estudio ha demostrado que el nuevo software puede facilitar la comprensión a personas con discapacidad auditiva tanto de los anuncios por megafonía como de las voces en sus teléfonos móviles. Normalmente esta enfermedad afecta de forma diferente a cada persona, de ahí la necesidad de ajustar los audífonos individualmente. Sin embargo, con ADAPT RDC “nos sorprendió gratamente que parece mejorar en general su entendimiento del lenguaje hablado”, destaca Rennies-Hochmuth.
Pero no es esta la única aplicación que el grupo de estudio alemán ha dedicado a los problemas auditivos. De hecho reconocen que cada persona tiene su propia percepción auditiva, así como unas preferencias de sonido y sensación de ruido diferentes. A ello se suma la edad, pues según los expertos la capacidad auditiva empieza a deteriorarse a partir de los 50.
Para tratar de paliarlo, los investigadores han desarrollado algoritmos de procesamiento de señales e interfaces de usuario que adaptan la reproducción de audio en dispositivos electrónicos a los requisitos auditivos individuales. Por otra parte, utilizando métodos de procesamiento de señales propios de la tecnología de los audífonos, han creado soluciones de software que se pueden integrar en sistemas de telefonía o auriculares para optimizar la calidad del sonido y la inteligibilidad de la voz.