Un modelo informático decodifica el habla siguiendo las oscilaciones neuronales

Supera a los sistemas tradicionales de reconocimiento automático de voz


Un modelo informático replica la capacidad del cerebro para usar las sílabas en la decodificación del habla. Se inspira en las oscilaciones neuronales que hacen posible el pensamiento y supera los sistemas tradicionales de reconocimiento automático de voz.


01/07/2020

Foto: Gerd Altmann. Pixabay.
El cerebro humano emplea sílabas para interpretar el discurso, gracias a la actividad de las oscilaciones neuronales que hacen posible el flujo del pensamiento. Ahora, un modelo informático ha conseguido replicar esta capacidad de nuestro cerebro.
 
Un reciente estudio desarrollado en Suiza por investigadores de la Universidad de Ginebra (UNIGE) y del National Centre of Competence in Research (NCCR) ha permitido crear un modelo computacional que sería capaz de decodificar el habla y predecirlo, aclarando cómo funciona el mecanismo por el cual el cerebro utiliza las sílabas en dicha decodificación.
 
De acuerdo a lo indicado en una nota de prensa, los científicos desarrollaron un sistema informático basado en los ritmos fisiológicos del cerebro que sería mucho más efectivo que otros mecanismos de reconocimiento de voz para secuenciar las sílabas y decodificarlas.
 
Los investigadores tomaron como base estudios previos que comprobaron que las ondas de baja frecuencia (theta) y las ondas de alta frecuencia (gamma) trabajan coordinadas en el cerebro para dividir los sonidos en sílabas, analizando y reconociendo su contenido.
 
Oscilaciones neuronales y codificación predictiva
 
El modelo computacional combina los avances de dos esquemas teóricos. Por un lado, el conocimiento sobre la función de las oscilaciones neuronales y, por otro, la llamada codificación predictiva. Ésta última sugiere que el cerebro se adelanta a las señales de los sentidos para optimizar la percepción, en función de códigos que aprende y jerarquiza previamente.
 
Más allá de la eficacia del modelo informático, que según los investigadores ha sido comprobado en la identificación de casi tres mil sílabas en idioma inglés, la importancia de este estudio radica en la posibilidad de saber más acerca de la forma en la cual las oscilaciones neuronales afectan a las diferentes funciones cognitivas, en este caso al habla y su decodificación.
 
Aunque las oscilaciones neuronales pueden medirse mediante una técnica relativamente sencilla y de uso habitual como la electroencefalografía, aún se conoce poco sobre la forma y el grado de influencia que tienen en la percepción, la memoria o nuestra capacidad de atención, por ejemplo.

Foto: NomeVisualizzato. Pixabay.
El cerebro humano y sus incógnitas
 
Sabemos que las ondas de diferente frecuencia (alfa, beta, theta, delta, gamma) marcan distintos ritmos cerebrales y se encuentran vinculadas de manera individual o integrada a cada una de las funciones cognitivas. Sin embargo, la ciencia todavía no ha podido describir concretamente los procesos que intervienen en el desarrollo de estas funciones.
 
Al intentar imitar el modelo de codificación predictiva y combinarlo con la actividad de las oscilaciones neuronales, el nuevo modelo informático desarrollado en Suiza sería entonces capaz de arrojar pistas sobre la forma en la cual nuestro cerebro decodifica el habla y lo transforma en contenido significativo.
 
Si finalmente se comprueba que la informática es capaz de imitar la manera en la que el cerebro humano utiliza las sílabas para interpretar el discurso, quizás este mismo esquema pueda ser empleado para comprender en mayor profundidad el impacto de los ritmos cerebrales y los mecanismos que intervienen en otras funciones cognitivas.

Referencia
  
Combining predictive coding and neural oscillations enables online syllable recognition in natural speech. Hovsepyan, S., Olasagasti, I. & Giraud, A. Nature Communications  (2020).DOI:https://doi.org/10.1038/s41467-020-16956-5



Artículo leído 2636 veces



Más contenidos