Los resultados son tres veces mejores que los sistemas de comunicación similares que se habían probado hasta ahora.
Algunos daños neuronales que resultan de trastornos neurodegenerativos o algunas enfermedades, incapacitan al paciente para comunicarse y hablar de forma asertiva. Sin embargo, y afortunadamente, en la actualidad se cuenta con distintas interfaces ojo-ordenador o cerebro-ordenador que fungen como un medio para comunicarse.
Sin embargo, dos estudios publicados en la revista Nature recientemente, explican cómo científicos han diseñado unos implantes cerebrales que transforman la actividad neuronal en texto de manera rápida y precisa. Para llevarlos a cabo, eligieron a dos pacientes que llevaban varios años sin poder comunicarse: Ann, quien sufrió un ictus 18 años atrás y quedó paralizada, y Pat, quien padece ELA desde hace más de 10 años.
Así funcionan los implantes: resultados prometedores
Cada uno de los dispositivos recoge las señales de neuronas individuales en las regiones asociadas al lenguaje: la corteza premotora ventral y el área de Broca. La precisión de este proceso es de un 75 %, y la velocidad en que se realiza es casi la mitad que el lenguaje natural, superando cualquier tecnología anterior.
Resultados en los estudios realizados con Ann
En el caso de Ann, científicos de la Universidad de California en San Francisco lograron alcanzar 78 palabras por minuto con un vocabulario base que superaba las 1.000 palabras ubicando varios electrodos pequeños y delgados en las zonas del cráneo que coinciden con las áreas del cerebro que controlan los músculos involuntarios del habla.
Durante dos semanas entrenaron al algoritmo para que reconociese las palabras que Ann leía en una pantalla, para que de esta forma, el algoritmo identificara las señales neuronales correspondientes a 39 fonemas distintos.
La tasa de error fue del 25,5% cuando se incluyeron los movimientos del tracto vocal para reconstruir las palabras y de un 54,4% cuando se tradujeron las señales cerebrales directamente al habla a través de un sintetizador.
Este algoritmo intenta predecir las siguientes palabras de las oraciones, al igual que hacen otros modelos de lenguaje como ChatGPT.
El siguiente paso es la transmisión de la actividad eléctrica que captan los electrodos hacia el ordenador, que decodifica las señales y las convierte en palabras. En el caso de Ann, el algoritmo tuvo una precisión del 95% al elegir las palabras adecuadas, de entre 1.024 en total, interpretando hasta 78 palabras por minuto, cuando el habla convencional llega a más de 150 palabras por minuto.
Este equipo quiso añadir, además, un avatar a su interfaz cerebro-máquina porque, explican, "el objetivo es recuperar la capacidad de comunicación y de conexión con los seres queridos, no solo ayudar a transmitir unas palabras. Cuando se habla hay un sonido, un énfasis y otras sutilezas que se pierden cuando solo hay un texto".
Este avatar personalizado, que traduciría otros elementos comunicativos como la expresión facial a partir de las señales cerebrales, ayudaría a mejorar la conexión del paciente con sus interlocutores. Para recrear la voz, el equipo empleó una grabación de Ann hablando en su boda, antes de sufrir el ictus.
Resultados en los estudios realizados con Pat
Por otro lado, en el caso de Pat, tras cuatro meses de aprendizaje, científicos de la Universidad de Stanford lograron que produjera 62 palabras por minuto, usando un tipo distinto de electrodos a los utilizados con Ann, que penetran más profundamente en el cerebro.
Estos electrodos miden la activación de neuronas individuales a corta distancia y en alta resolución. Pat leyó 50 frases que expresaban necesidades, como "tengo sed" o "familia". Dicho modelo alcanzó una precisión del 91%, pero cuando se utilizaba un vocabulario de más de 100.000 palabras se producía un error por cada cuatro palabras pronunciadas, aún así, los resultados son tres veces mejores que los sistemas de comunicación similares que se habían probado hasta ahora.
Ambos sistemas de electrodos tienen sus pros y sus contras, y los investigadores intentan perfeccionarlos para que funcionen de manera inalámbrica, sin necesidad de cables aparatosos conectados a un gran ordenador. A su vez, consideran necesario actualizar el algoritmo empleado en el primer caso para adaptarse a diferentes situaciones y ayudar así a que más personas puedan comunicarse.