El futuro de los audífonos con ruido de fondo con Google Ai (inteligencia artificial)

Voy a hablarles de investigaciones recientes que pueden mejorar drásticamente el rendimiento de los audífonos con ruido de fondo. El Santo Grial para las personas con pérdida auditiva es la capacidad de separar el habla del ruido de fondo, ya sea que estén hablando con una persona o con un grupo de personas.

Hace poco vi un vídeo en el blog de IA de Google que ilustra la posibilidad de poder separar a quién quieres escuchar con solo mirar a esa persona. Dentro de este software que han creado, la verdad es que es bastante impresionante. En vez de intentar describirlo, mira el siguiente vídeo (de 0,58 a 1,39) para verlo en acción.

¿Qué te pareció? Ahora, si me preguntas, es bastante impresionante. Pero la situación de escucha más difícil a la que se enfrenta la mayoría de la gente es un restaurante ruidoso.

El siguiente vídeo que os mostraré demuestra su capacidad para separar la voz del ruido de fondo en una cafetería (véalo de 1,53 a 2,20).

Ahora, no sé ustedes, pero creo que esta tecnología dentro de los audífonos cambiaría las reglas del juego por completo. Con entusiasmo, leí el artículo relacionado con la investigación para ver qué viabilidad tendría esto en las generaciones futuras de audífonos.

Se titula «Buscar escuchar en el cóctel: un modelo audiovisual independiente del orador para la separación del discurso» y fue escrito por varios investigadores de Google. Estos son algunos puntos clave que saqué de este artículo.

  1. Los investigadores realizaron esto en vídeos existentes, lo que significa que no lo hicieron en tiempo real. Así que, antes de que te entusiasmes con la idea de usar este software y ponerlo en un audífono, escucha lo que dijeron los autores:

«Cabe señalar que nuestro método no funciona en tiempo real y, en su forma actual, nuestra mejora de voz es más adecuada para la etapa de posprocesamiento de la edición de vídeo». — Investigadores de Google

  1. Esta tecnología supone un gran avance para el procesamiento audiovisual. Las generaciones anteriores de este tipo de software requerían que el software se entrenara con una voz determinada. Es decir, si ibas a ir a un restaurante con un amigo determinado, la voz de ese amigo tendría que estar programada en el software para que supiera qué buscar realmente.

En este software en particular, podrían adoptar un formato de voz generalizado para que funcionara con cualquier persona en cualquier situación, lo que lo hace más viable en un entorno generalizado, lo que significa que puede ir a cualquier parte y comunicarse con cualquier persona y utilizar esta tecnología en particular.

  1. Cuando lo hacían en un bar ruidoso, podían eliminar el ruido de fondo, pero esto degradaba significativamente el habla de la persona que intentaban escuchar. Esto es muy similar a las limitaciones actuales en la tecnología de los audífonos. Poder eliminar una fuente de voz de una variedad de otras fuentes de voz puede resultar muy difícil.

Por lo tanto, si quieren hacer de este un producto viable dentro de un audífono, también tendrán que arreglarlo.

  1. Es importante recordar que los investigadores necesitan información visual para poder realizar esta separación audiovisual y, por supuesto, los audífonos no tienen información visual, al menos no todavía. Verás, en realidad están trabajando en una tecnología de audífonos que pueda detectar la actividad cerebral para detectar el movimiento de los ojos y, si pueden hacerlo y combinarlo con esta información de audio, es posible que puedan determinar a quién quieres escuchar en función de dónde estés mirando.

Si bien este tipo de tecnología aún no está disponible en los audífonos, son investigaciones como esta las que dan esperanza a las personas con pérdida auditiva que tienen dificultades en una situación de ruido de fondo y allanan el camino para futuras investigaciones sobre tecnologías que lleguen a los audífonos.

Mientras tanto, una de las mejores maneras de mejorar su capacidad para entender el habla en una situación de ruido de fondo es realizar mediciones reales del oído con los audífonos. Ahora bien, si no sabes qué es la medición real del oído, te recomiendo encarecidamente que veas este vídeo (https://appliedhearingaz.com/real-ear-measurement/).

Otra forma de mejorar drásticamente tu capacidad de entender el habla en una situación de ruido de fondo en el momento actual es utilizar un dispositivo de escucha asistida, como un Roger Pen, un Roger Select o un micrófono remoto. Este tipo de dispositivos ayudan a reducir el ruido de fondo, ya que captan la voz de la persona que quieres escuchar y la envían directamente a tus audífonos.

Transcripción del vídeo

Transcripción del vídeo

Todas las personas con pérdida auditiva quieren oír mejor cuando hay ruido de fondo. Pues bien, en una entrada de blog y un vídeo recientes en el blog de Google Ai, los investigadores están trabajando en un software para hacer exactamente eso: https://ai.googleblog.com/2018/04/loo...

En su vídeo muestran cómo pueden tomar información visual y de audio para separar el discurso que quieres escuchar del ruido que no quieres escuchar. Personalmente, este software me parece impresionante. Su vídeo habla por sí solo. Así que decidí leer todo el artículo de investigación para conocer los puntos clave sobre cómo funciona y cuáles podrían ser las implicaciones futuras para la tecnología de los audífonos.

1. En este momento solo funciona en vídeos existentes. Los investigadores fueron muy específicos en cuanto a que su tecnología no funciona en tiempo real. De hecho, afirmaron: «Cabe señalar que nuestro método no funciona en tiempo real y, en su forma actual, nuestra mejora de voz es más adecuada para la etapa de posprocesamiento de la edición de vídeo».

2. Este es un GRAN avance para el procesamiento audiovisual: la tecnología anterior requería la formación de un software para aprender la voz de cada hablante y así saber en qué voz centrarse. En este nuevo software, se entrenó con información general sobre el habla para que funcione con cualquier persona.

3. Las situaciones muy ruidosas degradaban la voz: al utilizar este software para una barra ruidosa (no se muestra en el vídeo), los investigadores indicaron que la voz se degradaba significativamente cuando se separaba del ruido. Este es un problema similar con la tecnología actual de los audífonos.

4. Los audífonos no tienen forma de obtener información visual. La razón por la que este software funciona es porque utilizan información de audio y visual. Los audífonos no tienen una forma de capturar información visual en este momento.

Sin embargo, los investigadores están trabajando en una forma de que los audífonos capten los impulsos eléctricos del cerebro que se corresponden con la información visual, de modo que algún día esta tecnología pueda funcionar en un audífono. Si bien esta tecnología audiovisual aún no funciona dentro de los audífonos, es prometedora para el futuro. Son investigaciones como esta las que allanan el camino para la nueva tecnología de audífonos, por lo que es solo cuestión de tiempo hasta que descubran la manera de hacer que funcione. Mientras tanto, la mejor manera de escuchar mejor con ruido de fondo es programar los audífonos con Real Ear Measurement: https://youtu.be/cHR0Oa6I-wYLa otra forma es usar un dispositivo de escucha remota como un Roger Pen, Roger Select o un micrófono remoto.

Vídeos relacionados

No se ha encontrado ningún artículo.

Artículos relacionados

No se ha encontrado ningún artículo.