Gafas conectadas que leen los labios
Los investigadores han desarrollado lentes de contacto que pueden detectar silenciosamente palabras articuladas. Se pueden usar para controlar su teléfono inteligente, o incluso combinarse con un sintetizador de voz para dar voz a las personas silenciadas.
también te interesará
[EN VIDÉO] La humanidad comparte el 70% de sus expresiones faciales Hay otro punto común a los aproximadamente siete mil millones de personas que habitan la Tierra. Finalmente, 16…
Pronto, sus anteojos podrán controlar su teléfono inteligente. Investigadores de la Universidad de Cornell en los EE. UU. han integrado un sistema de sonar en gafas conectadas que pueden detectar los movimientos de los labios. Se llaman EchoSpeech, son de alto secreto y usan una montura de anteojos comercial.
El sistema consta de dos amplificadores en miniatura debajo de un ojo que emiten ondas de ultrasonido hacia la boca. Dos micrófonos colocados debajo del otro ojo registran el eco. El traje permite registrar cuatro señales diferentes, que luego son analizadas por un sistema de aprendizaje profundo que infiere los movimientos de la boca. Según los investigadores, con solo dos sesiones de entrenamiento, EchoSpeech ya puede reconocer 31 comandos.
Un sistema que solo requiere un smartphone
Elegir un sistema de audio en lugar de cámaras ofrece varias ventajas. Los componentes son más baratos y más pequeños, lo que hace que las gafas sean más discretas y ligeras y, por lo tanto, más cómodas de llevar. La autonomía también es mejor. El EchoSpeech funciona durante unas diez horas entre dos recargas, mientras que una solución similar con cámaras se limita a solo 30 minutos. Además, el procesamiento de datos de audio es mucho más fácil. Las gafas envían todos los datos a través de Bluetooth a un teléfono inteligente, que puede procesarlos en tiempo real. Finalmente, esta solución es más respetuosa con la privacidad que una cámara de grabación de rostros. Los datos se procesan localmente y las gafas filtran las frecuencias bajas, evitando así grabar cualquier conversación en el entorno.
Finalmente, EchoSpeech puede permitir dictar texto en lugares donde no es posible hablar, por ejemplo, en una biblioteca o en un lugar ruidoso como un restaurante o una sala de conciertos. Además, se puede combinar con un sistema de síntesis de voz para dar voz a las personas silenciadas y permitirles comunicarse sin lenguaje de señas. Los investigadores están trabajando actualmente en el reconocimiento de las expresiones faciales, así como en los movimientos de los ojos y la parte superior del cuerpo. En particular, dicho sistema podría integrarse en cascos de realidad virtual para animar el avatar de una persona.
«Especialista en música. Friki del alcohol. Fanático del café. Gurú de los viajes malvados. Nerd de la televisión. Amante de la cultura pop».
