Este chat de Google AI contigo para describirte cualquier foto, es genial

Google presenta una nueva función basada en inteligencia artificial en la aplicación Lookout: visión asistida. Así, las personas con discapacidad visual pueden discutir con la inteligencia artificial para preguntarle, a través de varias preguntas, todos los detalles de la imagen.

A través de la función de preguntas y respuestas sobre imágenes de la aplicación Google Lookout, puede chatear con una IA para pedirle que describa una imagen.

Describir una imagen ya no es un reto demasiado complicado para una buena IA. Sin embargo, Google ha logrado llevar este concepto un paso más allá para hacerlo más funcional e impactante. El gigante americano acaba de desvelar Funcionalidad de imagen y respuesta en Lookout de la aplicación de accesibilidad: visión asistida Y pudimos hacer una breve demostración de eso durante Google I/O 2023 hace unos días.

El concepto se puede resumir fácilmente: haces cualquier pregunta para entender lo que hay en la imagen y la IA te da una respuesta clara cada vez. El propósito de esta función, y del monitoreo en general, es ayudar a las personas con discapacidad visual a saber qué hay en una foto o gráfico. De ahí el concepto de preguntas y respuestas, que significa preguntas y respuestas. El espectáculo, ella tenía una cosita bastante increíble.

Básicamente, subes una imagen a la aplicación y le pides a la IA que la describa. Este último actuará y te explicará lo que vemos. Esta primera descripción es efectiva y puede ser suficiente si solo desea un resumen rápido. Sin embargo, para aquellos que necesitan más detalles, simplemente hagan una pregunta, por escrito o en voz alta.

La inteligencia artificial responde a tus preguntas para describir la imagen

Durante la demostración en I/O, la sesión de preguntas y respuestas sobre la imagen de Lookout se enfrentó a una imagen y esta es la conversación que tuvo después con el usuario humano.

inteligencia artificial: En esta foto puedo ver un perro corriendo en la playa. También puedo ver que tiene una bala en la boca. Al fondo puedo ver agua, montañas y cielo.

humanos: ¿Qué es una raza de perro?

inteligencia artificial: El perro es un mestizo.

humanos: ¿El perro se ve juguetón?

inteligencia artificial: Sí, el perro es juguetón.

humanos: Descripción del océano.

inteligencia artificial: El océano está en calma y hay una montaña al fondo.

humanos: ¿Las olas son grandes?

inteligencia artificial: No, las olas son pequeñas.

humanos: ¿Hay nubes en el cielo?

inteligencia artificial: Sí, hay una nube en el cielo.

humanos: ¿La playa está llena?

inteligencia artificial: No, la playa está vacía.

La conversación no es necesariamente la más natural, pero es lo suficientemente fluida y clara como para representar una solución interesante para las personas con discapacidad visual que en la Web a menudo tienen que contentarse con descripciones muy breves.

Ahí tienen una herramienta con un gran potencial para darles una idea precisa de la imagen.

Fotografiamos la manifestación en cuestión. Simplemente especifiquemos que esta grabación no es de alta calidad, fue principalmente pensada para apoyar la redacción de este artículo.

enlace de youtubeSuscríbete a Frandroid

Por último, recuerda que Lookout es una aplicación que está disponible desde hace un tiempo en Play Store. Esta herramienta de accesibilidad ya cuenta con varias funciones interesantes para personas invidentes: leer tarjetas o etiquetas de negocios y fidelización, detectar el valor de los billetes y ayudar a escanear un documento.


Para seguirnos, te invitamos a Descarga nuestra aplicación para Android e iOS. Puede leer nuestros artículos y perfiles y ver los últimos videos en YouTube.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *