Finalmente una instalación de audio que no absorbe
Empezamos a las 21mi Un siglo durante dos décadas, coches Literalmente empiezas a volar, las vacaciones espaciales están cerca … Sin embargo, las computadoras todavía parecen una parodia de robots confusos cuando se les pide que conviertan texto a voz (TTS). Vamos desarrolladores, debe haber una forma mejor.
empresa llamada WellSaid Labs Ella cree que tiene uno y recibe un impulso de Serie A.
“En pocas palabras, WellSaid es el futuro de la creación de contenido de audio. Es por eso que a miles de clientes les encanta usar el producto a diario, con una adopción de abajo hacia arriba incomparable. El socio general de FUSE, que dirigió la gira, dijo que Matt recopiló Y Michael es un equipo de clase mundial, y no podríamos estar más emocionados de ser parte del viaje de WellSaid “.
Vayamos al punto correcto: puedes escuchar Muestras de audio aquí.
Una gran cantidad de muestras de audio
Este es uno de los mayores desafíos de la inteligencia artificial y un tema de investigación importante en áreas como la informática, la interfaz hombre-máquina y la robótica. En junio de 2020, según un comunicado, WellSaid Labs Text-to-Speech se convirtió en el primero en lograr la paridad humana-naturaleza, en clips de audio cortos, a través de múltiples voces.
“Hemos agregado AI Voice al conjunto de herramientas de miles de creadores de contenido y sus equipos”, dice Matt Hawking, director ejecutivo de WellSaid Labs. “Human Equivalence AI Voice se puede producir en tiempo real y actualizar a pedido. Desbloqueando nuevas y emocionantes oportunidades para ‘agregar voz’ que antes no era posible. AI Voice garantiza que cada producción se cree fácilmente y se actualice de manera eficiente a escala”.
La etapa de paridad humana tiene implicaciones importantes sobre cómo se crea el contenido de audio, lo que ha llevado a los inversores a unirse. Los casos de uso incluyen servicios de radiodifusión y radio, publicidad programática, marketing digital y contenido de formación corporativa. WellSaid Labs tiene una biblioteca de glifos de audio que brindan acceso a muchos estilos y tonos de lectura. Además, las marcas pueden crear avatares de audio con tecnología de inteligencia artificial para capturar la similitud, el estilo y la singularidad del audio necesario para contar sus historias.
“Los creadores de contenido o los diseñadores de experiencias de productos se han enfrentado anteriormente a compromisos difíciles entre calidad y escalabilidad al utilizar herramientas de conversión de texto a voz o locución humana. Las impresionantes voces de WellSaid, accesibles a través de una aplicación de estudio o API escalable, eliminan la necesidad de elegir entre realistas , sonido natural y contenido de audio fácilmente escalable, dice James Newell de Voyager Capital, “WellSaid ofrece ambos y los entrega de la manera en que su equipo quiere que se consuman”. En horas en lugar de semanas. “
Fuente : ZDNet.com
“Especialista en música. Friki del alcohol. Fanático del café. Gurú de los viajes malvados. Nerd de la televisión. Amante de la cultura pop”.
