Tecnología
Nuevo lanzamiento

Voicebox: Meta lanza la inteligencia artificial que transforma la edición de audio

Voicebox, la innovadora inteligencia artificial de Meta que revoluciona la edición de audio y abre nuevas posibilidades creativas.
Meta lanza nueva tecnología de inteligencia artificial. (Meta)
17-06-2023

Voicebox, lanzada y creada por Meta de Mark Zuckerberg, es un modelo generativo de inteligencia artificial que puede ayudar en la edición, sampling y estilización de audio. Esta tecnología permitirá a los creadores de contenido, editores de video y sonidistas mejorar sus pistas de audio en proyectos y creaciones.

Importantes beneficios 

De acuerdo a sus creador, esta nueva herramienta permite realizar tareas de generación del habla, a pesar de que no fue específicamente diseñado para esto, no obstante, son facultades que puede aprender a través del contexto.

Asimismo, Voicebox está en la capacidad de producir audios de alta calidad y editar audio pregrabado, como eliminar bocinas de autos, sonido del viento o ladridos de perros. Inclusive, el modelo es multilingüe y puede producir contenido en más seis idiomas. 

De igual forma, puede beneficiar a las personas con discapacidad visual al escuchar los mensajes escritos de sus amigos con sus mismas voces. En adición a esto, las personas podrán comunicarse en idiomas extranjeros sin tener conocimiento de estos.

Características

Según Meta, Voicebox puede adaptar el estilo de audio para la generación de texto a habla, sintetizando el contexto, al utilizar una muestra de audio de tan solo un par de segundos.

Además, Meta informó que esta nueva herramienta puede recrear una parte del discurso interrumpida por ruido o sustituir palabras mal pronunciadas sin tener que volver a grabar un discurso completo, editando el habla y reduciendo el ruido.

Igualmente, la nueva invención de Zuckerberg tiene la capacidad de transferir el estilo entre idiomas, debido a que proporciona una muestra de habla y un pasaje de texto en diferentes idiomas como inglés, francés, alemán, español, polaco o portugués, encima, puede leer el texto en cualquiera de esos idiomas, superando las barreras idiomáticas.

Por último, mencionaron que Voicebox cuenta con una amplia variedad de muestras de habla y que ha aprendido de diversos datos para generar un habla más auténtica y representativa de cómo las personas se expresan en el mundo real, en los seis idiomas mencionados.

Critica a las Vision Pro

Por otra parte, en una reunión con sus empleados, Mark Zuckerberg habló sobre las Apple Vision Pro, las nuevas gafas de realidad mixta que la empresa presentó hace unos días y que llegarán en 2024 a 3.499 dólares, y criticó ese alto costo y el enfoque con el que se lanza el producto.

"Creo que su anuncio realmente muestra la diferencia en los valores y la visión que nuestras empresas aportan a esto de una manera que creo que es realmente importante. Innovamos para asegurarnos de que nuestros productos sean tan accesibles y asequibles para todos como sea posible", afirmó el CEO.

En conclusión, el lanzamiento de Voicebox por parte de Meta marca un hito significativo en el campo de la edición de audio. Esta impresionante inteligencia artificial ha revolucionado la forma en que los creadores y profesionales trabajan con el audio.