La última herramienta de IA de Meta para una comunicación sin fisuras
En una carrera por ofrecer lo mejor en IA, Meta da un paso adelante para facilitar la comunicación a personas que hablan diferentes idiomas. La empresa ha presentado la última actualización de la herramienta de traducción de IA para que las conversaciones sean más espontáneas. Su nuevo modelo de IA admite varios idiomas en texto y voz, que se encarga de detectar y añadir la expresión a la traducción. Además, se acerca a la traducción en tiempo real con un retraso de dos segundos para la traducción de voz.
¿Qué es SeamlessM4T v2?
SeamlessM4T es un modelo de traducción que Meta lanzó en agosto de 2023. Está mostrando el potencial de Seamless Communication con las nuevas características de la última arquitectura ‘v2’ con la expansión. Actualmente admite unos 100 idiomas para los mensajes de texto y 36 para el reconocimiento de voz. Este modelo funcionará con traducción de voz a voz, de voz a texto y de texto a voz, y ofrecerá resultados con reconocimiento automático del habla.
«SeamlessExpressive» es uno de los dos avances de la comunicación sin fisuras. Intenta liberarse de la voz robótica y añadir expresiones para hacerla más cercana al usuario. Añade el volumen del habla, el tono, el tono emocional y las pausas a la voz traducida para que el oyente pueda entender fácilmente la emoción.
Mira esto página de demostración de Seamless Communication para las demos en inglés, español, francés y alemán.
La segunda característica de Seamless Communication es «SeamlessStreaming». Se asegura de que oigas una traducción en cuanto habla el interlocutor. Ahora, no tienes que esperar a que se complete una frase u oración para su traducción. Con un ligero retraso de dos segundos, puedes oír rápidamente el discurso traducido. Meta ha aclarado que es difícil empezar a traducir sin retardo, ya que los distintos idiomas tienen estructuras distintas para la formación de frases. Por lo tanto, han trabajado en el diseño de un algoritmo dedicado para entender si la entrada de audio tiene suficiente contexto para empezar a producir la salida traducida o no.
¿Qué se puede esperar?
La herramienta Seamless Translation AI de Meta permite la comunicación en tiempo real entre diferentes idiomas. Podemos esperar que esto nos ayude a comunicarnos eficientemente con personas que hablan diferentes idiomas. La integración de las gafas inteligentes puede aportar cambios revolucionarios al modelo de intérprete de IA. Con la «SeamlessExpression», cada vez más personas podrán ver contenidos de varios idiomas y conectarse globalmente.
Sin embargo, Meta no ha facilitado ninguna fecha para su lanzamiento público. Por lo tanto, no sabemos cuándo estará disponible esta tecnología para el uso cotidiano. Con la nueva capacidad de conectar fácilmente al usuario con los demás a través de la traducción de voz, es de esperar que la gente adopte este cambio.
¿Qué opinas al respecto? Háznoslo saber en los comentarios. Síguenos en Facebook, Twitter, YouTube, Instagram, Flipboard y Pinterest