Meta presenta un traductor de voz a texto con IA para más de 100 idiomas

La empresa de Mark Zuckerberg desarrolló un traductor que estará disponible en Facebook, WhatsApp, Instagram, Messenger y Threads.
El traductor de Meta

Meta, el gran conglomerado que pertenece a Mark Zuckerberg, está agregando funciones con Inteligencia Artificial a todas sus aplicaciones, como Facebook, Instagram o WhatsApp. En este caso, presentaron un traductor de texto que está entrenado para reconocer más de 100 idiomas distintos. 

En medio del multiverso que está impulsando, la empresa apostó por un traductor de voz a texto, de voz a voz y de texto a texto llamado SeamlessM4T que, además de abarcar varias lenguas, utiliza un sistema único para reducir los errores al mínimo y evitar cualquier tipo de retraso en los procesamientos de las solicitudes. Esto lo anunciaron en el blog de IA que tienen los desarrolladores de Meta.

Para hacer esto posible, la multinacional usó un modelo de información que ya formaba parte de sus aplicaciones, el No Language Behind (ningún lenguaje se deja de lado). Esta herramienta les permitía utilizar un traductor universal de más de 200 idiomas.

Capacidades del nuevo traductor de voz a texto

Entre sus ventajas, esta nueva función permite:

  1. Reconocimiento de voz para 100 idiomas.
  2. Traducción de voz a texto en 100 idiomas de entrada y salida.
  3. Traducción de voz a voz en 100 idiomas de entrada y 36 de salida. 
  4. Traducción de texto a texto en 100 idiomas.
  5. Traducción de texto a voz en 100 idiomas de entrada y 35 de salida.

Para qué sirve la flamante herramienta de Meta

Según explicó Mark Zuckerberg en su cuenta de Facebook, la aplicación permitirá que las personas puedan comunicarse independientemente de la lengua que hablen y escriban. Por este motivo, buscan que la herramienta se encuentre pronto en Instagram, Threads, Messenger y WhatsApp, tanto en los chats como en las publicaciones. 

“Construir un traductor universal de idiomas, como el ficticio Babel Fish en The Hitchhiker’s Guide to the Galaxy , es un desafío porque los sistemas existentes de voz a voz y de voz a texto solo cubren una pequeña fracción de los idiomas del mundo”, explicaron desde la empresa en el anuncio.

Hasta el momento no está disponible para ser utilizada por el público general. Los investigadores y los desarrolladores se encuentran últimando detalles para el lanzamiento oficial. De todas maneras, aquel que desee experimentar puede descargar una demo desde Seamless Communication Translation. Esto permite grabar un audio y ser traducido en texto en el idioma seleccionado por el usuario. 

Este proyecto, según detalló Meta, tuvo más de 270 mil horas de muestras de texto y voz. La base de datos SeamlessAlign sigue abierta, por lo que la cantidad de tiempo continúa aumentando. Esto fue posible de realizar gracias a Language Left Behind (NLLB), Universal Speech Translator y Massively Multilingual Speech. 

ETIQUETA:

Compartir