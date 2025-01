Meta està d’estrena. Concretament d’un nou model d’intel·ligència artificial (IA) capaç de traduir veu i text en 101 idiomes i de fer traduccions directes de veu a veu en 36 llengües.

Anomenat SEAMLESSM4T, aquest model supera els existents i podria obrir la porta a traduccions universals instantànies, cosa que fins ara només s’havia vist a la ciència-ficció.

La companyia ja va presentar una primera versió del model l’agost de 2023, però ara ha anunciat més innovacions i que posaran els recursos a disposició del públic per a ús no comercial, per tal d’ajudar a seguir investigant en tecnologies de traducció de veu inclusives.

El nou model SEAMLESSM4T admet diversos modes de traducció de fins a 101 idiomes diferents: traducció de veu a veu, traducció de veu a text, traducció de text a veu i traducció de text a text. A banda, pot reconèixer 96 idiomes automàticament.

En el cas específic de la traducció de veu a veu, que és el més trencador, SEAMLESSM4T aconsegueix traduir amb un 23% més de precisió que els sistemes existents actualment.

A més, filtra el soroll de fons i s’adapta a les variacions del parlant. I, el més important, ho fa en temps reals.

És a dir, mentre veiem una persona que parla en un vídeo, automàticament se li tradueix la veu en un altre idioma. Per exemple, de l’anglès parlat a l’alemany parlat sense haver de transcriure-ho primer.

De moment el model pot traduir un centenar de llengües (al món se’n parlen al voltant de 7.000).

Malgrat tot, hi ha experts que han aixecat la veu contra aquest model, alertant dels biaixos i les limitacions.

Tot i que les tecnologies de la parla poden ser més eficaces i rendibles que els humans, cal entendre les formes en què aquestes tecnologies fallen per a alguns grups demogràfics o dialectes i variants. A banda, pot revolucionar i afectar tot un sector, el de la traducció, que són carreres universitàries.

I que la gent podria perdre les ganes d’estudiar idiomes, si aquest model s’integra amb ulleres virtuals i ens permet tenir converses amb diverses llengües en temps real.