O tradutor de IA da Meta pode interpretar idiomas que não são escritos
Quase metade dos cerca de 7.000 idiomas conhecidos do mundo existem sem o acompanhamento de uma interpretação escrita. Essas linguagens representam um problema único para os sistemas modernos de tradução, pois normalmente a inteligência artificial dessas ferramentas precisa converter a fala verbal em palavras escritas antes de traduzi-la para o novo idioma e reverter o texto de volta para fala.
Esta realidade está perto do fim: a Meta promete solucionar o problema com seu mais recente avanço de IA, que conta com uma linguagem de código aberto.
Como o sistema funciona
Os sistemas de tradução feitos com o auxílio do machine learning (ou "aprendizado de máquina", em português) normalmente exigem extensos exemplos rotuláveis do idioma (tanto escrito quanto falado) para treinar a tradução - isso é precisamente o que idiomas não escritos, como Hokkien, não têm.
Para contornar o problema, “usamos a tradução de fala para unidade (S2UT) para converter a fala de entrada em uma sequência de unidades acústicas diretamente no caminho anteriormente aberto pelo Meta”, explicou o CEO Mark Zuckerberg em uma postagem no seu blog. “Depois, geramos formas de onda das unidades. Na prática, isso possibilita a tradução direta pela fala, sem que o sistema passe por uma decodificação escrita.
Para traduzir o Hokkien taiwanês, por exemplo, um mecanismo de decodificação foi feito em duas passagens. Neste caso, o decodificador de primeira passagem gera texto em um idioma parecido (mandarim) e o decodificador de segunda passagem usa as correspondências para criar novas unidades.
A promessa de quebra de barreiras
Atualmente, o sistema permite que alguém que fale Hokkien converse com alguém que fale inglês, embora de maneira mais formal. O modelo só pode traduzir uma frase completa por vez, mas Zuckerberg está confiante de que a técnica poderá eventualmente ser aplicada a mais idiomas, e deve evoluir a ponto de oferecer tradução em tempo real.
A tradução de fala feita por esse mecanismo dotado de inteligência artificial pode desempenhar um papel significativo no metaverso, pois ajuda a estimular novas interações e criações de conteúdo.
Para interações, permitirá que pessoas de todo o mundo se comuniquem com mais fluidez, tornando o ambiente virtual mais interconectado. Além disso, o uso do recurso de tradução de fala para conteúdo permite que você localize facilmente outros conteúdos para consumo em vários idiomas.
Já que a pandemia popularizou bastante a prática do home office no mercado de trabalho mundial, a dependência de ferramentas de trabalho globais levaram ao aumento da necessidade de recursos avançados de tradução. Não há dúvidas de que essas ferramentas podem se beneficiar significativamente com a tradução de fala.
Este artigo foi escrito por Bianca Lopes e publicado originalmente em Prensa.li.