Tradutor da Meta pode interpretar idiomas não escritos

Meta acredita que seja fundamental para o metaverso.

Tradutor da Meta pode interpretar idiomas não escritos
Photo by Barbara Zandoval / Unsplash

Quase metade das cerca de 7.000 línguas conhecidas do mundo funcionam sem escrita de acompanhamento.

Essas linguagens não escritas representam um problema único para os modernos sistemas de tradução de aprendizado de máquina.

Elas normalmente precisam converter fala verbal em palavras escritas antes de traduzir para o novo idioma e reverter o texto de volta para fala, mas que a Meta parece ter tido avanços.

Como parte deste projeto, os pesquisadores do Meta analisaram o Hokkien, uma língua não escrita falada em toda a diáspora da Ásia e uma das línguas oficiais de Taiwan.

Os sistemas de tradução de aprendizado de máquina geralmente exigem extensos exemplos rotuláveis ​​do idioma, tanto escrito quanto falado, para treinar - precisamente o que idiomas não escritos como Hokkien não têm.

Para contornar isso, “usamos a tradução de fala para unidade (S2UT) para converter a fala de entrada em uma sequência de unidades acústicas diretamente no caminho anteriormente aberto pelo Meta”, explicou o CEO Mark Zuckerberg.

“Depois, geramos formas de onda das unidades. Além disso, UnitY foi adotado para um mecanismo de decodificação de duas passagens em que o decodificador de primeira passagem gera texto em um idioma relacionado (mandarim) e o decodificador de segunda passagem cria unidades.”

“Aproveitamos o mandarim como um idioma intermediário para construir pseudo-rótulos, onde primeiro traduzimos o discurso do inglês (ou hokkien) para o texto do mandarim e depois traduzimos para o hokkien (ou inglês) e o adicionamos aos dados de treinamento”, continuou ele.

Atualmente, o sistema permite que alguém que fale Hokkien converse com alguém que fale inglês, embora de maneira formal.

O modelo só pode traduzir uma frase inteira de cada vez, mas Zuckerberg está confiante de que a técnica poderá eventualmente ser aplicada a mais idiomas e melhorará a ponto de oferecer tradução em tempo real.