• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Pesquisadores do Facebook usam matemática para melhores traduções

    Redes sociais como o Facebook estão buscando uma tradução automática eficiente para todos os idiomas do mundo e a inteligência artificial pode ser a resposta

    Os designers de ferramentas de tradução automática ainda dependem principalmente de dicionários para tornar uma língua estrangeira compreensível. Mas agora existe uma nova maneira:números.

    Pesquisadores do Facebook dizem que transformar palavras em números e explorar semelhanças matemáticas entre idiomas é um caminho promissor - mesmo que um comunicador universal à la Star Trek continue sendo um sonho distante.

    A tradução automática poderosa é uma grande prioridade para os gigantes da Internet. Permitir que o maior número possível de pessoas em todo o mundo se comuniquem não é apenas um objetivo altruísta, mas também um bom negócio.

    Facebook, Google e Microsoft, bem como a russa Yandex, O Baidu da China e outros estão constantemente buscando melhorar suas ferramentas de tradução.

    O Facebook tem especialistas em inteligência artificial trabalhando em um de seus laboratórios de pesquisa em Paris.

    Atualmente, até 200 idiomas são usados ​​no Facebook, disse Antoine Bordes, Co-diretor europeu de pesquisa fundamental em IA para a rede social.

    A tradução automática atualmente se baseia em ter grandes bancos de dados de textos idênticos em ambos os idiomas para trabalhar. Mas, para muitos pares de idiomas, simplesmente não há textos paralelos suficientes.

    É por isso que os pesquisadores estão procurando outro método, como o sistema desenvolvido pelo Facebook que cria uma representação matemática para palavras.

    Cada palavra se torna um "vetor" em um espaço de várias centenas de dimensões. Palavras que têm associações próximas na língua falada também se encontram próximas umas das outras neste espaço vetorial.

    Do basco ao amazônico?

    "Por exemplo, se você pegar as palavras 'gato' e 'cachorro', semanticamente, são palavras que descrevem algo semelhante, então eles estarão extremamente próximos fisicamente "no espaço vetorial, disse Guillaume Lample, um dos designers do sistema.

    "Se você pegar palavras como Madrid, Londres, Paris, que são capitais europeias, é a mesma ideia. "

    Esses mapas de linguagem podem ser ligados uns aos outros usando algoritmos - a princípio, aproximadamente, mas eventualmente se tornando mais refinado, até que frases inteiras possam ser correspondidas sem muitos erros.

    Lample disse que os resultados já são promissores.

    Para o par de idiomas inglês-romeno, O sistema de tradução automática atual do Facebook é "igual ou talvez um pouco pior" do que o sistema de vetores de palavras, disse Lample.

    Mas para o par de idiomas mais raro de inglês-urdu, onde o sistema tradicional do Facebook não tem muitos textos bilíngues para referência, o sistema de vetores de palavras já é superior, ele disse.

    Mas poderia o método permitir a tradução de, dizer, Basco na língua de uma tribo amazônica?

    Em teoria, sim, disse Lample, mas, na prática, um grande corpo de textos escritos é necessário para mapear a linguagem, algo que falta nas línguas tribais amazônicas.

    "Se você tiver apenas dezenas de milhares de frases, não vai funcionar. Você precisa de várias centenas de milhares, " ele disse.

    'Cálice Sagrado'

    Especialistas do centro científico nacional do CNRS da França disseram que a abordagem que Lample adotou para o Facebook pode produzir resultados úteis, mesmo que não resulte em traduções perfeitas.

    Thierry Poibeau do laboratório Lattice do CNRS, que também pesquisa tradução automática, chamou a palavra abordagem vetorial de "uma revolução conceitual".

    Ele disse que "traduzir sem dados paralelos" - dicionários ou versões dos mesmos documentos em ambas as línguas - "é algo do Santo Graal" da tradução automática.

    "Mas a questão é que nível de desempenho pode ser esperado" do método do vetor de palavras, disse Poibeau.

    O método "pode ​​dar uma ideia do texto original", mas a capacidade de uma boa tradução sempre permanece não comprovada.

    François Yvon, pesquisador do Laboratório de Ciência da Computação do CNRS para Ciências da Mecânica e da Engenharia, disse que "a vinculação de idiomas é muito mais difícil" quando eles estão distantes um do outro.

    "A maneira de denotar conceitos em chinês é completamente diferente do francês, " ele adicionou.

    No entanto, mesmo traduções imperfeitas podem ser úteis, disse Yvon, e pode ser suficiente para rastrear discurso de ódio, uma grande prioridade para o Facebook.

    © 2019 AFP




    © Ciência https://pt.scienceaq.com