O aprendizado de máquina usando inteligência artificial melhorou a tradução por computador na última década, mas os artigos científicos que empregam jargões especializados ainda são um desafio para a tradução automática. No entanto, os cientistas devem priorizar a tradução de artigos em vários idiomas para fornecer um cenário equitativo para cientistas iniciantes em todo o mundo, argumentam os pesquisadores da UC Berkeley. Crédito:Valeria Ramírez-Castañeda, UC Berkeley
Ainda no ensino médio, Xinyi Liu trabalhou brevemente em um laboratório da Universidade Beihang em Pequim e ficou surpreso ao ver pesquisadores chineses usando rotineiramente o Google Tradutor para gerar o primeiro rascunho em inglês de artigos científicos. A tradução é uma obrigação se os cientistas quiserem se submeter a periódicos de alto nível, quase todos em inglês.
"Era normal que os pós-docs usassem o Google Tradutor para primeiro traduzir tudo e depois modificá-lo e poli-lo. Mas depois da primeira tradução, todo o artigo não fazia sentido", disse Liu, um calouro em ascensão da Universidade da Califórnia. , Berkeley, que está se especializando em biologia molecular e celular. "Literalmente, todas as palavras, todos os termos foram colados aleatoriamente."
Tinha que haver uma maneira melhor, ela pensou.
Então, no ano passado, quando ela viu um novo seminário ministrado por Rebecca Tarvin sobre quebrar as barreiras linguísticas na ciência, ela se inscreveu.
Essa aula, que será ministrada na UC Berkeley pela terceira vez na primavera de 2023, foi um balão de ensaio para Tarvin, professor assistente de biologia integrativa. Com um interesse renovado em todo o campus em diversidade, equidade e inclusão, ela e os grupos de trabalho dentro de seu departamento pensaram que o curso poderia ajudar a UC Berkeley a resolver um problema de longa data na ciência:o inglês, a língua dominante da ciência, é um grande obstáculo para cientistas que não são falantes nativos de inglês.
Não são apenas os estudantes e cientistas estrangeiros que estão em desvantagem quando a ciência é comunicada principalmente em inglês. Assim como muitos estudantes nascidos nos Estados Unidos. No outono de 2020, cerca de 40% dos calouros da UC Berkeley eram estudantes universitários de primeira geração e, no sistema de 10 campi da Universidade da Califórnia, 39% dos alunos de primeira geração cresceram com um idioma diferente do inglês como primeira língua.
"Muitos de nossos alunos da Califórnia cresceram traduzindo para seus pais", disse Tarvin. "A tradução faz parte da vida deles desde que eram muito jovens."
Para Tarvin, a aula - Quebrando as barreiras linguísticas na evolução e na ecologia - foi uma "oportunidade para ensinar aos alunos habilidades em alfabetização em tradução, bem como incentivar os alunos a serem ativistas nesse campo de mudança estrutural. E, de fato, eu vi um recepção realmente positiva desse tipo de ativismo por parte dos alunos, pois todos parecem concordar que abordar as barreiras linguísticas é realmente importante depois de fazer o curso."
A aula levou Tarvin e alguns alunos de pós-graduação da UC Berkeley, juntamente com colaboradores no Canadá, Israel e Hungria, a escrever um artigo científico avaliando novas ferramentas de tradução automática que podem ser usadas por pessoas em todo o mundo para tornar seus artigos científicos acessíveis a não falantes de inglês . O artigo apareceu online este mês na revista
BioScience . Traduções para espanhol, francês, português e húngaro, os idiomas dos coautores, também estão disponíveis online.
"A ideia aqui é que estamos tentando dar às pessoas as ferramentas e motivação para traduzir suas próprias pesquisas científicas", disse Tarvin. "A ciência não precisa se basear em um único idioma. E há muitos benefícios adicionais decorrentes da incorporação de abordagens multilíngues em todas as fases da ciência. Por exemplo, publicar em vários idiomas beneficiará a sociedade por causa de uma melhor comunicação científica".
"A linguagem pode ser uma barreira, bem como uma ferramenta fantástica, para unir as pessoas", enfatizou Emma Steigerwald, primeira autora do artigo e estudante de pós-graduação em ciência, política e gestão ambiental da UC Berkeley. "É uma barreira que podemos superar usando esta nova tecnologia. Explicamos sobre a tecnologia e como ela pode ser implementada e as coisas que precisamos estar cientes quando usamos a tecnologia, e todas as maneiras maravilhosas e positivas que a comunicação científica pode ser transformado trazendo esta nova tecnologia para suportar."
Em direção a uma rede científica multilíngue Até recentemente, a tradução por computador era motivo de piadas. As pessoas compartilharam exemplos divertidos de erros de tradução, muitas vezes parecendo menosprezar outros idiomas além do inglês e, por implicação, outras culturas.
Mas o aprendizado de máquina, ou inteligência artificial, aumentou drasticamente a precisão da tradução na medida em que os turistas usam serviços de Internet como o Google Tradutor para se comunicar com as pessoas nos países que visitam.
Mas para texto que contém muitos jargões – muitos deles científicos, mas também de muitos outros campos acadêmicos – o Google Tradutor é lamentavelmente inadequado.
"A qualidade da tradução não é para um periódico", disse Ixchel Gonzalez Ramirez, um dos mentores dos alunos de pós-graduação do curso. "Muitas vezes, as pessoas têm que pagar para que um tradutor profissional traduza seu trabalho, e isso é muito caro."
O novo artigo destaca alguns dos inúmeros serviços – a maioria deles gratuitos – que podem converter a escrita científica em inglês para outros idiomas. Além da conhecida plataforma Google Translate, incluem DeepL, que usa redes neurais e afirma ser muitas vezes mais preciso do que os concorrentes na tradução do inglês para chinês, japonês, línguas românicas ou alemão e vice-versa; Baidu Translate, um serviço da empresa chinesa de Internet Baidu que inicialmente se concentrava na tradução entre inglês e chinês; Naver Pagago, tradutor multilíngue criado por uma empresa da Coreia do Sul; e Yandex.Translate, que usa tradução automática estatística e se concentra principalmente em russo e inglês.
"A tradução está se tornando cada vez mais ao alcance de qualquer pessoa. Seja você um especialista ou não, e seja ou não bilíngue, a capacidade de traduzir é tão acelerada por tantas das tecnologias que temos disponíveis hoje." disse Steigerwald. "E como podemos integrar isso em nosso fluxo de trabalho como cientistas e como isso muda as expectativas que cercam a comunicação científica?"
O aprendiz automático que usa tecnologias de inteligência artificial melhorou a tradução no computador na última década. Sem embargo, os artigos científicos empregam terminologia especializada que siguen siendo un reto para a tradução automática. Não obstante, a comunidade científica deve dar prioridade à tradução de artigos em vários idiomas para ofrecer um panorama equitativo dos cientistas e das científicas em formação de todo o mundo, afirmando os pesquisadores da UC Berkeley. Crédito:Valeria Ramírez-Castañeda, UC Berkeley
Inglês é a língua franca da ciência O interesse de Tarvin pela tradução surgiu de uma de suas alunas de pós-graduação, Valeria Ramírez Castañeda, que em 2020 publicou um artigo descrevendo os custos incorridos por seus colegas de doutorado colombianos que queriam publicar ou interagir com colegas em um mundo dominado pelo inglês.
Como uma bióloga evolucionária interessada em como alguns animais passaram a usar veneno, Tarvin decidiu concentrar seu novo seminário na tradução de artigos nas áreas de evolução e ecologia, embora os alunos que se inscreveram acabaram traçando seus próprios cursos. Ela procurou principalmente estudantes, como Liu, e mentores, como Gonzalez Ramirez, que são bilíngues ou multilíngues.
"Todos na classe tiveram algum tipo de relacionamento familiar com a linguagem", disse Tarvin.
Tarvin também pediu a Mairi-Louise McLaughlin, professora de francês e linguística da UC Berkeley e especialista em tradução jornalística e literária, para falar com a turma sobre como os profissionais abordam a tradução e como a tradução afeta o significado. Esse assunto ressoou com os alunos quando eles tentaram traduzir resumos científicos e, às vezes, artigos inteiros.
Ruoming Cui, um estudante de segundo ano em ascensão que fez o curso na primavera de 2022, escolheu o Baidu para traduzir resumos científicos. Ela imediatamente descobriu que as frases longas e complexas do inglês e o uso de várias palavras para descrever um conceito pareciam redundantes quando traduzidos para o chinês.
"Geralmente não fazemos isso em chinês porque tornará cada frase muito longa e é muito tedioso", disse ela.
Liu acrescentou que, sem um polimento considerável, muitas traduções em inglês ficam distorcidas, disse ela.
"Ouvi dizer que, embora seu resultado seja incrível, se você escrever um artigo confuso devido à tradução, as pessoas ficarão irritadas porque não podem entender o que você está fazendo", disse Liu. "E isso afetará muito a forma como as pessoas validam a pesquisa ou se vão lê-la. Acho que é uma grande barreira no mundo científico."
Steigerwald, Tarvin e seus coautores também perceberam que escrever artigos científicos em um inglês mais simples – algo que os não cientistas vêm incentivando há muito tempo – beneficia tanto os falantes de inglês quanto os que não falam inglês.
"Se sua primeira língua não é o inglês, e você está apenas tentando ler a versão em inglês do jornal, parecerá muito menos ambíguo e muito mais legível quando o escritor usar uma linguagem simples", disse Steigerwald. "Mas também, muito importante, quando você vai traduzir aquele pedaço de texto, as ferramentas de aprendizado de máquina terão muito mais facilidade para traduzir algo que está escrito em linguagem simples. que se alguém quiser traduzi-lo para um milhão de idiomas, terá muito mais facilidade quando estiver escrito dessa maneira."
Os obstáculos permanecem para a tradução generalizada de artigos científicos, incluindo onde disponibilizá-los e como lidar com direitos autorais. A maioria dos periódicos nem sequer aceita artigos que não estejam em inglês, e poucos permitem explicitamente a co-publicação de artigos com tradução. Tarvin descobriu que poucos periódicos têm políticas sobre traduções e, como resultado de restrições gerais de direitos autorais, muitos editores cobram taxas exorbitantes para publicar uma tradução on-line após a publicação.
"É bastante surpreendente quantos periódicos não permitem que você publique livremente traduções após a publicação, e quão poucos têm suporte de plataforma onde você poderia ter apenas um resumo em um segundo ou terceiro idioma", disse Tarvin. "Acho que uma grande barreira para isso são as plataformas da web; não apenas as regras de publicação e direitos autorais, mas também a funcionalidade da plataforma."
Com o seminário Quebrando Barreiras e agora a
BioCiência papel, Tarvin e seus colegas esperam mudar gradualmente a norma na ciência para o padrão de tradução de artigos para outros idiomas, especialmente o idioma do país onde a pesquisa foi feita e os idiomas dos co-autores.
E quanto mais traduções houver, mais material haverá para treinar sistemas de tradução automática para fazer um trabalho melhor, aumentando gradualmente a qualidade da tradução científica.
"No meu laboratório, estamos traduzindo muitas de nossas pesquisas, e agora as pessoas no laboratório de Emma também estão fazendo isso", disse ela. "Acho que compartilhar nossa atitude positiva em relação a isso e como isso pode fazer a diferença para as pessoas influenciou um grupo pequeno, mas crescente, de pessoas que estão começando a incorporar a tradução em seu fluxo de trabalho científico".
Coautores adicionais da
BioScience papel incluem doutorandos Valeria Ramírez-Castañeda e Débora Brandt da UC Berkeley; András Báldi do Instituto de Ecologia e Botânica do Centro de Pesquisas Ecológicas em Vácrátót, Hungria; pós-doutoranda Julie Teresa Shapiro da Universidade Ben-Gurion do Negev em Be'er Sheva, Israel; e Lynne Bowker, professora de tradução e interpretação da Universidade de Ottawa, no Canadá.
+ Explorar mais Facebook lança tradutor de aprendizado de máquina para 100 idiomas