Ydych chi'n siarad Cymraeg? Crédito:Golden Sikorka / Shutterstock
O pioneirismo em tecnologias de casa inteligente e assistentes de voz não, como uma regra, falam galês - embora o governo galês agora pretenda mudar isso por meio de seu plano de ação para a tecnologia da língua galesa. Mas seu objetivo é viável, isso é necessário, e como isso pode ser feito?
As ferramentas de voz de IA (como o Pixelbuds do Google) dependem muito do uso de conjuntos de big data para aprender um idioma, sua pronúncia, gramática e semântica. A capacidade ou qualidade das ferramentas resultantes é limitada principalmente pela quantidade de dados disponíveis (e quão "bons" eles são). Isso significa que, em teoria, pelo menos, ferramentas para uma língua minoritária como o galês não podem se tornar tão capazes quanto aquelas para uma língua dominante.
Os idiomas com quantidades limitadas de bons dados de treinamento disponíveis são chamados de idiomas de "poucos recursos". Comparado ao inglês, Os recursos galeses são escassos, mas existem vários milhares de idiomas com menos falantes, e provavelmente recursos muito mais pobres, do que galês.
Felizmente, há boas pesquisas sendo feitas sobre uma técnica de aprendizado de máquina chamada "aprendizado por transferência". Isso permite que os sistemas aprendam usando um conjunto de dados e, então, apliquem esse conhecimento em outro. Na China, está sendo usado para reconhecimento automático de fala (ASR) do Tibete, que praticamente não tem dados disponíveis para treinamento. O sistema ASR aprendeu chinês - que é linguisticamente muito diferente do tibetano - e foi então retreinado ou ajustado para "entender" o tibetano. Na verdade, há muitos pontos em comum entre muitos idiomas - palavras compartilhadas ou emprestadas e padrões de pronúncia - que ajudam nesse tipo de técnica.
Retreinando IA em Galês
Portanto, não há razão para que os sistemas de IA não possam ser produzidos para conversar em galês ou outras línguas minoritárias. Mas há alguma razão para isso? Toda a tecnologia de fala, casas inteligentes e sistemas de interação de voz usados hoje são produtos de pesquisa comercial. Para ser sincero, eles existem para ganhar dinheiro com seus dados, para lhe vender mais produtos e serviços, ou para influenciar seu pensamento. Nada dessa IA existe para o bem público.
Fazer um sistema que funcione bem com o galês pode não ser tão fácil quanto projetar tudo em inglês. Com a tecnologia atual, Serão necessários especialistas em IA de fala (e nós somos caros). Haverá necessidade de treinamento galês e material de teste, e testadores que falam galês devem estar envolvidos. Os perigos de não ter falantes de galês envolvidos no processo de tradução foram amplamente demonstrados no passado, quando uma resposta de e-mail fora do escritório acabou em uma placa de estrada
A menos que haja um argumento econômico forte o suficiente, não espere que grandes empresas se precipitem na produção de galês, Sistemas de fala gaélico ou cornish. Mesmo a gigante da tecnologia Samsung ainda não conseguiu produzir uma versão em inglês do Reino Unido de seu assistente Bixby (falantes internacionais de inglês precisam falar com ele com sotaque americano falso para fazê-lo funcionar). Até a versão em inglês dos Estados Unidos foi atrasada por falta de recursos.
E enquanto os falantes de galês ficarem felizes em usar os sistemas de IA da língua inglesa, pode não haver um argumento econômico - a menos que o governo galês decida pagar para que isso aconteça, o que ainda não foi feito (o plano de ação é um "compromisso" nesta fase).
AI para o resgate
A tecnologia avança e técnicas como a aprendizagem por transferência estão se tornando mais eficientes a cada dia. Isso permitiu que pesquisas anteriores sobre adaptação de linguagem fossem atualizadas e ampliadas para o desenvolvimento de técnicas de aprendizado profundo em vários idiomas. Enquanto isso, o crescente uso de outros tipos de tecnologia digital por falantes de galês melhorou a coleção de recursos no idioma, assim como a TV e o rádio galeses. Esses avanços significam que o custo dos sistemas de localização para o galês (e outras línguas minoritárias) está reduzindo.
A pesquisa sobre algoritmos de aprendizagem semelhantes ao cérebro pode ser a chave aqui. Esta é uma tecnologia que pode aprender continuamente durante o uso, assim como os humanos aprendem a falar um novo idioma. É diferente da maioria dos sistemas de IA atuais que são treinados em laboratório, antes de ser solto na selva - com algumas exceções, como o Tay da Microsoft, notável por seus fracassos espetaculares. Os sistemas futuros serão capazes de adquirir habilidades gradualmente em um segundo idioma apenas fazendo com que os usuários introduzam gradualmente mais e mais desse idioma em suas interações diárias. Em vez de financiar pesquisas sobre IA de fala galesa, o governo galês pode muito bem se sair melhor apoiando a pesquisa nesse novo tipo de tecnologia de aprendizagem adaptativa.
Como todos os sistemas de IA de fala atuais lidam com a fala centralmente (não é feito no dispositivo, mas em um farm de servidores remoto), esses sistemas podem reunir dados de centenas de usuários em todo o mundo (ou em todo o País de Gales) para aprender rapidamente. Portanto, a mensagem para os falantes de galês hoje pode ser para não comprar aquele Google Home em inglês ou o Amazon Alexa se você quiser que o Google ou a Amazon produzam um sistema que funcione em galês. Mas se você tiver um, à medida que seu software se desenvolve nos próximos anos, tente falar galês com ele tanto quanto possível. Isso pode apenas surpreender você e Siaradwch â chi yn Gymraeg.
Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.