• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Os pesquisadores usam o aprendizado profundo para construir um sistema de reconhecimento automático de voz para ajudar a preservar a linguagem Seneca

    Da esquerda para direita, Ray Ptucha, professor assistente de engenharia da computação, Robbie Jimerson, estudante de doutorado em ciência da computação, ambos da RIT, e Emily Prud'hommeaux, professor assistente de ciência da computação, estão liderando o projeto da NSF para usar tecnologia de inteligência artificial para preservar a linguagem Sêneca. Crédito:A. Sue Weisler / RIT

    Um novo projeto de pesquisa no Rochester Institute of Technology ajudará a garantir que a língua ameaçada da nação indígena Seneca seja preservada. Usando aprendizado profundo, uma forma de inteligência artificial, Os pesquisadores do RIT estão construindo um aplicativo de reconhecimento automático de voz para documentar e transcrever a linguagem tradicional do povo Sêneca. A obra também pretende ser um recurso tecnológico para preservar outras línguas raras ou em extinção.

    "A motivação para isso é pessoal. O primeiro passo para a preservação e revitalização de nossa língua é a documentação dela, "disse Robert Jimerson (Sêneca), Doutoranda em Informática e Ciências da Informação da RIT e membro da equipa de investigação. Ele reuniu anciãos tribais e amigos íntimos, todos os oradores de Sêneca, para ajudar a produzir documentação de áudio e textual desta língua nativa americana falada fluentemente por menos de 50 pessoas.

    Como todas as línguas, Sêneca tem dialetos diferentes. Ele também apresenta desafios únicos por causa de seu sistema complexo para a construção de novas palavras, em que uma frase inteira pode ser expressa em uma única palavra.

    Jimerson é capaz de unir a tecnologia e a linguagem.

    "Sob o capô, são dados. Com muitas línguas nativas, você não tem esse volume de dados, " ele disse, explicando que algumas línguas, enquanto falado, pode não ter tantas ferramentas linguísticas formais - dicionários, materiais gramaticais ou aulas extensas para falantes não nativos, semelhantes aos do espanhol ou chinês. "Um dos processos mais caros e demorados de documentar a linguagem é coletá-la e transcrevê-la. Estamos procurando obter redes profundas e talvez mudar a arquitetura, fazer alguns dados sintéticos para criar mais dados, mas como você faz isso funcionar no aprendizado profundo? Como você aumenta os dados que já possui? "

    Esse processo de obtenção de dados está sendo coordenado por uma ampla equipe que inclui Jimerson; a investigadora principal do projeto, Emily Prud'hommeaux, professor assistente de ciência da computação no Boston College e docente de pesquisa no College of Liberal Arts do RIT; Ray Ptucha, professora assistente de engenharia da computação na Kate Gleason College of Engineering da RIT e especialista em sistemas e tecnologias de aprendizagem profunda; e Karen Michaelson, professor de linguística, a Universidade Estadual de Nova York em Buffalo. A equipe de pesquisa recebeu $ 181, 682 em financiamento de mais de quatro anos da National Science Foundation for "Collaborative Research:Deep Learning Speech Recognition for Document Seneca e outras línguas com poucos recursos".

    "Este é um projeto empolgante porque reúne pessoas de muitas disciplinas e origens, da engenharia e ciência da computação à linguística e pedagogia da linguagem, "disse Prud'hommeaux." Além de nos permitir desenvolver tecnologia de ponta, este projeto apóia alunos de graduação e pós-graduação e envolve membros de uma comunidade indígena que poucas pessoas sabem que está bem aqui no oeste de Nova York. "

    Os pesquisadores iniciaram o projeto no final de junho, reunindo os membros da comunidade e linguistas para a coleta de dados - adquirindo e traduzindo o atual e o novo, gravações originais de conversas do Seneca, em seguida, convertendo dados em saída textual usando modelos de aprendizagem profunda.

    "O que você realmente está tentando fazer é encontrar a linha entre os novos dados que você pode obter e a mudança da arquitetura de uma rede, "Jimerson explicou.

    Desde o verão, a equipe tem pouco mais de 50 horas de material gravado com pessoas trabalhando em tempo integral nas traduções que incluem quebrar a linguagem em símbolos fonéticos individuais e usar essas informações para iniciar o treinamento dos modelos.

    "Usamos um processo chamado transferência de aprendizagem, que começa com um modelo treinado com a fala em inglês prontamente disponível para obter o básico, treinamento inicial para o sistema, em seguida, treinaremos novamente as redes neurais e faremos o ajuste fino para a linguagem Sêneca. Estamos obtendo resultados muito bons, "disse Ptucha, que é um especialista em sistemas e tecnologias de aprendizagem profunda. A tecnologia de aprendizado profundo consiste em várias camadas de neurônios artificiais, organizado em uma hierarquia cada vez mais abstrata. Essas arquiteturas produziram resultados de última geração em todos os tipos de problemas de reconhecimento de padrões, incluindo aplicativos de reconhecimento de imagem e voz.

    "Ninguém realmente tentou isso antes, treinar um modelo de reconhecimento de fala automatizado em algo tão restrito quanto Sêneca. Robbie é o especialista em transcrever Sêneca e treinar os outros sobre como fazer isso. Ele é um cara muito raro, "disse Ptucha,

    Este projeto atual é uma continuação do trabalho de Jimerson para expandir os recursos linguísticos disponíveis para sua comunidade. Em 2013, enquanto ele era um estudante de pós-graduação no Golisano College of Computing and Information Sciences da RIT, ele desenvolveu um dicionário de tradução de idiomas Sêneca online para o Programa de Revitalização de Idiomas Sêneca. O projeto foi financiado pelo Seneca Nation e concedido ao programa Future Steward's da RIT.


    © Ciência https://pt.scienceaq.com