• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Reconhecimento de fala usando redes neurais artificiais e otimização de colônias de abelhas artificiais

    Diagrama de blocos do modelo proposto. Crédito:Shukla &Jain.

    Ao longo da última década ou assim, os avanços no aprendizado de máquina abriram caminho para o desenvolvimento de ferramentas de reconhecimento de fala cada vez mais avançadas. Ao analisar arquivos de áudio de fala humana, essas ferramentas podem aprender a identificar palavras e frases em diferentes idiomas, convertendo-os em um formato legível por máquina.

    Embora vários modelos baseados em aprendizado de máquina tenham alcançado resultados promissores em tarefas de reconhecimento de fala, nem sempre têm um bom desempenho em todos os idiomas. Por exemplo, quando um idioma tem um vocabulário com muitas palavras de som semelhante, o desempenho dos sistemas de reconhecimento de voz pode diminuir consideravelmente.

    Pesquisadores da Faculdade de Engenharia e Tecnologia da Missão Mahatma Gandhi e do Instituto Jaypee de Tecnologia da Informação, na Índia, desenvolveram um sistema de reconhecimento de voz para resolver este problema. Este novo sistema, apresentado em um artigo publicado na Springer Link's International Journal of Speech Technology , combina uma rede neural artificial (RNA) com uma técnica de otimização conhecida como colônia de abelhas artificiais de oposição (OABC).

    "Nesse trabalho, a estrutura padrão das RNAs é redesenhada usando o algoritmo Levenberg-Marquardt para recuperar uma taxa de predição ótima com precisão, "Os pesquisadores escreveram em seu artigo." As camadas ocultas e os neurônios das camadas ocultas são otimizados ainda mais usando a técnica de otimização de colônias de abelhas artificiais de oposição. "

    Uma característica única do sistema desenvolvido pelos pesquisadores é que ele usa um algoritmo de otimização OABC para otimizar as camadas da RNA e os neurônios artificiais. Como o nome sugere, Os algoritmos de colônias artificiais de abelhas (ABC) são projetados para simular o comportamento das abelhas para lidar com uma variedade de problemas de otimização.

    "Geralmente, algoritmos de otimização inicializam aleatoriamente as soluções no domínio correspondente, "os pesquisadores explicaram em seu artigo." Mas esta solução pode estar na direção oposta da melhor solução, aumentando assim a sobrecarga computacional significativamente. Portanto, essa inicialização baseada em oposição é denominada OABC. "

    O sistema desenvolvido pelos pesquisadores considera palavras individuais faladas por diferentes pessoas como um sinal de entrada de voz. Subseqüentemente, ele extrai os chamados recursos de espectrograma de modulação de amplitude (AM), que são essencialmente características específicas do som.

    Os recursos extraídos pelo modelo são então usados ​​para treinar a RNA para reconhecer a fala humana. Depois de ser treinado em um grande banco de dados de arquivos de áudio, a RNA aprende a prever palavras isoladas em novos exemplos de fala humana.

    Os pesquisadores testaram seu sistema em uma série de clipes de áudio de fala humana e o compararam com técnicas de reconhecimento de fala mais convencionais. Sua técnica superou todos os outros métodos, atingindo notáveis ​​pontuações de precisão.

    "A sensibilidade, especificidade, e a precisão do método proposto é de 90,41 por cento, 99,66 por cento e 99,36 por cento, respectivamente, que é melhor do que todos os métodos existentes, "escreveram os pesquisadores em seu artigo.

    No futuro, o sistema de reconhecimento de voz pode ser usado para alcançar uma comunicação homem-máquina mais eficaz em uma variedade de ambientes. Além disso, a abordagem que eles usaram para desenvolver o sistema pode inspirar outras equipes a projetar modelos semelhantes, que combinam RNAs e técnicas de otimização OABC.

    © 2019 Science X Network




    © Ciência https://pt.scienceaq.com