• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Por que as pessoas vão vencer as máquinas no reconhecimento da fala por muito tempo

    Crédito:Pathdoc / Shutterstock.cim

    Imagine um mundo em que Siri sempre entende você, O Google Tradutor funciona perfeitamente, e os dois criam algo semelhante a um circuito de tradução no estilo Doctor Who. Imagine ser capaz de se comunicar livremente onde quer que você vá (não ter que murmurar na escola o francês para o garçom parisiense). É um atrativo, mas perspectiva ainda distante. Um dos gargalos para mover essa realidade adiante é a variação na linguagem, especialmente a linguagem falada. A tecnologia não consegue lidar com isso.

    Humanos, por outro lado, são incrivelmente bons em lidar com variações de linguagem. Nós somos tão bons, na verdade, que realmente tomamos nota quando as coisas ocasionalmente quebram. Quando visitei a Nova Zelândia, Eu pensei por um tempo que as pessoas estavam me chamando de "animal de estimação, "um termo carinhoso ao estilo de Newcastle. Eles eram, na verdade, apenas dizendo meu nome, Pat. Meu momento aha aconteceu em um café ("Branco liso para animal de estimação!" Me deu uma pausa).

    Esta história ilustra como diferentes sotaques do inglês têm vogais ligeiramente diferentes - um fato bem conhecido. Mas vamos tentar entender o que aconteceu quando eu ouvi mal a pronúncia Kiwi de Pat como bicho de estimação . Existe uma certa gama de sons que associamos às vogais, gostar uma ou e . Esses intervalos não são absolutos. Em vez, seus limites variam, por exemplo, entre diferentes sotaques. Quando os ouvintes não conseguem se ajustar a isso, como eu fiz neste caso, o mapeamento do som para o significado pode ser distorcido.

    Um poderia, laboriosamente, ensinar diferentes sotaques para um sistema de reconhecimento de voz, mas a variação do sotaque é apenas a ponta do iceberg. Os sons vocálicos também podem variar dependendo da nossa idade, Gênero sexual, classe social, etnia, orientação sexual, nível de intoxicação, o quão rápido estamos falando, com quem estamos falando, estejamos ou não em um ambiente barulhento ... a lista continua, e assim por diante.

    O ponto crucial da questão

    Considere que um estudo recente no qual participei mostrou que até mesmo mudar de casa (ou não) pode afetar as vogais de uma pessoa. Especificamente, há uma correlação entre como os falantes do inglês do norte pronunciam a vogal em palavras como ponto crucial , e quantas vezes eles se mudaram na última década. Pessoas que não se mexeram têm mais probabilidade de pronunciar ponto crucial o mesmo que vigaristas , que é a pronúncia tradicional do inglês do norte. Mas aqueles que se moveram quatro vezes ou mais têm mais probabilidade de ter vogais diferentes nas duas palavras, da mesma forma no sul da Inglaterra.

    Há, claro, nada sobre o ato de mover que causa isso. Mas mudar de casa várias vezes está relacionado a outros fatores de estilo de vida, por exemplo, interagir com mais pessoas, incluindo pessoas com sotaques diferentes, o que pode influenciar a maneira como falamos.

    Outras fontes de variação podem ter a ver com fatores linguísticos, como a estrutura da palavra. Um exemplo notável vem de pares de palavras como régua , que significa "dispositivo de medição" e régua , que significa "líder".

    Essas duas palavras são superficialmente idênticas, mas eles diferem em um nível estrutural mais profundo. UMA régua é alguém que manda, apenas como um cantor é alguém que canta, portanto, podemos analisar essas palavras como consistindo em duas unidades significativas. Em contraste, régua o que significa "dispositivo de medição" não pode ser decomposto posteriormente.

    Nível de sobreposição entre as categorias de vogais ‘crooks’ e ‘crux’, dependendo do número de mudanças de casa na última década. Dados de 143 falantes do norte da Inglaterra.

    Acontece que os dois significados de régua estão associados a uma vogal diferente para muitos falantes do inglês do sul da Grã-Bretanha, e a diferença entre as duas palavras aumentou nos últimos anos:é maior para falantes mais jovens do que para falantes mais velhos. Portanto, tanto a estrutura linguística oculta quanto a idade do falante podem afetar a maneira como pronunciamos certas vogais.

    Fim nunca à vista

    Isso ilustra outra propriedade importante da variação da linguagem:ela sempre muda. Os pesquisadores da linguagem, portanto, constantemente têm que revisar sua compreensão da variação, o que, por sua vez, exige a continuidade da aquisição de novos dados, e atualizar a análise. A maneira como fazemos isso em linguística está sendo revolucionada por novas tecnologias, avanços na análise de dados instrumentais, e a onipresença de equipamentos de gravação (em 2018, 82% da população adulta do Reino Unido possuía um dispositivo de gravação, também conhecido como smartphone).

    Os projetos linguísticos modernos podem lucrar com o avanço tecnológico de várias maneiras. Por exemplo, o aplicativo English Dialects coleta gravações remotamente por meio de smartphones, para construir um corpus grande e em constante atualização de sotaques ingleses modernos. Esse corpus é a fonte do achado sobre a vogal em ponto crucial no inglês do norte, por exemplo. O acúmulo de informações deste e de muitos outros projetos nos permite rastrear a variação com maior cobertura, e construir modelos cada vez mais precisos prevendo a realização de sons individuais.

    Essa compreensão linguística recém-refinada também pode melhorar a tecnologia de reconhecimento de voz? Possivelmente, mas para melhorar, a tecnologia precisa saber muito mais sobre você.

    Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.




    © Ciência https://pt.scienceaq.com