p Adaptação de alto-falante e abordagens de codificação de alto-falante para treinamento, clonagem e geração de áudio. Crédito:arXiv:1802.06006 [cs.CL]
p Por meio de white paper que eles carregaram para o
arXiv servidor de pré-impressão, uma equipe da Baidu (a resposta da China ao Google) anunciou uma atualização de seu aplicativo de texto para fala chamado Deep Voice. Agora, em vez de demorar meia hora ou mais para analisar a voz de uma pessoa e reproduzi-la, o sistema pode fazer isso em menos de um minuto. O sistema baseado em rede neural é parte de um esforço da equipe do Baidu para fazer as máquinas soarem mais como humanos quando "falam" conosco. p Existem duas partes no sistema. O primeiro envolve a gravação de amostras de voz para permitir que o sistema aprenda como é a voz do sujeito. A segunda parte lê o texto definido pelo usuário em voz alta na voz do sujeito.
p Vários grupos têm trabalhado em projetos que visam reproduzir o som da voz de uma pessoa, aparentemente para permitir que os assistentes de robôs soem como assistentes humanos de verdade. Assim, um programa que converte texto em palavras que soam como você, seu vizinho, Não se espera que Donald Trump ou a Rainha da Inglaterra ofereçam muito em termos de produto final - embora o Baidu sugira que pode ser usado por pessoas que perderam o uso da voz. Em vez de, é um trampolim para coisas maiores. O novo sistema, os relatórios da equipe, funciona perfeitamente quando recebe 100 amostras de voz de cinco segundos. Ele também pode manipular uma voz, permitindo que as pessoas ouçam como eles podem soar, por exemplo, com sotaque britânico, ou como alguém do sexo oposto. Também está melhorando em imitar vozes, e agora é capaz de enganar o software de reconhecimento de voz 95 por cento do tempo - e um teste humano deu ao sistema uma classificação média de 3,16 em 4.
p Mas, como muitos na imprensa notaram, a tecnologia pode causar problemas. Interrogatórios gravados pela polícia podem se tornar inúteis se alguém com um smartphone conseguir gerar a mesma conversa. Também existe o problema do roubo de identidade. Se um ladrão pode roubar seus dados e sua voz, você pode nunca recuperá-lo. Ou considere os agentes políticos divulgando gravações falsas de políticos conversando que podem influenciar uma eleição. p © 2018 Tech Xplore