Crédito:tomasso79 / Shutterstock
Mais de 200 milhões de residências agora têm um alto-falante inteligente que fornece acesso à Internet controlado por voz, de acordo com uma estimativa global. Adicione isso aos assistentes virtuais falantes instalados em muitos smartphones, sem falar em eletrodomésticos e carros, e isso é muito Alexas e Siris.
Porque falar é uma parte fundamental do ser humano, é tentador pensar que esses assistentes devam ser designados para falar e se comportar como nós. Embora isso nos forneça uma maneira identificável de interagir com nossos dispositivos, replicar conversas humanas genuinamente realistas é incrivelmente difícil. O que mais, pesquisas sugerem que fazer uma máquina parecer humana pode ser desnecessário e até desonesto. Em vez de, podemos precisar repensar como e por que interagimos com esses assistentes e aprender a abraçar os benefícios de eles serem uma máquina.
Os designers de tecnologia de fala frequentemente falam sobre o conceito de "humanidade". Desenvolvimentos recentes no desenvolvimento de voz artificial resultaram nas vozes desses sistemas borrando a linha entre o homem e a máquina, soando cada vez mais humano. Também houve esforços para fazer a linguagem dessas interfaces parecer mais humana.
Talvez o mais famoso seja o Google Duplex, um serviço que pode marcar compromissos por telefone. Para adicionar à natureza humana do sistema, O Google incluiu expressões como "hmm" e "uh" na saída de fala de seu assistente - sons que normalmente usamos para sinalizar que estamos ouvindo a conversa ou que pretendemos começar a falar em breve. No caso do Google Duplex, estes foram usados com o objetivo de soar natural. Mas por que soar natural ou mais humano é tão importante?
Perseguir esse objetivo de fazer os sistemas soarem e se comportarem como nós talvez resulte das inspirações da cultura pop que usamos para alimentar o design desses sistemas. A ideia de falar com máquinas nos fascinou na literatura, televisão e cinema por décadas, através de personagens como HAL 9000 em 2001:A Space Odyssey ou Samantha in Her. Esses personagens retratam conversas contínuas com máquinas. No caso dela, existe até uma história de amor entre um sistema operacional e seu usuário. Criticamente, todas essas máquinas soam e respondem da maneira que pensamos que os humanos fariam.
Existem desafios tecnológicos interessantes na tentativa de alcançar algo semelhante a conversas entre nós e as máquinas. Para este fim, A Amazon lançou recentemente o Prêmio Alexa, procurando "criar bots sociais que possam conversar de maneira coerente e envolvente com humanos sobre uma variedade de eventos atuais e tópicos populares, como entretenimento, Esportes, política, tecnologia, e moda. "A rodada atual da competição pede que as equipes produzam uma conversa de 20 minutos entre um desses bots e um interator humano.
Esses grandes desafios, como outros na ciência, claramente avançam no estado da arte, trazendo benefícios planejados e não planejados. No entanto, ao se esforçar para dar às máquinas a capacidade de realmente conversar conosco como outros seres humanos, precisamos pensar sobre para que realmente servem nossas interações faladas com as pessoas e se isso é o mesmo que o tipo de conversa que queremos ter com as máquinas.
Conversamos com outras pessoas para fazer as coisas e construir e manter relacionamentos uns com os outros - e muitas vezes esses dois propósitos se entrelaçam. Ainda assim, as pessoas veem as máquinas como ferramentas que servem a propósitos limitados e têm pouco apetite para construir o tipo de relacionamento com as máquinas que fazemos todos os dias com outras pessoas.
Buscar conversas naturais com máquinas que soam como nós pode se tornar um objetivo desnecessário e pesado. Isso cria expectativas irrealistas de sistemas que podem realmente se comunicar e entender como nós. Qualquer pessoa que tenha interagido com um Amazon Echo ou Google Home sabe que isso não é possível com os sistemas existentes.
Isso é importante porque as pessoas precisam ter uma ideia de como fazer um sistema fazer coisas que, porque as interfaces somente de voz têm botões e recursos visuais limitados, são guiados significativamente pelo que o sistema diz e como o diz. A importância do design da interface significa que a própria humanidade pode não apenas ser questionável, mas enganosa, especialmente se usado para enganar as pessoas fazendo-as pensar que estão interagindo com outra pessoa. Mesmo que sua intenção seja criar vozes inteligíveis, as empresas de tecnologia precisam considerar o impacto potencial sobre os usuários.
Olhando além da humanidade
Em vez de abraçar consistentemente a humanidade, podemos aceitar que pode haver limites fundamentais, tanto tecnológico quanto filosófico, aos tipos de interação que podemos e queremos ter com as máquinas.
Devemos nos inspirar nas conversas humanas, em vez de usá-las como um padrão ouro para interação. Por exemplo, olhando para esses sistemas como executores, em vez de conversadores como os humanos, pode ser uma forma de ajudar a criar interfaces mais envolventes e expressivas. A incorporação de elementos específicos de conversação pode ser necessária para alguns contextos, mas precisamos pensar se a interação de conversação humana é necessária, em vez de usá-lo como um objetivo de design padrão.
É difícil prever como será a tecnologia no futuro e como as percepções sociais mudarão e se desenvolverão em torno de nossos dispositivos. Talvez as pessoas gostem de conversar com as máquinas, tornando-se amigo de robôs e buscando seus conselhos.
Mas atualmente somos céticos quanto a isso. Em nossa opinião, tudo tem a ver com contexto. Nem todas as interações e interfaces são iguais. Pode ser necessária alguma tecnologia da fala para estabelecer e promover alguma forma de vínculo social ou emocional, como em aplicações de saúde específicas. Se esse for o objetivo, então, faz sentido que as máquinas conversem mais apropriadamente para esse propósito - talvez soando humanas para que o usuário tenha o tipo certo de expectativas.
No entanto, isso não é universalmente necessário. Crucialmente, essa semelhança humana deve estar ligada ao que os sistemas podem realmente fazer com a conversação. Fazer sistemas que não têm a habilidade de conversar como um som humano pode causar muito mais danos do que benefícios.
Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.