Crédito:IBM
A competição começou quando a voz feminina do computador, uma mistura de Alexa da Amazon e comunicador de Stephen Hawking, falou com seu oponente humano:"Olá, Noa. Nos encontramos novamente."
Fui o único acadêmico convidado para a sala lotada de cerca de 50 jornalistas para testemunhar a recente disputa entre a inteligência artificial do Project Debater da IBM e os campeões de debates israelenses Noa Ovadia e Dan Zafrir. A manobra de abertura produziu risadas e revirar os olhos do público. Eu era mais um revirador de olhos - não estou convencido de que o material predefinido óbvio realmente ajude a mostrar as tecnologias de IA. O que se seguiu foi, inegavelmente, um feito impressionante de engenharia - mas pode ser muito fácil pensar que a IA de ficção científica está logo ali.
O Project Debater segue o anúncio de que o Google desenvolveu uma tecnologia de IA conhecida como Duplex, que pode conduzir conversas telefônicas que parecem naturais para marcar compromissos e realizar outras tarefas. Ambos os projetos parecem envolver IA que está se aproximando da competência de nível humano, que poderia passar no teste de Turing, e iminentemente dominar o mundo, possivelmente. Mas isso é uma ilusão nascida do marketing cuidadoso dessas enormes corporações. A realidade é que ainda estamos nos primeiros dias de compreensão da IA.
Após as táticas iniciais para agradar ao público, O computador da IBM produziu um discurso de quatro minutos, no vôo, sobre um tópico selecionado aleatoriamente de uma lista de 40 na qual ainda não havia sido treinado para debater. Ele fez isso identificando, classificando, selecionando e juntando fragmentos de uma biblioteca de 300 milhões de artigos de notícias. O resultado foi amplamente gramaticalmente correto, semanticamente na mensagem e mais ou menos coerente. O sistema foi então capaz de ouvir e responder a uma declaração semelhante de seu oponente humano.
Talvez valha a pena refletir sobre como essas tarefas são difíceis. Manter uma conversa é extremamente desafiador, uma vez que você vai além da estrutura, domínios rigidamente controlados. Sistemas de aprendizagem profunda, inspirado no cérebro humano, estão tentando mapear tudo o que o humano diz para um número relativamente pequeno de movimentos possíveis com um pequeno número de valores possíveis. O Google Duplex ainda funciona em um domínio específico, como reservar o jantar, e por isso pode ser muito robusto.
Ter uma discussão é ainda mais exigente. É extremamente difícil construir um algoritmo para determinar com segurança se uma determinada frase apóia sua posição ou não. Em um nível, a equipe IBM acertou em cheio, com o Project Debater produzindo sua declaração coerente e persuasiva de quatro minutos. Também fiquei muito impressionado com a estrutura gramatical do computador tão boa, especialmente porque cada frase pode ter sido extraída de vários artigos da biblioteca.
Tecnologia ainda limitada
No entanto, à medida que o discurso prosseguia, Tive a nítida sensação de que a estrutura temática estava rompendo, com o fluxo flutuando entre os tópicos. A máquina terminou o estrondo na marca dos quatro minutos com um belo floreio retórico de antecipar e atacar o argumento do oponente (conhecido como procatalepse). Mas depois, a refutação de dois minutos do computador ao seu oponente humano soava cada vez mais como mera repetição.
O Project Debater alcançou novos avanços significativos em áreas como a busca de argumentos em textos (mineração de argumentos), juntamente com soluções técnicas, como o reparo gramatical que envolve a colagem de partes de frases. Mas, como orador, o computador ainda está dando seus primeiros pequenos guinchos.
O sistema tem apenas a noção mais rudimentar de estrutura de argumento e, com frequência, se desvia do tema principal. Não dá atenção ao seu público, nem seu oponente, e não tem como adaptar sua linguagem ou explorar qualquer uma das centenas de técnicas retóricas inteligentes que ajudam a conquistar o público
Nem a IBM nem o Google afirmam, ou mesmo insinuando, que eles resolveram todos os problemas de IA, ou máquinas construídas com desempenho de nível humano. Em ambos os casos, os programadores têm objetivos específicos em mente que mais ou menos levam diretamente à tecnologia comercial.
O valor real da tecnologia de argumento como um todo não será entregue na câmara de debate, mas em aplicações nas quais os sistemas de IA podem contribuir para as equipes de tomada de decisão humana. Seja na sala de incidentes policiais, o bunker de análise de inteligência ou a sala de aula, só pode ser bom aumentar a robustez da tomada de decisão baseada em evidências, introduzindo sistemas de IA que podem contribuir para a conversa. Eles serão capazes de adicionar novas informações ou criticar o raciocínio humano.
O Debatedor do Projeto é um passo valioso em direção a esse objetivo, e o objetivo mais amplo de construir IA que possa realmente nos entender e responder. Mas certamente não estamos prestes a ver os sistemas de IA superando suas contrapartes humanas. A tecnologia de IA de hoje está tão longe desses cenários quanto os experimentos dos romanos com energia a vapor estavam na revolução industrial.
Este artigo foi publicado originalmente em The Conversation. Leia o artigo original.