Crédito:Mohamed Elhoseiny
Aprendendo a se desviar das informações conhecidas da mesma forma que os humanos fazem, um algoritmo de "imaginação" para inteligência artificial (IA) é capaz de identificar objetos previamente invisíveis a partir de descrições escritas.
O algoritmo, desenvolvido pelo pesquisador da KAUST Mohamed Elhoseiny em colaboração com Mohamed Elfeki da University of Central Florida, abre o caminho para a imaginação artificial e a classificação automatizada de novas espécies de plantas e animais.
"A imaginação é uma das principais propriedades da inteligência humana que nos permite não apenas gerar produtos criativos como arte e música, mas também para entender o mundo visual, "explica Elhoseiny.
A inteligência artificial depende de dados de treinamento para desenvolver sua capacidade de reconhecer objetos e responder ao seu ambiente. Os humanos também desenvolvem essa habilidade por meio da experiência acumulada, mas os humanos podem fazer algo que a IA não pode. Eles podem deduzir intuitivamente uma classificação provável para um objeto anteriormente não encontrado, imaginando como algo deve ser a partir de uma descrição escrita ou por inferência de algo semelhante. Em AI, essa capacidade de imaginar o desconhecido está se tornando cada vez mais importante à medida que a tecnologia é implementada em aplicativos complexos do mundo real, onde a classificação incorreta ou o reconhecimento incorreto de novos objetos pode ser desastroso.
Também é importante o grande volume de dados necessários para treinar IA de maneira confiável para o mundo real. É inviável treinar IA com imagens de até mesmo uma fração das espécies conhecidas de plantas e animais no mundo em todas as suas permutações, muito menos as incontáveis espécies não descobertas ou não classificadas.
A pesquisa de Elhoseiny e Elfeki teve como objetivo desenvolver o que é chamado de algoritmo zero-shot learning (ZSL) para ajudar no reconhecimento de categorias anteriormente não vistas com base em descrições de nível de classe sem exemplos de treinamento.
"Modelamos o processo de aprendizagem visual para categorias 'invisíveis' relacionando ZSL com a criatividade humana, observando que ZSL trata de reconhecer o invisível, enquanto a criatividade trata de criar um 'invisível agradável, '", diz Elhoseiny.
Em criatividade, algo novo, mas agradável ou "agradável" deve ser diferente da arte anterior, mas não tão diferente a ponto de ser irreconhecível. Do mesmo jeito, Elhoseiny e Elfeki modelaram cuidadosamente um sinal de aprendizagem que incentiva indutivamente o desvio das classes vistas, ainda assim, não foi tão longe que a classe imaginada se tornou irreal e perdeu a transferência de conhecimento das classes vistas. O algoritmo resultante mostrou uma melhoria consistente em relação aos benchmarks de última geração para ZSL.
"Uma das possíveis aplicações de nossa abordagem é na identificação de espécies desconhecidas, "diz Elhoseiny." IA que é alimentada com esta tecnologia pode ajudar a relatar avistamentos de espécies sem fotos, apenas com descrições de linguagem. "