Pesquisadores de Princeton, liderado pelo professor de engenharia elétrica Niraj Jha, desenvolveu uma técnica que produz programas avançados de inteligência artificial para dispositivos vestíveis, como um relógio inteligente. Ao imitar o arco de desenvolvimento do cérebro, a nova abordagem leva a uma precisão de referência usando uma fração da energia de outros sistemas. Da esquerda:Prerit Terway, Hongxu Yin, Niraj Jha, Seyed Shayan Hassantabar. Crédito:Sameer A. Khan / Fotobuddy
Pode ser um choque para os pais que enfrentam o caos diário da vida de uma criança, mas a complexidade do cérebro atinge o pico por volta dos três anos.
O número de conexões entre os neurônios virtualmente explode em nossos primeiros anos. Depois disso, o cérebro começa a podar porções não utilizadas desta vasta rede elétrica, emagrecimento para cerca de metade do número quando chegamos à idade adulta. O superprovisionamento do cérebro da criança nos permite adquirir linguagem e desenvolver habilidades motoras finas. Mas o que não usamos, nós perdemos.
Agora, esse fluxo e refluxo da complexidade biológica inspirou uma equipe de pesquisadores de Princeton a criar um novo modelo de inteligência artificial, criar programas que atendam ou superem os padrões da indústria de precisão usando apenas uma fração da energia. Em dois artigos publicados no início deste ano, os pesquisadores mostraram como começar com um design simples para uma rede de IA, aumentar a rede adicionando neurônios e conexões artificiais, em seguida, podar as porções não utilizadas, deixando um produto final magro, mas altamente eficaz.
"Nossa abordagem é o que chamamos de paradigma do cultivo e poda, "disse o professor de Engenharia Elétrica Niraj Jha." É semelhante ao que o cérebro faz desde quando somos bebês até quando somos crianças. "Em seu terceiro ano, o cérebro humano começa a cortar conexões entre as células cerebrais. Este processo continua na idade adulta, de modo que o cérebro totalmente desenvolvido opera aproximadamente na metade de seu pico sináptico.
"O cérebro adulto é especializado em qualquer treinamento que lhe demos, "Jha disse." Não é tão bom para o aprendizado de uso geral quanto o cérebro de uma criança. "
O crescimento e a poda resultam em software que requer uma fração do poder computacional, e assim usa muito menos energia, para fazer previsões igualmente boas sobre o mundo. Limitar o uso de energia é fundamental para obter esse tipo de IA avançada, chamada de aprendizado de máquina, em pequenos dispositivos como telefones e relógios.
"É muito importante executar os modelos de aprendizado de máquina localmente porque a transmissão [para a nuvem] consome muita energia, "disse Xiaoliang Dai, um ex-aluno de graduação de Princeton e primeiro autor dos dois artigos. Dai é agora um cientista pesquisador do Facebook.
No primeiro estudo, os pesquisadores reexaminaram os fundamentos do aprendizado de máquina - as estruturas de código abstratas chamadas redes neurais artificiais. Tomando a inspiração do desenvolvimento da primeira infância, a equipe projetou uma ferramenta de síntese de rede neural (NeST) que recriou várias redes neurais importantes do zero, automaticamente, usando modelos matemáticos sofisticados desenvolvidos pela primeira vez na década de 1980.
O NeST começa com apenas um pequeno número de neurônios artificiais e conexões, aumenta em complexidade ao adicionar mais neurônios e conexões à rede, e uma vez que atenda a um determinado benchmark de desempenho, começa a se estreitar com o tempo e o treinamento. Pesquisadores anteriores haviam empregado estratégias de poda semelhantes, mas a combinação crescer e podar - passar do "cérebro do bebê" ao "cérebro da criança" e emagrecer em direção ao "cérebro adulto" - representou um salto da velha teoria para a nova demonstração.
O segundo artigo, que inclui colaboradores do Facebook e da University of California-Berkeley, introduziu uma estrutura chamada Chameleon que começa com os resultados desejados e retrocede para encontrar a ferramenta certa para o trabalho. Com centenas de milhares de variações disponíveis nas facetas específicas de um design, os engenheiros enfrentam um paradoxo de escolha que vai muito além da capacidade humana. Por exemplo:A arquitetura de recomendação de filmes não se parece com a que reconhece tumores. O sistema ajustado para câncer de pulmão parece diferente de um para câncer cervical. Assistentes de demência podem parecer diferentes para homens e mulheres. E assim por diante, ao infinito.
Jha descreveu o Chameleon como engenheiros de direção em direção a um subconjunto favorável de projetos. "Está me dando uma boa vizinhança, e posso fazer isso em minutos de CPU, "Jha disse, referindo-se a uma medida de tempo de processo computacional. "Assim, posso obter rapidamente a melhor arquitetura." Em vez de toda a extensa metrópole, basta procurar algumas ruas.
O Camaleão trabalha treinando e amostrando um número relativamente pequeno de arquiteturas que representam uma ampla variedade de opções, em seguida, prevê o desempenho desses projetos com um determinado conjunto de condições. Porque reduz os custos iniciais e funciona em plataformas enxutas, a abordagem altamente adaptativa "poderia expandir o acesso a redes neurais para organizações de pesquisa que atualmente não têm os recursos para tirar proveito desta tecnologia, "de acordo com uma postagem de blog do Facebook.