• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Por que a inteligência artificial ainda não existe

    Exemplo de um agente de aprendizagem em um jogo de computador:o personagem é controlado por um jogador humano. Os olhos são os agentes. O jogador deve guiar os agentes de forma que eles executem uma tarefa, por exemplo, sem colidir primeiro com um obstáculo. O treinamento é baseado em um processo de aprendizado de máquina; tudo o que o jogador faz é delinear os requisitos básicos. Crédito:RUB, Institut für Neuroinformatik

    Os processos subjacentes à inteligência artificial hoje são, na verdade, bastante estúpidos. Pesquisadores de Bochum estão tentando torná-los mais inteligentes.

    Mudança radical, revolução, megatendência, talvez até um risco:a inteligência artificial penetrou todos os segmentos industriais e mantém a mídia ocupada. Pesquisadores do Instituto RUB de Computação Neural o estudam há 25 anos. Seu princípio norteador é:para que as máquinas sejam realmente inteligentes, novas abordagens devem primeiro tornar o aprendizado de máquina mais eficiente e flexível.

    "Existem dois tipos de aprendizado de máquina que são bem-sucedidos hoje:redes neurais profundas, também conhecido como Deep Learning, bem como aprendizado de reforço, "explica o professor Laurenz Wiskott, Cadeira de Teoria de Sistemas Neuronais.

    As redes neurais são capazes de tomar decisões complexas. Eles são frequentemente utilizados em aplicativos de reconhecimento de imagem. "Eles podem, por exemplo, diga pelas fotos se o assunto é um homem ou uma mulher, "diz Wiskott.

    A arquitetura dessas redes é inspirada em redes de células nervosas, ou neurônios, em nosso cérebro. Os neurônios recebem sinais através de vários canais de entrada e então decidem se eles passam o sinal na forma de um pulso elétrico para os próximos neurônios ou não.

    Da mesma forma, as redes neurais recebem vários sinais de entrada, por exemplo, pixels. Em uma primeira etapa, muitos neurônios artificiais calculam um sinal de saída a partir de vários sinais de entrada, simplesmente multiplicando as entradas por pesos diferentes, mas constantes, e depois somando-os. Cada uma dessas operações aritméticas resulta em um valor que - para ficar com o exemplo de homem / mulher - contribui um pouco para a decisão por homem ou mulher. "O resultado é ligeiramente alterado, Contudo, definindo resultados negativos para zero. Esse, também, é copiado das células nervosas e é essencial para o desempenho das redes neurais, "explica Laurenz Wiskott.

    A mesma coisa acontece novamente na próxima camada, até que a rede tome uma decisão na fase final. Quanto mais estágios houver no processo, quanto mais poderoso ele é - redes neurais com mais de 100 estágios não são incomuns. As redes neurais geralmente resolvem tarefas de discriminação melhor do que os humanos.

    O efeito de aprendizagem de tais redes é baseado na escolha dos fatores de ponderação corretos, que são inicialmente escolhidos aleatoriamente. “Para treinar essa rede, os sinais de entrada, bem como qual deve ser a decisão final, são especificados desde o início, "elabora Laurenz Wiskott. Assim, a rede é capaz de ajustar gradativamente os fatores de ponderação para finalmente tomar a decisão correta com a maior probabilidade.

    Aprendizagem por reforço, por outro lado, é inspirado pela psicologia. Aqui, cada decisão tomada pelo algoritmo - os especialistas chamam de agente - é recompensada ou punida. "Imagine uma grade com o agente no meio, "ilustra Laurenz Wiskott." Seu objetivo é alcançar a caixa superior esquerda pelo caminho mais curto possível - mas ele não sabe disso. "A única coisa que o agente deseja é obter o máximo de recompensas possível, caso contrário, não tem noção. Inicialmente, ele se moverá pelo tabuleiro aleatoriamente, e cada passo que não atingir a meta será punido. Apenas o passo em direção ao objetivo resulta em uma recompensa.

    Qual rota o robô deve seguir? Essa decisão é baseada em inúmeras operações aritméticas. Crédito:Roberto Schirdewahn

    Para aprender, o agente atribui um valor a cada campo, indicando quantas etapas faltam dessa posição até seu objetivo. Inicialmente, esses valores são aleatórios. Quanto mais experiência o agente ganha em seu conselho, melhor ele pode adaptar esses valores às condições da vida real. Após inúmeras corridas, é capaz de encontrar o caminho mais rápido para seu objetivo e, consequentemente, para a recompensa.

    "O problema com esses processos de aprendizado de máquina é que eles são muito burros, "diz Laurenz Wiskott." As técnicas subjacentes datam da década de 1980. A única razão de seu sucesso atual é que hoje temos mais capacidade de computação e mais dados à nossa disposição. "Por isso, é possível executar rapidamente os processos de aprendizagem virtualmente ineficientes inúmeras vezes e alimentar redes neurais com uma infinidade de imagens e descrições de imagens para treiná-las.

    "O que queremos saber é:como podemos evitar tanto tempo, treinamento sem sentido? E, acima de tudo:como podemos tornar o aprendizado de máquina mais flexível? ", Como Wiskott coloca de forma sucinta. A inteligência artificial pode ser superior aos humanos exatamente na tarefa para a qual foi treinada, mas não pode generalizar ou transferir seu conhecimento para tarefas relacionadas.

    É por isso que os pesquisadores do Institute for Neural Computation estão se concentrando em novas estratégias que ajudem as máquinas a descobrir estruturas de forma autônoma. "Para este fim, nós implantamos o princípio da aprendizagem não supervisionada, "diz Laurenz Wiskott. Embora as redes neurais profundas e a aprendizagem por reforço sejam baseadas na apresentação do resultado desejado ou na recompensa ou punição de cada etapa, os pesquisadores deixam os algoritmos de aprendizagem em grande parte sozinhos com suas entradas.

    "Uma tarefa pode ser, por exemplo, para formar clusters, "explica Wiskott. Para este propósito, o computador é instruído a agrupar dados semelhantes. Com relação aos pontos em um espaço tridimensional, isso significaria agrupar pontos cujas coordenadas estão próximas umas das outras. Se a distância entre as coordenadas for maior, eles seriam alocados a grupos diferentes.

    "Voltando ao exemplo das fotos de pessoas, pode-se olhar o resultado após o agrupamento e provavelmente descobrir que o computador reuniu um grupo com fotos de homens e um grupo com fotos de mulheres, "elabora Laurenz Wiskott." Uma grande vantagem é que tudo o que é necessário no início são fotos, em vez de uma legenda de imagem que contém a solução para o enigma para fins de treinamento, por assim dizer."

    O princípio da lentidão

    Além disso, este método oferece mais flexibilidade, porque essa formação de agrupamento não se aplica apenas a fotos de pessoas, mas também para aqueles de carros, plantas, casas ou outros objetos.

    Outra abordagem perseguida por Wiskott é o princípio da lentidão. Aqui, não são as fotos que constituem o sinal de entrada, mas imagens em movimento:se todos os recursos forem extraídos de um vídeo que muda muito lentamente, surgem estruturas que ajudam a construir uma representação abstrata do ambiente. "Aqui, também, o objetivo é pré-estruturar os dados de entrada, "aponta Laurenz Wiskott. Eventualmente, os pesquisadores combinam essas abordagens de forma modular com os métodos de aprendizagem supervisionada, para criar aplicativos mais flexíveis e, no entanto, muito precisos.

    "O aumento da flexibilidade resulta naturalmente em perda de desempenho, "admite o pesquisador. Mas, no longo prazo, flexibilidade é indispensável se quisermos desenvolver robôs que possam lidar com novas situações. "


    © Ciência https://pt.scienceaq.com