A IA servirá para desenvolver um sistema de controle de rede que não apenas detecta e reage aos problemas, mas também pode prever e evitá-los. Crédito CC0:domínio público
Modelos e algoritmos para analisar redes complexas são amplamente utilizados em pesquisas e afetam a sociedade em geral por meio de suas aplicações em redes sociais online, motores de busca, e sistemas de recomendação. De acordo com um novo estudo, Contudo, uma abordagem algorítmica amplamente usada para modelar essas redes é fundamentalmente falha, falha em capturar propriedades importantes de redes complexas do mundo real.
"Não é que essas técnicas estejam lhe dando lixo absoluto. Eles provavelmente contêm alguma informação, mas não tanta informação quanto muitas pessoas acreditam, "disse C." Sesh "Seshadhri, professor associado de ciência da computação e engenharia na Baskin School of Engineering da UC Santa Cruz.
Seshadhri é o primeiro autor de um artigo sobre as novas descobertas publicado em 2 de março em Anais da Academia Nacional de Ciências . O estudo avaliou técnicas conhecidas como "embeddings de baixa dimensão, "que são comumente usados como entrada para modelos de aprendizado de máquina. Esta é uma área ativa de pesquisa, com novos métodos de incorporação sendo desenvolvidos em um ritmo rápido. Mas Seshadhri e seus co-autores dizem que todos esses métodos compartilham as mesmas deficiências.
Para explicar por que, Seshadhri usou o exemplo de uma rede social, um tipo familiar de rede complexa. Muitas empresas aplicam o aprendizado de máquina aos dados da rede social para gerar previsões sobre o comportamento das pessoas, recomendações para usuários, e assim por diante. As técnicas de incorporação convertem essencialmente a posição de uma pessoa em uma rede social em um conjunto de coordenadas para um ponto em um espaço geométrico, produzindo uma lista de números para cada pessoa que pode ser conectada a um algoritmo.
"Isso é importante porque algo abstrato como a 'posição de uma pessoa em uma rede social' pode ser convertido em uma lista concreta de números. Outra coisa importante é que você deseja converter isso em um espaço de baixa dimensão, de modo que a lista de números que representam cada pessoa é relativamente pequena, "Seshadhri explicou.
Depois que essa conversão for feita, o sistema ignora a rede social real e faz previsões com base nas relações entre pontos no espaço. Por exemplo, se muitas pessoas perto de você naquele espaço estão comprando um determinado produto, o sistema pode prever que você provavelmente comprará o mesmo produto.
Seshadhri e seus co-autores demonstraram matematicamente que aspectos estruturais significativos de redes complexas são perdidos neste processo de incorporação. Eles também confirmaram esse resultado testando empiricamente várias técnicas de incorporação em diferentes tipos de redes complexas.
"Não estamos dizendo que certos métodos específicos falham. Estamos dizendo que qualquer método de incorporação que forneça uma pequena lista de números irá fundamentalmente falhar, porque uma geometria de baixa dimensão simplesmente não é expressiva o suficiente para redes sociais e outras redes complexas, "Seshadhri disse.
Uma característica crucial das redes sociais do mundo real é a densidade de triângulos, ou conexões entre três pessoas.
"Onde você tem muitos triângulos, isso significa que há muita estrutura de comunidade nessa parte de uma rede social, "Seshadhri disse." Além disso, esses triângulos são ainda mais significativos quando você olha para pessoas que têm redes sociais limitadas. Em uma rede social típica, algumas pessoas têm toneladas de conexões, mas a maioria das pessoas não tem muitos contatos. "
Em sua análise de técnicas de incorporação, os pesquisadores observaram que muitos triângulos sociais que representam a estrutura da comunidade se perdem no processo de incorporação. "Todas essas informações parecem desaparecer, então é quase como se tudo o que você queria encontrar tivesse se perdido quando você construiu essas representações geométricas, "Seshadhri disse.
Embeddings de baixa dimensão não são de forma alguma os únicos métodos usados para gerar previsões e recomendações. Normalmente, eles são apenas uma das muitas entradas em um modelo de aprendizado de máquina muito grande e complexo.
"Este modelo é uma enorme caixa preta, e muitos dos resultados positivos relatados dizem que, se você incluir esses embeddings de baixa dimensão, seu desempenho sobe, talvez você tenha um leve inchaço. Mas se você o usou sozinho, parece que você perderia muito, "Seshadhri disse.
Ele também observou que os novos métodos de incorporação estão, em sua maioria, sendo comparados a outros métodos de incorporação. Trabalho empírico recente de outros pesquisadores, Contudo, mostra que diferentes técnicas podem dar melhores resultados para tarefas específicas.
"Digamos que você queira prever quem é republicano e quem é democrata. Existem técnicas desenvolvidas especificamente para essa tarefa que funcionam melhor do que casamentos, "disse ele." A alegação é que essas técnicas de incorporação funcionam para muitas tarefas diferentes, e é por isso que muitas pessoas os adotaram. Também é muito fácil conectá-los a um sistema de aprendizado de máquina existente. Mas para qualquer tarefa em particular, Acontece que sempre há algo melhor que você pode fazer. "
Dada a crescente influência do aprendizado de máquina em nossa sociedade, Seshadhri disse que é importante investigar se as suposições subjacentes aos modelos são válidas.
"Temos todas essas máquinas complicadas fazendo coisas que afetam nossas vidas significativamente. Nossa mensagem é apenas que precisamos ser mais cuidadosos ao avaliar essas técnicas, "disse ele." Especialmente nos dias de hoje em que o aprendizado de máquina está se tornando cada vez mais complicado, é importante entender o que pode e o que não pode ser feito. "