Os matemáticos propõem uma nova maneira de usar redes neurais para trabalhar com ruído, dados de alta dimensão
p Crédito:RUDN University
p Matemáticos da RUDN University e da Free University of Berlin propuseram uma nova abordagem para estudar as distribuições de probabilidade de dados observados usando redes neurais artificiais. A nova abordagem funciona melhor com os chamados outliers, ou seja, objetos de dados de entrada que se desviam significativamente da amostra geral. O artigo foi publicado na revista
Inteligência artificial . p A restauração da distribuição de probabilidade dos dados observados por redes neurais artificiais é a parte mais importante do aprendizado de máquina. A distribuição de probabilidade não só nos permite prever o comportamento do sistema em estudo, mas também para quantificar a incerteza com a qual as previsões são feitas. A principal dificuldade é que, como uma regra, apenas os dados são observados, mas suas distribuições de probabilidade exatas não estão disponíveis. Para resolver este problema, São usados métodos aproximados bayesianos e outros métodos semelhantes. Mas seu uso aumenta a complexidade de uma rede neural e, portanto, torna seu treinamento mais complicado.
p Os matemáticos da RUDN University e da Free University of Berlin usaram pesos determinísticos em redes neurais, o que ajudaria a superar as limitações dos métodos bayesianos. Eles desenvolveram uma fórmula que permite estimar corretamente a variância da distribuição dos dados observados. O modelo proposto foi testado em diferentes dados:sintéticos e reais; em dados contendo outliers e em dados dos quais os outliers foram removidos. O novo método permite a restauração de distribuições de probabilidade com precisão anteriormente inatingível.
p Os matemáticos da RUDN University e da Free University of Berlin usaram pesos determinísticos para redes neurais e usaram as saídas das redes para codificar a distribuição de variáveis latentes para a distribuição marginal desejada. Uma análise da dinâmica de treinamento de tais redes permitiu-lhes obter uma fórmula que estima corretamente a variância dos dados observados, apesar da presença de outliers nos dados. O modelo proposto foi testado em diferentes dados:sintéticos e reais. O novo método permite restaurar distribuições de probabilidade com maior precisão em comparação com outros métodos modernos. A precisão foi avaliada usando o método AUC (a área sob a curva é a área sob o gráfico que permite fazer a avaliação do erro quadrático médio das previsões dependendo do tamanho da amostra estimado pela rede como "confiável"; quanto maior a pontuação AUC, melhores serão as previsões).