• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Física
    Novo modelo de rede neural artificial supera MaxEnt no exemplo de problema inverso

    Comparação das funções espectrais iniciais A (ω) (linhas sólidas) com o predito Aˆ (ω) calculado usando a abordagem MaxEnt (linhas pontilhadas laranja) e o modelo ANN proposto (linhas tracejadas azuis) em diferentes níveis de ruído η para três exemplos de funções de densidade espectral não presentes no conjunto de dados de treinamento. ANN comporta-se tão bem quanto MaxEnt em baixo nível de ruído, mas se comporta muito melhor do que MaxEnt em alto nível de ruído. Crédito:EPFL

    Simulações numéricas, geralmente com base em equações que descrevem um determinado modelo e em dados iniciais, estão sendo aplicados em uma gama cada vez maior de disciplinas científicas para aproximar processos em determinados pontos no tempo e no espaço. Com os chamados problemas inversos, esses dados críticos estão faltando - os pesquisadores devem reconstruir aproximações dos dados de entrada ou dos dados observáveis ​​subjacentes do modelo para gerar as previsões desejadas.

    Embora já existam técnicas para fazer isso, eles são mal definidos, incapaz de atribuir interpretações ou valores únicos a um determinado ponto. Como um exemplo, no método mais comumente usado para resolver esses problemas, a chamada abordagem de entropia máxima (MaxEnt), o conhecimento prévio é adicionado especificando uma distribuição padrão que corresponde aos resultados esperados na ausência de dados. O algoritmo procura iterativamente por uma distribuição que maximize a entropia em relação a esta distribuição padrão enquanto também gera uma função próxima aos dados existentes. A abordagem inclui um parâmetro usado para pesar a importância relativa entre a entropia e os termos de erro. Existem vários métodos para consertá-lo que geralmente produzem resultados diferentes quando aplicados na prática.

    No artigo Abordagem de Rede Neural Artificial para o Problema de Continuação Analítica, QuanSheng Wu, um cientista e Romain Fournier, um aluno de mestrado no C3MP da EPFL, liderado pelo professor Oleg Yazyev, e o colega Professor Lei Wang do instituto de Física da Academia Chinesa de Ciências apresenta uma abordagem de aprendizagem supervisionada para o problema. Com base em uma rede neural artificial (ANN) - altamente versátil graças à capacidade de aproximar funções contínuas sob suposições suaves e por causa de bibliotecas poderosas que permitem a implementação eficiente de diferentes arquiteturas de ANN que podem ser adaptadas para tirar proveito de estruturas de dados - o novo método parece ser tão preciso quanto MaxEnt e consideravelmente mais barato computacionalmente.

    Em um primeiro teste da estrutura da ANN, os pesquisadores optaram por examinar um sistema que tem uma solução analítica, mas é difícil de resolver usando MaxEnt - ou seja, a função de correlação de tempo do operador de posição para um oscilador harmônico linearmente acoplado a um ambiente ideal. O Hamiltoniano, ou operador geralmente correspondendo à energia total do sistema, é conhecido neste caso, e os dados de interesse - a função de correlação de tempo imaginário - podem ser gerados por simulações de Monte Carlo quântico (QMC).

    A solução analítica fornece a relação do espectro de potência com uma função de correlação de tempo imaginário e, como tal, fornece dados de treinamento fisicamente relevantes para o modelo de RNA. Os pesquisadores treinaram a RNA com os dados gerados e, em seguida, testaram-na obtendo a função de correlação do tempo imaginário calculada na etapa anterior pelo QMC. O modelo treinado em todo o conjunto de dados mostrou uma concordância quase perfeita com a solução analítica. MaxEnt falhou em fornecer resultados precisos, embora os pesquisadores notaram que melhores resultados provavelmente teriam sido obtidos computando a função de correlação em um número maior de pontos.

    Para testar ainda mais o modelo de maneira prática, os pesquisadores procuraram recuperar a densidade espectral de partícula única do elétron no domínio da frequência real de uma função de Green no domínio do tempo imaginário. Embora os modelos ANN e MaxEnt sejam capazes de prever as funções espectrais iniciais com precisão para o nível mais baixo de ruído, MaxEnt tendeu a suprimir picos na função espectral prevista com o aumento do ruído no sistema. Esses resultados mostram que o modelo ANN é versátil e robusto contra dados ruidosos.

    O novo método também é computacionalmente mais eficiente. A RNA permitiu o mapeamento direto entre as funções de Green e as densidades espectrais e pode, nesse sentido, resolver o problema diretamente. Por outro lado, MaxEnt é iterativo e gera funções de teste até que a convergência seja alcançada. Com a configuração computacional usada no artigo, o tempo necessário para converter um determinado número de pares em um determinado nível de ruído foi de 5 segundos no caso da RNA, em comparação com os 51 minutos que MaxEnt precisaria usando a mesma configuração.

    Os pesquisadores disseram que tais RNAs são susceptíveis de resolver outros problemas inversos, desde que conjuntos de dados relevantes - derivados, por exemplo, usando resultados experimentais disponíveis combinados com técnicas de aumento de dados - podem ser construídos. Os modelos treinados resultantes do trabalho podem ser obtidos em um repositório público no GitHub aqui:github.com/rmnfournier/ACANN.


    © Ciência https://pt.scienceaq.com