Comparação das funções espectrais iniciais A (ω) (linhas sólidas) com o predito Aˆ (ω) calculado usando a abordagem MaxEnt (linhas pontilhadas laranja) e o modelo ANN proposto (linhas tracejadas azuis) em diferentes níveis de ruído η para três exemplos de funções de densidade espectral não presentes no conjunto de dados de treinamento. ANN comporta-se tão bem quanto MaxEnt em baixo nível de ruído, mas se comporta muito melhor do que MaxEnt em alto nível de ruído. Crédito:EPFL
Simulações numéricas, geralmente com base em equações que descrevem um determinado modelo e em dados iniciais, estão sendo aplicados em uma gama cada vez maior de disciplinas científicas para aproximar processos em determinados pontos no tempo e no espaço. Com os chamados problemas inversos, esses dados críticos estão faltando - os pesquisadores devem reconstruir aproximações dos dados de entrada ou dos dados observáveis subjacentes do modelo para gerar as previsões desejadas.
Embora já existam técnicas para fazer isso, eles são mal definidos, incapaz de atribuir interpretações ou valores únicos a um determinado ponto. Como um exemplo, no método mais comumente usado para resolver esses problemas, a chamada abordagem de entropia máxima (MaxEnt), o conhecimento prévio é adicionado especificando uma distribuição padrão que corresponde aos resultados esperados na ausência de dados. O algoritmo procura iterativamente por uma distribuição que maximize a entropia em relação a esta distribuição padrão enquanto também gera uma função próxima aos dados existentes. A abordagem inclui um parâmetro usado para pesar a importância relativa entre a entropia e os termos de erro. Existem vários métodos para consertá-lo que geralmente produzem resultados diferentes quando aplicados na prática.
No artigo Abordagem de Rede Neural Artificial para o Problema de Continuação Analítica, QuanSheng Wu, um cientista e Romain Fournier, um aluno de mestrado no C3MP da EPFL, liderado pelo professor Oleg Yazyev, e o colega Professor Lei Wang do instituto de Física da Academia Chinesa de Ciências apresenta uma abordagem de aprendizagem supervisionada para o problema. Com base em uma rede neural artificial (ANN) - altamente versátil graças à capacidade de aproximar funções contínuas sob suposições suaves e por causa de bibliotecas poderosas que permitem a implementação eficiente de diferentes arquiteturas de ANN que podem ser adaptadas para tirar proveito de estruturas de dados - o novo método parece ser tão preciso quanto MaxEnt e consideravelmente mais barato computacionalmente.
Em um primeiro teste da estrutura da ANN, os pesquisadores optaram por examinar um sistema que tem uma solução analítica, mas é difícil de resolver usando MaxEnt - ou seja, a função de correlação de tempo do operador de posição para um oscilador harmônico linearmente acoplado a um ambiente ideal. O Hamiltoniano, ou operador geralmente correspondendo à energia total do sistema, é conhecido neste caso, e os dados de interesse - a função de correlação de tempo imaginário - podem ser gerados por simulações de Monte Carlo quântico (QMC).
A solução analítica fornece a relação do espectro de potência com uma função de correlação de tempo imaginário e, como tal, fornece dados de treinamento fisicamente relevantes para o modelo de RNA. Os pesquisadores treinaram a RNA com os dados gerados e, em seguida, testaram-na obtendo a função de correlação do tempo imaginário calculada na etapa anterior pelo QMC. O modelo treinado em todo o conjunto de dados mostrou uma concordância quase perfeita com a solução analítica. MaxEnt falhou em fornecer resultados precisos, embora os pesquisadores notaram que melhores resultados provavelmente teriam sido obtidos computando a função de correlação em um número maior de pontos.
Para testar ainda mais o modelo de maneira prática, os pesquisadores procuraram recuperar a densidade espectral de partícula única do elétron no domínio da frequência real de uma função de Green no domínio do tempo imaginário. Embora os modelos ANN e MaxEnt sejam capazes de prever as funções espectrais iniciais com precisão para o nível mais baixo de ruído, MaxEnt tendeu a suprimir picos na função espectral prevista com o aumento do ruído no sistema. Esses resultados mostram que o modelo ANN é versátil e robusto contra dados ruidosos.
O novo método também é computacionalmente mais eficiente. A RNA permitiu o mapeamento direto entre as funções de Green e as densidades espectrais e pode, nesse sentido, resolver o problema diretamente. Por outro lado, MaxEnt é iterativo e gera funções de teste até que a convergência seja alcançada. Com a configuração computacional usada no artigo, o tempo necessário para converter um determinado número de pares em um determinado nível de ruído foi de 5 segundos no caso da RNA, em comparação com os 51 minutos que MaxEnt precisaria usando a mesma configuração.
Os pesquisadores disseram que tais RNAs são susceptíveis de resolver outros problemas inversos, desde que conjuntos de dados relevantes - derivados, por exemplo, usando resultados experimentais disponíveis combinados com técnicas de aumento de dados - podem ser construídos. Os modelos treinados resultantes do trabalho podem ser obtidos em um repositório público no GitHub aqui:github.com/rmnfournier/ACANN.