Estatísticos e físicos se unem para trazer uma abordagem de aprendizado de máquina para mineração de dados nucleares
Ilustração esquemática da densidade da distribuição de Dirichlet para verdadeira mistura de modelos. Crédito:V. Kejzlar
Os físicos utilizam modelos teóricos para estudar quantidades físicas, como a massa dos núcleos, onde não possuem dados experimentais. No entanto, usar um único modelo teórico imperfeito pode levar a resultados enganosos. Para melhorar a qualidade das previsões extrapoladas, os cientistas podem usar vários modelos diferentes e misturar os seus resultados. Desta forma, os cientistas aproveitam ao máximo a sabedoria coletiva de múltiplos modelos e obtêm a melhor previsão a partir das informações experimentais mais atuais. Para melhorar a previsibilidade de modelos computacionais complexos, uma equipe de físicos nucleares e estatísticos propôs um novo método estatístico. Este método utiliza um processo estatístico denominado teorema de Bayes para revisar a probabilidade de uma hipótese à medida que novos dados são obtidos. O trabalho está publicado na revista Scientific Reports .
A estrutura de aprendizado de máquina resultante usa a chamada distribuição Dirichlet. Este processo estatístico combina os resultados de vários modelos imperfeitos. Os pesquisadores demonstraram a capacidade das técnicas de mistura propostas para extrair dados sobre massas nucleares.
Esta pesquisa demonstrou que misturas globais e locais de modelos têm excelente desempenho tanto na precisão de suas previsões quanto na quantificação de incertezas. Estas misturas parecem ser preferíveis à média do modelo Bayesiano clássico, a abordagem convencional. Além disso, a análise dos investigadores indica que melhorar as previsões dos modelos através de uma mistura simples leva a extrapolações mais robustas do que a mistura de modelos corrigidos.
Mais informações: Vojtech Kejzlar et al, Mistura Bayesiana Dirichlet local de modelos imperfeitos, Relatórios Científicos (2023). DOI:10.1038/s41598-023-46568-0 Informações do diário: Relatórios Científicos