Crédito:Pixabay/CC0 Domínio Público Quando a água congela, ela passa da fase líquida para a fase sólida, resultando em uma mudança drástica em propriedades como densidade e volume. As transições de fase na água são tão comuns que a maioria de nós provavelmente nem pensa nelas, mas as transições de fase em novos materiais ou sistemas físicos complexos são uma importante área de estudo.
Para compreender completamente estes sistemas, os cientistas devem ser capazes de reconhecer fases e detectar as transições entre elas. Mas como quantificar as mudanças de fase num sistema desconhecido muitas vezes não é claro, especialmente quando os dados são escassos.
Pesquisadores do MIT e da Universidade de Basileia, na Suíça, aplicaram modelos generativos de inteligência artificial a este problema, desenvolvendo uma nova estrutura de aprendizado de máquina que pode mapear automaticamente diagramas de fases para novos sistemas físicos.
Sua abordagem de aprendizado de máquina baseada na física é mais eficiente do que técnicas manuais e laboriosas que dependem de conhecimentos teóricos. É importante ressaltar que, como sua abordagem aproveita modelos generativos, ela não requer enormes conjuntos de dados de treinamento rotulados, usados em outras técnicas de aprendizado de máquina.
Tal estrutura poderia ajudar os cientistas a investigar as propriedades termodinâmicas de novos materiais ou a detectar emaranhados em sistemas quânticos, por exemplo. Em última análise, esta técnica poderia permitir aos cientistas descobrir fases desconhecidas da matéria de forma autónoma.
"Se você tiver um novo sistema com propriedades totalmente desconhecidas, como você escolheria qual quantidade observável estudar? A esperança, pelo menos com ferramentas baseadas em dados, é que você possa varrer grandes novos sistemas de forma automatizada, e isso apontará você a mudanças importantes no sistema.
"Esta pode ser uma ferramenta na descoberta científica automatizada de propriedades novas e exóticas de fases", diz Frank Schäfer, pós-doutorado no Julia Lab no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) e coautor de um artigo nesta abordagem.
Juntando-se a Schäfer no artigo estão o primeiro autor Julian Arnold, estudante de graduação na Universidade de Basel; Alan Edelman, professor de matemática aplicada no Departamento de Matemática e líder do Julia Lab; e o autor sênior Christoph Bruder, professor do Departamento de Física da Universidade de Basel.
A pesquisa foi publicada em Physical Review Letters .
Detecção de transições de fase usando IA
Embora a transição da água para o gelo possa estar entre os exemplos mais óbvios de uma mudança de fase, mudanças de fase mais exóticas, como quando um material passa de um condutor normal para um supercondutor, são de grande interesse para os cientistas.
Essas transições podem ser detectadas identificando-se um “parâmetro de pedido”, uma quantidade que é importante e que deve mudar. Por exemplo, a água congela e transita para uma fase sólida (gelo) quando a sua temperatura cai abaixo de 0°C. Neste caso, um parâmetro de ordem apropriado poderia ser definido em termos da proporção de moléculas de água que fazem parte da rede cristalina versus aquelas que permanecem em estado desordenado.
No passado, os pesquisadores confiaram na experiência da física para construir diagramas de fases manualmente, recorrendo ao conhecimento teórico para saber quais parâmetros de ordem são importantes. Isto não só é tedioso para sistemas complexos, e talvez impossível para sistemas desconhecidos com novos comportamentos, mas também introduz preconceitos humanos na solução.
Mais recentemente, os investigadores começaram a utilizar a aprendizagem automática para construir classificadores discriminativos que podem resolver esta tarefa, aprendendo a classificar uma estatística de medição como proveniente de uma fase específica do sistema físico, da mesma forma que tais modelos classificam uma imagem como um gato ou um cão.
Os pesquisadores do MIT demonstraram como os modelos generativos podem ser usados para resolver esta tarefa de classificação com muito mais eficiência e de maneira informada pela física.
A Julia Programming Language, uma linguagem popular para computação científica que também é usada nas aulas introdutórias de álgebra linear do MIT, oferece muitas ferramentas que a tornam inestimável para a construção de tais modelos generativos, acrescenta Schäfer.
Modelos generativos, como aqueles subjacentes ao ChatGPT e ao Dall-E, normalmente funcionam estimando a distribuição de probabilidade de alguns dados, que eles usam para gerar novos pontos de dados que se ajustam à distribuição (como novas imagens de gatos que são semelhantes às imagens de gatos existentes) .
No entanto, quando estão disponíveis simulações de um sistema físico usando técnicas científicas testadas e comprovadas, os pesquisadores obtêm gratuitamente um modelo de sua distribuição de probabilidade. Esta distribuição descreve as estatísticas de medição do sistema físico.
Um modelo com mais conhecimento
A conclusão da equipa do MIT é que esta distribuição de probabilidade também define um modelo generativo sobre o qual um classificador pode ser construído. Eles conectam o modelo generativo a fórmulas estatísticas padrão para construir diretamente um classificador, em vez de aprendê-lo a partir de amostras, como foi feito com abordagens discriminativas.
“Esta é uma maneira muito boa de incorporar algo que você sabe sobre seu sistema físico profundamente em seu esquema de aprendizado de máquina. Vai muito além de apenas realizar engenharia de recursos em suas amostras de dados ou simples vieses indutivos”, diz Schäfer.
Este classificador generativo pode determinar em que fase o sistema se encontra, dado algum parâmetro, como temperatura ou pressão. E como os pesquisadores aproximam diretamente as distribuições de probabilidade subjacentes às medições do sistema físico, o classificador possui conhecimento do sistema.
Isso permite que seu método tenha um desempenho melhor do que outras técnicas de aprendizado de máquina. E como pode funcionar automaticamente sem a necessidade de treinamento extensivo, sua abordagem aumenta significativamente a eficiência computacional na identificação de transições de fase.
No final do dia, da mesma forma que alguém pode pedir ao ChatGPT para resolver um problema matemático, os pesquisadores podem fazer perguntas ao classificador generativo como "esta amostra pertence à fase I ou à fase II?" ou "esta amostra foi gerada em alta ou baixa temperatura?"
Os cientistas também poderiam usar esta abordagem para resolver diferentes tarefas de classificação binária em sistemas físicos, possivelmente para detectar emaranhamento em sistemas quânticos (o estado está emaranhado ou não?) ou determinar se a teoria A ou B é mais adequada para resolver um problema específico. Eles também poderiam usar essa abordagem para entender melhor e melhorar grandes modelos de linguagem como o ChatGPT, identificando como certos parâmetros devem ser ajustados para que o chatbot forneça os melhores resultados.
No futuro, os pesquisadores também querem estudar garantias teóricas sobre quantas medições seriam necessárias para detectar com eficácia as transições de fase e estimar a quantidade de computação necessária.