O aprendizado de máquina fornece um mapa codificado por cores de dados de raios-X com base na dependência da temperatura de cada região. O X-TEC identificou a localização de dois conjuntos de picos nítidos (quadrados amarelos e verdes) nos dados, bem como halos de espalhamento difusos ao redor deles (vermelho e azul). Crédito:Laboratório Nacional de Argonne
A codificação por cores torna os mapas aéreos muito mais fáceis de entender. Através da cor, podemos dizer rapidamente onde há uma estrada, floresta, deserto, cidade, rio ou lago.
Trabalhando com várias universidades, o Laboratório Nacional de Argonne do Departamento de Energia dos EUA (DOE) desenvolveu um método para criar gráficos codificados por cores de grandes volumes de dados de análise de raios-X. Essa nova ferramenta usa classificação computacional de dados para encontrar clusters relacionados a propriedades físicas, como uma distorção atômica em uma estrutura cristalina. Deve acelerar muito as pesquisas futuras sobre mudanças estruturais na escala atômica induzidas pela variação de temperatura.
A equipe de pesquisa publicou suas descobertas nos
Proceedings of the National Academy of Sciences em um artigo intitulado "Aproveitando o aprendizado de máquina interpretável e não supervisionado para lidar com big data da moderna difração de raios-X".
“Nosso método usa aprendizado de máquina para analisar rapidamente imensas quantidades de dados de difração de raios X”, disse Raymond Osborn, físico sênior da divisão de Ciência dos Materiais da Argonne. "O que poderia ter levado meses no passado agora leva cerca de um quarto de hora, com resultados muito mais refinados."
Por mais de um século, a difração de raios X (ou DRX) tem sido um dos mais frutíferos de todos os métodos científicos para analisar materiais. Ele forneceu informações importantes sobre a estrutura atômica 3D de inúmeros materiais tecnologicamente importantes.
Nas últimas décadas, a quantidade de dados produzidos em experimentos de XRD aumentou dramaticamente em grandes instalações, como a Advanced Photon Source (APS), uma instalação de usuários do DOE Office of Science em Argonne. No entanto, faltam métodos de análise que possam lidar com esses imensos conjuntos de dados.
A equipe chama seu novo método X-ray Temperature Clustering, ou XTEC para abreviar. Ele acelera as descobertas de materiais por meio de agrupamento rápido e codificação de cores de grandes conjuntos de dados de raios X para revelar mudanças estruturais anteriormente ocultas que ocorrem à medida que a temperatura aumenta ou diminui. Um grande conjunto de dados típico seria de 10.000 gigabytes, o equivalente a cerca de 3 milhões de músicas de streaming de música.
O XTEC aproveita o poder do aprendizado de máquina não supervisionado, usando métodos desenvolvidos para este projeto na Cornell University. Esse aprendizado de máquina não depende de treinamento inicial e aprendizado com dados já bem estudados. Em vez disso, ele aprende encontrando padrões e clusters em grandes conjuntos de dados sem esse treinamento. Esses padrões são então representados por codificação de cores.
"Por exemplo, o XTEC pode atribuir vermelho ao cluster de dados um, que está associado a uma certa propriedade que muda com a temperatura de uma maneira específica", disse Osborn. "Então, o cluster dois seria azul e associado a outra propriedade com uma dependência de temperatura diferente, e assim por diante. As cores dizem se cada cluster representa o equivalente a uma estrada, floresta ou lago em um mapa aéreo."
Como caso de teste, o XTEC analisou dados da linha de luz 6-ID-D no APS, obtidos de dois materiais cristalinos que são supercondutores em temperaturas próximas ao zero absoluto. Nessa temperatura ultrabaixa, esses materiais mudam para um estado supercondutor, não oferecendo resistência à corrente elétrica. Mais importante para este estudo, outras características incomuns surgem em temperaturas mais altas relacionadas a mudanças na estrutura do material.
Ao aplicar o XTEC, a equipe extraiu uma quantidade sem precedentes de informações sobre mudanças na estrutura atômica em diferentes temperaturas. Isso inclui não apenas distorções no arranjo ordenado dos átomos no material, mas também flutuações que ocorrem quando tais mudanças acontecem.
“Por causa do aprendizado de máquina, somos capazes de ver o comportamento dos materiais não visíveis pelo XRD convencional”, disse Osborn. “E nosso método é aplicável a muitos problemas de big data não apenas em supercondutores, mas também em baterias, células solares e qualquer dispositivo sensível à temperatura”.
O APS está passando por uma atualização massiva que aumentará o brilho de seus feixes de raios-X em até 500 vezes. Junto com a atualização, haverá um aumento significativo nos dados coletados no APS, e as técnicas de aprendizado de máquina serão essenciais para analisar esses dados em tempo hábil.
+ Explorar mais Aproveitando o aprendizado de máquina para analisar material quântico