Uma nova rede neural para entender a simetria, pesquisa de materiais de velocidade
p Projeção de aproximação de variedade uniforme de baixa dimensão para visualizar como as redes neurais aprendem a similaridade semântica de imagens naturais. Crédito:Joshua Agar / Lehigh University
p Compreender as relações estrutura-propriedade é um objetivo fundamental da pesquisa de materiais, de acordo com Joshua Agar, membro do corpo docente do Departamento de Ciência e Engenharia de Materiais da Universidade de Lehigh. E ainda atualmente nenhuma métrica existe para entender a estrutura dos materiais por causa da complexidade e natureza multidimensional da estrutura. p Redes neurais artificiais, um tipo de aprendizado de máquina, pode ser treinado para identificar semelhanças - e até mesmo correlacionar parâmetros, como estrutura e propriedades - mas existem dois desafios principais, diz Agar. Uma é que a maioria das grandes quantidades de dados gerados por experimentos de materiais nunca são analisados. Isso ocorre principalmente porque essas imagens, produzidos por cientistas em laboratórios de todo o mundo, raramente são armazenados de maneira utilizável e geralmente não são compartilhados com outras equipes de pesquisa. O segundo desafio é que as redes neurais não são muito eficazes no aprendizado de simetria e periodicidade (quão periódica é a estrutura de um material), duas características de extrema importância para pesquisadores de materiais.
p Agora, uma equipe liderada pela Lehigh University desenvolveu uma nova abordagem de aprendizado de máquina que pode criar projeções de similaridade por meio do aprendizado de máquina, permitindo que os pesquisadores pesquisem um banco de dados de imagens não estruturado pela primeira vez e identifiquem tendências. Agar e seus colaboradores desenvolveram e treinaram um modelo de rede neural para incluir recursos de simetria e, em seguida, aplicaram seu método a um conjunto de 25, 133 imagens de microscopia de força piezoresponse coletadas em diversos sistemas de materiais ao longo de cinco anos na Universidade da Califórnia, Berkeley. Os resultados:eles foram capazes de agrupar classes semelhantes de material e observar tendências, formando uma base para começar a entender as relações estrutura-propriedade.
p “Uma das novidades do nosso trabalho é que construímos uma rede neural especial para entender a simetria e a usamos como um extrator de recursos para torná-la muito melhor no entendimento de imagens, "diz Agar, um autor principal do artigo em que o trabalho é descrito:"Exploração de similaridade de imagem recursiva Symmetry-Aware para microscopia de materiais, "publicado hoje em
npj materiais computacionais . Além do ágar, autores incluem, da Lehigh University:Tri N. M. Nguyen, Yichen Guo, Shuyu Qin e Kylie S. Frew e, da Universidade de Stanford:Ruijuan Xu. Nguyen, um autor principal, cursou graduação na Lehigh University e agora está cursando o doutorado. em Stanford.
p A equipe foi capaz de chegar às projeções empregando Uniform Manifold Approximation and Projection (UMAP), uma técnica de redução de dimensionalidade não linear. Esta abordagem, diz Agar, permite que os pesquisadores aprendam "... de uma forma difusa, a topologia e a estrutura de nível superior dos dados e compactá-los em 2D. "
p "Se você treina uma rede neural, o resultado é um vetor, ou um conjunto de números que é um descritor compacto dos recursos. Esses recursos ajudam a classificar as coisas para que alguma semelhança seja aprendida, "diz Agar." O que é produzido ainda é bastante grande no espaço, no entanto, porque você pode ter 512 ou mais recursos diferentes. Então, então você deseja compactá-lo em um espaço que um ser humano possa compreender, como 2D, ou 3D ― ou,
pode ser , 4D. "
p Fazendo isso, Agar e sua equipe conseguiram levar os 25, Mais de mil imagens e agrupam classes de material muito semelhantes.
p "Tipos semelhantes de estruturas no material são semanticamente próximos e também certas tendências podem ser observadas, especialmente se você aplicar alguns filtros de metadados, "diz Agar." Se você começar a filtrar por quem fez o depósito, quem fez o material, o que eles estavam tentando fazer, qual é o sistema de materiais ... você pode realmente começar a refinar e obter cada vez mais semelhanças. Essa semelhança pode então ser ligada a outros parâmetros, como propriedades. "
p Projeção de aproximação de variedade uniforme de baixa dimensão mostrando semelhança de imagem ciente de simetria de um banco de dados maior que 25, 000 imagens de microscopia de força piezoresponse. Crédito:Joshua Agar / Lehigh University
p Este trabalho demonstra como o armazenamento e gerenciamento de dados aprimorados podem acelerar rapidamente as descobertas de materiais. De acordo com Agar, de valor particular são imagens e dados gerados por experimentos fracassados.
p "Ninguém publica resultados fracassados e isso é uma grande perda porque, alguns anos depois, alguém repete a mesma linha de experimentos, "diz Agar." Então, você desperdiça recursos realmente bons em um experimento que provavelmente não funcionará. "
p Em vez de perder todas essas informações, os dados que já foram coletados podem ser usados para gerar novas tendências que não foram vistas antes e acelerar a descoberta exponencialmente, diz Agar.
p Este estudo é o primeiro "caso de uso" de uma empresa inovadora de armazenamento de dados localizada no Oak Ridge National Laboratory, chamada DataFed. DataFed, de acordo com seu site é "... um federado, armazenamento de big data, colaboração, e sistema de gerenciamento de ciclo de vida completo para ciência da computação e / ou análise de dados em ambientes de computação distribuída de alto desempenho (HPC) e / ou computação em nuvem. "
p "Minha equipe na Lehigh fez parte do projeto e desenvolvimento do DataFed em termos de torná-lo relevante para casos de uso científicos, "diz Agar." Lehigh é a primeira implementação ao vivo deste sistema totalmente escalonável. É um banco de dados federado para que qualquer pessoa possa abrir seu próprio servidor e ficar vinculado à instalação central. "
p Agar é o especialista em aprendizado de máquina da equipe da Iniciativa de Interface Nano-Humana da Universidade de Lehigh. A iniciativa interdisciplinar, integrando as ciências sociais e engenharia, busca transformar as formas como os humanos interagem com instrumentos de descoberta científica para acelerar inovações.
p "Um dos principais objetivos da Iniciativa de Interface Nano / Humana de Lehigh é colocar informações relevantes ao alcance dos experimentalistas para fornecer informações acionáveis que permitem uma tomada de decisão mais informada e acelera a descoberta científica, "diz Agar." Os humanos têm capacidade limitada de memória e recolhimento. DataFed é um Memex moderno; fornece uma memória de informações científicas que podem ser facilmente encontradas e recuperadas. "
p DataFed fornece uma ferramenta especialmente poderosa e inestimável para pesquisadores envolvidos na ciência de equipes interdisciplinares, permitindo que pesquisadores que estão colaborando em projetos de equipe localizados em locais diferentes / remotos acessem os dados brutos uns dos outros. Este é um dos principais componentes de nossa Iniciativa Lehigh Presidential Nano / Human Interface (NHI) para acelerar a descoberta científica, "diz Martin P. Harmer, Professor da Alcoa Foundation no Departamento de Ciência e Engenharia de Materiais de Lehigh e Diretor da Nano / Human Interface Initiative.