Os dados são tão bons quanto a capacidade dos humanos de analisá-los e utilizá-los.
Na pesquisa de materiais, a capacidade de analisar grandes quantidades de dados - geralmente gerados em nanoescala - para comparar as propriedades dos materiais é a chave para a descoberta e alcançar o uso industrial. Jeffrey M. Rickman, professor de ciência dos materiais e física na Universidade de Lehigh, compara este processo à fabricação de doces:
"Se você está procurando criar um doce que tenha, dizer, o nível ideal de doçura, você tem que ser capaz de comparar diferentes ingredientes potenciais e seu impacto na doçura para fazer o doce final ideal, "diz Rickman.
Por várias décadas, nanomateriais - matéria tão pequena que é medida em nanômetros (um nanômetro =um bilionésimo de metro) e podem ser manipulados em escala atômica - superaram os materiais convencionais em resistência, condutividade e outros atributos-chave. Um obstáculo para o aumento da produção é o fato de que os cientistas não têm as ferramentas para fazer uso total dos dados - muitas vezes em terabytes, ou trilhões de bytes - para ajudá-los a caracterizar os materiais - um passo necessário para alcançar "o doce final ideal".
E se esses dados pudessem ser facilmente acessados e manipulados por cientistas a fim de encontrar respostas em tempo real para perguntas de pesquisa?
A promessa de materiais como nanotubos de carbono de parede única envoltos em DNA poderia se concretizar. Os nanotubos de carbono são um material em forma de tubo que pode medir até um bilionésimo de metro, ou cerca de 10, 000 vezes menor que um cabelo humano. Este material pode revolucionar a distribuição de drogas e a detecção médica com sua capacidade única de penetrar nas células vivas.
Um novo jornal dá um passo em direção à realização da promessa de tais materiais. De autoria de Rickman, o artigo descreve uma nova maneira de mapear relacionamentos de propriedades de materiais que são altamente multidimensionais por natureza. Rickman emprega métodos de análise de dados em combinação com uma estratégia de visualização chamada de coordenadas paralelas para melhor representar os dados de materiais multidimensionais e extrair relacionamentos úteis entre as propriedades. O artigo, "Análise de dados e gráficos de propriedades de materiais com coordenadas paralelas, "foi publicado em npj materiais computacionais , um jornal da Nature Research.
"No papel, "diz Rickman, "ilustramos a utilidade desta abordagem fornecendo uma maneira quantitativa de comparar propriedades metálicas e cerâmicas - embora a abordagem possa ser aplicada a qualquer material que você queira comparar."
É o primeiro artigo a sair da Iniciativa de Pesquisa em Engenharia de Interface Humana / Nano de Lehigh, uma iniciativa de pesquisa multidisciplinar que se propõe a desenvolver uma interface homem-máquina para melhorar a capacidade dos cientistas de visualizar e interpretar a vasta quantidade de dados que são gerados pela pesquisa científica. Foi iniciado por um investimento institucional de US $ 3 milhões anunciado no ano passado.
O líder da iniciativa é Martin P. Harmer, professor de ciência e engenharia de materiais. Além de Rickman, outros membros seniores do corpo docente incluem Anand Jagota, chefe do departamento de bioengenharia; Daniel P. Lopresti, chefe do departamento de ciência da computação e engenharia e diretor da Lehigh's Data X Initiative; e Catherine M. Arrington, professor associado de psicologia.
"Várias universidades de pesquisa estão fazendo grandes investimentos em big data, "diz Rickman." Nossa iniciativa traz um aspecto relativamente novo:o elemento humano. "
De acordo com Arrington, a iniciativa de interface Nano / Humana enfatiza o humano porque o desenvolvimento bem-sucedido de novas ferramentas para visualização e manipulação de dados deve necessariamente incluir uma consideração dos pontos fortes e limitações cognitivas do cientista.
"Os aspectos das ciências comportamentais e cognitivas da iniciativa Nano / Interface Humana são duplos, "diz Arrington." Primeiro, um modelo de pesquisa de fatores humanos permite a análise do ambiente de trabalho atual e recomendações claras à equipe para o desenvolvimento de novas ferramentas de investigação científica. Segundo, uma abordagem de psicologia cognitiva é necessária para conduzir pesquisas científicas básicas sobre as representações e operações mentais que podem ser desafiadas exclusivamente na investigação de nanomateriais. "
O método proposto por Rickman usa coordenadas paralelas, que é um método de visualização de dados que torna possível detectar valores discrepantes ou padrões com base em fatores de métrica relacionados. Os gráficos de coordenadas paralelas podem ajudar a descobrir esses padrões.
O desafio, diz Rickman, reside em interpretar o que você vê.
"Se traçar pontos em duas dimensões usando os eixos X e Y, você pode ver grupos de pontos e isso diria algo ou forneceria uma pista de que os materiais podem compartilhar alguns atributos, "ele explica." Mas, e se os clusters estiverem em 100 dimensões? "
De acordo com Rickman, existem ferramentas que podem ajudar a reduzir o número de dimensões e eliminar dimensões não relevantes para ajudar a identificar melhor esses padrões. Nesse trabalho, ele aplica essas ferramentas a materiais com sucesso.
"As diferentes dimensões ou eixos descrevem diferentes aspectos dos materiais, como compressibilidade e ponto de fusão, " ele diz.
Os gráficos descritos no artigo simplificam a descrição da geometria de alta dimensão, permitem a redução dimensional e a identificação de correlações de propriedades significativas e sublinham as distinções entre as diferentes classes de materiais.
Do papel:"Neste trabalho, ilustramos a utilidade de combinar os métodos de análise de dados com uma representação de coordenadas paralelas para construir e interpretar gráficos de propriedades de materiais multidimensionais. Esta construção, junto com análises de materiais associados, permite a identificação de importantes correlações de propriedades, quantifica o papel do agrupamento de propriedades, destaca a eficácia das estratégias de redução dimensional, fornece uma estrutura para a visualização de envelopes de classe de materiais e facilita a seleção de materiais exibindo restrições de propriedade multidimensionais. Dadas essas capacidades, esta abordagem constitui uma ferramenta poderosa para explorar inter-relações de propriedades complexas que podem guiar a seleção de materiais. "
Voltando à metáfora da fabricação de doces, Rickman diz:"Estamos procurando os melhores métodos de colocar os doces juntos para fazer o que queremos e esse método pode ser uma maneira de fazer isso."
Nova fronteira, novas abordagens
Criar um roteiro para encontrar os melhores métodos é o objetivo de um dia de 2½, workshop internacional denominado "Workshop sobre Convergência de Pesquisa de Materiais e Ciência de Dados Multissensoriais" que está sendo organizado pela Lehigh University em parceria com a The Ohio State University.
O workshop, que acontecerá no Bear Creek Mountain Resort em Macungie, PA de 11 a 13 de junho, 2018 - reunirá cientistas de disciplinas afins nas ciências básicas e sociais e engenharia para abordar muitas questões envolvidas na ciência de dados multissensorial aplicada a problemas na pesquisa de materiais.
"Esperamos que um dos resultados do workshop seja a formação de parcerias contínuas para ajudar a desenvolver um roteiro para o estabelecimento de uma linguagem e estrutura comuns para um diálogo contínuo para levar adiante esse esforço de promoção da ciência de dados multissensorial, "diz Rickman, que é investigador principal em uma bolsa da National Science Foundation (NSF), concedido pela Divisão de Pesquisa de Materiais em apoio ao workshop.
Co-Investigador Principal, Nancy Carlisle, professor assistente no Departamento de Psicologia de Lehigh, afirma que a conferência reunirá áreas complementares de especialização para permitir novas perspectivas e caminhos a seguir.
“Quando humanos estão processando dados, é importante reconhecer as limitações dos humanos, bem como dos dados, "diz Carlisle." Coletar informações da ciência cognitiva pode ajudar a refinar as maneiras como apresentamos dados aos humanos e ajudá-los a formar melhores representações das informações contidas nos dados. Cientistas cognitivos são treinados para entender os limites do processamento mental humano - é o que fazemos! Levar em consideração essas limitações ao desenvolver novas maneiras de apresentar dados é fundamental para o sucesso. "
Rickman acrescenta:"Estamos em uma nova fronteira na pesquisa de materiais, que exige novas abordagens e parceiros para traçar o caminho a seguir. "