A NASA tem 26 satélites de observação da Terra monitorando os sinais vitais de nosso planeta natal. Junto com as missões aéreas e terrestres de ciências da Terra, seus dados são armazenados e gerenciados pelo Sistema de Dados e Informações do Sistema de Observação da Terra. Crédito:NASA
A NASA financiou cinco novos projetos para desenvolver ferramentas e tecnologia para tornar os enormes conjuntos de dados de ciências da Terra da agência mais acessíveis e fáceis de usar.
Acordar. Ligue o laptop. Comece a processar dados aéreos das florestas de Adirondack em Nova York. Fazer café. Tomar café da manhã. Aperte o cinto de segurança do laptop aberto no banco do passageiro enquanto ele continua a processar os números. Dirigir para o trabalho.
Essa costumava ser a rotina matinal de Sara Lubkin como cientista em início de carreira no Goddard Space Flight Center da NASA em Greenbelt, Maryland. Uma vez no trabalho, ela usaria seu computador desktop, enquanto seu laptop passava diligentemente as 12 horas seguintes processando dados de instrumentos aerotransportados para obter as informações relevantes de que ela precisava para estudar as pragas invasoras das cicutas.
Visualização da terra
Os conjuntos de dados de ciências da Terra da NASA fornecem diferentes perspectivas e informações sobre o nosso planeta, como visto aqui nesta visualização de dados das observações do furacão Matthew em outubro de 2016.Créditos:Estúdio de Visualização Científica da NASA
"Não sou um cientista da computação, Eu sou um cientista da Terra, "disse Lubkin, que agora trabalha como oficial de programa da NASA Earth Science Data Systems 'Advancing Collaborative Connections for Earth Systems Science, ou programa ACCESS. Mas sua experiência como pesquisadora não é única.
Gastar grande parte do tempo simplesmente colocando os dados das ciências da Terra em uma forma utilizável para análise é uma situação comum para pesquisadores que trabalham com grandes conjuntos de dados que vêm do campo da NASA, missões aéreas e por satélite. Baixando arquivos enormes, conversão de formatos de dados, localizar as mesmas áreas de estudo em vários conjuntos de dados, escrever código para distinguir diferentes tipos de terra em uma imagem de satélite - esses tipos de tarefas consomem o tempo que os cientistas prefeririam usar para analisar as informações reais nos dados.
É aí que entra o programa ACCESS. Parte da divisão Earth Science Data Systems desde 2005, O ACCESS encontra maneiras inovadoras de agilizar esse tempo de processamento complicado. O programa financia projetos de pesquisa de dois anos para melhorar o gerenciamento de dados nos bastidores e fornecer conjuntos de dados prontos para uso e serviços para cientistas, Lubkin disse.
Em junho, A NASA selecionou cinco equipes da NASA, pesquisadores universitários e de ciência da computação comercial da rodada de inscrições de 2017 em uma série de projetos que usarão aprendizado de máquina, computação em nuvem e recursos de pesquisa avançada para desenvolver ferramentas para melhorar o gerenciamento nos bastidores para conjuntos de dados selecionados da NASA.
Os conjuntos de dados de ciências da Terra da NASA fornecem diferentes perspectivas e informações sobre o nosso planeta, como visto aqui nesta visualização de dados das observações do furacão Matthew em outubro de 2016. Crédito:Estúdio de Visualização Científica da NASA
"Investimos continuamente no desenvolvimento e avaliação das tecnologias mais recentes para melhorar os sistemas de dados científicos, "disse Kevin Murphy, executivo do programa para Earth Science Data Systems da NASA na sede da NASA em Washington. Mas mais do que isso, eles querem ter certeza de que as ferramentas e a tecnologia ajudem cientistas reais a resolver problemas reais.
Cada projeto ACCESS tem ciências da terra e cientistas da computação envolvidos do início ao fim, Murphy disse. "Com o programa ACCESS, estamos realmente tentando entender, por exemplo, como funcionam as correntes oceânicas, mas estamos tentando fazer isso agora com dados tão grandes que precisamos de uma equipe de especialistas que possam trabalhar juntos para resolver as questões da big science e big data. "
Os projetos irão complementar a gestão de dados, distribuição e outros serviços fornecidos pelo Sistema de Informação e Dados do Sistema de Observação da Terra (EOSDIS), que gerencia e armazena dados da NASA coletados de satélites de observação da Terra, aeronaves e campanhas de campo. EOSDIS tem 12 centros de dados e arquivos interconectados localizados nos Estados Unidos, que são organizados por disciplina. Atualmente, esses centros hospedam 26 petabytes de conjuntos de dados da Terra, ou seja, 26 milhões de gigabytes, ou dados suficientes para precisar de 52, 000 computadores, cada um com 500 gigabytes de espaço de armazenamento. Espera-se que esse número cresça para 150 petabytes em cinco anos com o lançamento de novos satélites.
"Dados de satélite são big data, "disse Jeff Walter, um dos principais investigadores do ACCESS 2017 e engenheiro-chefe da Science Data Services no Atmospheric Science Data Center no Langley Research Center da NASA em Hampton, Virgínia. "É muito complexo e às vezes difícil de usar, mesmo para usuários experientes. Além do volume, o que torna difícil para os usuários adquirirem, armazenar e gerenciar, há também a complexidade do formato e do conteúdo. Os usuários geralmente passam muito tempo entendendo como os dados são organizados e o que os vários parâmetros representam. "
O projeto de Walter é um dos três que usará a computação em nuvem para aliviar os problemas de download e armazenamento para os usuários. Começando com dois conjuntos de dados atmosféricos, sua equipe também desenvolverá uma maneira de converter formatos de dados de satélite em formatos que possam ser lidos por software comercial de sistema de informações geoespaciais (GIS).
"Nosso projeto visa diminuir a barreira de entrada de uma potencial comunidade de novos usuários que podem encontrar novas maneiras de usar esses dados, e quem está mais familiarizado com os tipos de ferramentas GIS, "Walter disse.
Os dois outros projetos de computação em nuvem desenvolverão ferramentas de processamento e análise de código aberto, incluindo um projetado para conjuntos de dados oceânicos. Um quarto projeto usará aprendizado de máquina para detectar mudanças ao longo do tempo em observações terrestres, começando com a detecção de deslizamentos de terra, inundações e soerguimentos causados pela atividade vulcânica. O quinto projeto desenvolverá um método automatizado para alinhar conjuntos de dados que observam o mesmo local para que os pesquisadores possam combinar mais de um tipo de informação sobre um local.
Após o término, os pesquisadores do ACCESS trabalharão em estreita colaboração com as equipes EOSDIS para incorporar seus avanços nas operações do dia-a-dia dos data centers. Assim que essas novas ferramentas estiverem no lugar, é aí que o verdadeiro poder dos conjuntos de dados de ciências da Terra abertos e disponíveis gratuitamente pode florescer, de acordo com Murphy. Dados fáceis de usar significam que chegam às mãos dos tomadores de decisão, organizações não-governamentais, cientistas estudando aplicações relacionadas e pesquisadores em diferentes campos que podem ter novos usos para ele.
"Quando você torna esses produtos abertos e acessíveis, você tem um monte de coisas não intencionais, boas consequências científicas, "Murphy disse, citando exemplos que incluem a detecção de movimento de águas subterrâneas do espaço, detecção rápida de incêndios florestais e uso de luzes noturnas para estudar o uso de energia humana. "A NASA tem muitas informações valiosas, e o programa ACCESS realmente tenta ajudar os cientistas a não apenas abordar questões científicas primárias, mas também nos ajudar a entender nosso ambiente e planejar nosso futuro. "