Crédito:Pacific Northwest National Laboratory
Coletar conjuntos de dados de campanhas de campo trabalhosas parece ser mais difícil do que encontrar e comparar dados de campanhas diferentes. Infelizmente, isso geralmente não é o caso. De acordo com o cientista da Terra Jinshi Jian do Pacific Northwest National Laboratory (PNNL), "Montar conjuntos de dados para comparação é um trabalho difícil e demorado. Unidades, convenções, nomenclaturas - muitas coisas podem variar de maneiras confusas. "Os dados também podem ser inacessíveis atrás de paywalls ou impossíveis de baixar.
Esses problemas existem na maioria dos campos, mas uma colaboração entre pesquisadores trabalhando com medições de trocas gasosas entre o solo e a atmosfera feitas por sistemas automatizados, também conhecido como medições de fluxo solo-atmosfera ou respiração do solo, está movendo seu campo em direção a uma solução.
Compreender como os níveis de gases que entram e saem do solo mudam em resposta às mudanças na atmosfera é crucial para obter uma imagem completa do ciclo global do carbono em evolução e das mudanças climáticas resultantes. Conjuntos de dados medidos em campo geralmente se concentram em uma área geográfica altamente específica e apresentam amplos problemas de compatibilidade de formatação, mas juntá-los para criar um conjunto de dados mais global pode fornecer amplos insights biogeoquímicos.
Para fazer a ciência avançar, um grupo global de pesquisadores de mais de 70 instituições contribuíram para o banco de dados COSORE (abreviação de COntinuous SOil Respiration) com o objetivo de criar um amplo recurso contendo conjuntos de dados de fluxo de solo padronizados de todo o mundo que foram convertidos em uma forma útil para pesquisadores. Em um esforço liderado por Ben Bond-Lamberty do PNNL, O COSORE foi lançado no mês passado com mais de 8 milhões de pontos de dados disponíveis. De acordo com Bond-Lamberty, membros da comunidade de pesquisa já estão entusiasmados com o projeto.
A criação de um banco de dados utilizável exigiu colaboração entre pesquisadores de mais de 70 instituições em todo o mundo. Crédito:Ben Bond-Lamberty | Laboratório Nacional do Noroeste do Pacífico
Criação de um pacote acessível para estudantes e pesquisadores
Uma década atrás, Bond-Lamberty trabalhou em um projeto semelhante e criou um banco de dados (o Soil Respiration Database ou SRDB) de medições de fluxo anual que tem sido amplamente utilizado desde o seu início. A criação do SRDB forneceu lições valiosas sobre o design do banco de dados e a utilidade de um grande repositório de dados, que moldou sua filosofia durante a construção do COSORE.
O processo de criação do COSORE foi bastante rápido. Bond-Lamberty levou a ideia desde a concepção até a publicação em aproximadamente dezoito meses, uma rápida reviravolta para um projeto tão grande.
"A filosofia de construção do COSORE foi torná-lo robusto e de alta qualidade, mas também para que o perfeito não seja inimigo do bom. Eu queria ter certeza de que o pacote era utilizável e acessível a cientistas com uma variedade de habilidades estatísticas e de programação, "disse Bond-Lamberty.
A usabilidade do COSORE foi posta à prova neste verão. Bond-Lamberty trabalhou com um estagiário do ensino médio durante o verão, que usou o pacote para examinar a sensibilidade à temperatura dos fluxos de gás solo-atmosfera, prestando atenção especial às diferenças com base na localização e no ciclo diurno versus noturno.
O COSORE possui conjuntos de dados de diferentes áreas do globo, incluindo locais na América do Norte, Europa Ocidental, e China, que permitem aos usuários comparar tendências nessas regiões. Crédito:Ben Bond-Lamberty | PNNL
Um repositório da comunidade para novas direções de pesquisa
Uma vantagem particular do COSORE é que ele cria novas possibilidades de pesquisa. Muitos dos conjuntos de dados que ele contém são tão especializados que, por conta deles, apenas um pequeno grupo de pesquisadores estaria interessado neles. Contudo, combinando esses conjuntos de dados, O COSORE permite que os usuários comparem tendências em diferentes áreas do globo, potencialmente fornecendo novos insights exclusivos.
Ampliar o número de conjuntos de dados disponíveis é apenas um benefício do COSORE. Ter um repositório central ajuda a proteger o campo científico de perder os dados de fluxo, mesmo que os dados subjacentes desapareçam devido ao armazenamento interrompido e às cadeias de e-mail. Finalmente, Esperamos que o COSORE acelere a ciência, economizando tempo e esforço dos pesquisadores para reunir conjuntos de dados díspares.
Bond-Lamberty espera que o COSORE continue a crescer à medida que os pesquisadores enviam mais dados modelados ao banco de dados. Conjuntos de dados de locais na América do Norte, Europa Ocidental, e a China domina o banco de dados, deixando lacunas em importantes regiões tropicais. Conforme novos conjuntos de dados de regiões importantes são coletados, O COSORE pode disponibilizá-los para pesquisadores de todo o mundo que podem usar o recurso para impulsionar sua ciência ainda mais.