• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Física
    CMS libera mais de um petabyte de dados abertos

    Um evento de colisão registrado pelo CMS em 2012 mostrando um "candidato a Higgs", disponível no portal CERN Open Data com a versão mais recente do CMS Open Data. Crédito:Tom McCauley / CMS / CERN

    A colaboração CMS no CERN acaba de tornar públicos cerca de metade dos dados coletados em 2012 pelo detector CMS no Large Hadron Collider. Esta versão inclui conjuntos usados ​​para descobrir o bóson de Higgs, e está sendo compartilhado por meio do portal CERN Open Data.

    Esta é a terceira versão do CMS Open Data de alto nível, após a divulgação dos dados de 2010 em 2014, e dados de 2012 em 2016. Este lote contém mais de 550 terabytes de dados de colisão próton-próton registrados em uma energia de centro de massa de 8 TeV, bem como cerca de 510 terabytes de dados de simulação de Monte Carlo.

    Os dados do LHC são complicados e grandes. Os pesquisadores do CMS registraram petabytes de dados de colisões no LHC e até agora publicaram centenas de artigos científicos com eles. Ao liberar os dados para o domínio público, pesquisadores fora do CMS Collaboration têm a oportunidade de conduzir novas pesquisas com eles.

    "Nossos dados são um elemento importante do rico legado científico da Colaboração CMS, "diz o porta-voz do CMS, Joel Butler. “Gostaríamos de garantir que eles não sejam apenas preservados no longo prazo, mas também estejam disponíveis ao público, para que os membros do CMS e pesquisadores externos possam reexaminá-los no futuro. Isso faz parte do nosso compromisso com a abertura e a preservação de dados a longo prazo. "

    Animação mostrando um evento "candidato a Higgs", registrado pelo CMS em 2012 e disponível no portal CERN Open Data com a versão mais recente do CMS Open Data. Crédito:Tom McCauley e Achintya Rao CMS / CERN

    Recentemente, os dois primeiros trabalhos de pesquisa foram publicados por uma equipe de teóricos do MIT interessados ​​em realizar uma medição que os próprios cientistas do CMS não haviam feito:especificamente, eles queriam medir subestruturas particulares em aglomerados de partículas conhecidas como "jatos" produzidos em colisões próton-próton.

    O último lançamento do CMS Open Data também traz a possibilidade fascinante de permitir que as pessoas repitam a análise que levou à descoberta de Higgs, estudando os mesmos dados usados ​​pelos cientistas do CMS para anunciar a existência da partícula em 2012. Como uma prova de conceito, O estudante de doutorado do CMS, Nur Zulaiha Jomhari, analisou os dados abertos do CMS e produziu gráficos semelhantes a alguns dos mostrados quando a descoberta de Higgs foi anunciada. Esta análise é muito menos sofisticada do que a CMS oficial e não é examinada pela comunidade mais ampla de especialistas em CMS, mas demonstra o potencial do CMS Open Data.

    Esquerda:O gráfico CMS oficial para o canal "Higgs para quatro léptons", mostrado no dia do anúncio da descoberta de Higgs. À direita:um enredo semelhante produzido por Nur Zulaiha Jomhari et al. usando CMS Open Data de 2011 e 2012. Embora os gráficos pareçam semelhantes, a análise com CMS Open Data usa mais dados (a 8 TeV e no geral) do que o CMS oficial da descoberta original, mas é muito menos sofisticada e não é examinada pela comunidade mais ampla de especialistas em CMS. Crédito:CMS / CERN

    Além dos próprios conjuntos de dados, a equipe de preservação de dados e dados abertos do CMS também reuniu uma coleção abrangente de materiais complementares, incluindo código de exemplo para realizar análises relativamente simples, bem como metadados, como informações sobre como os dados foram selecionados e quais eram as condições de funcionamento do LHC no momento da coleta de dados.

    No momento, O CMS se comprometeu a liberar até 50% dos dados registrados de cada ano alguns anos depois de serem coletados, assim que os cientistas do CMS concluírem a maior parte de suas análises desses conjuntos de dados. "Ver nossos dados abertos em uso fora do CMS foi muito gratificante, "diz Kati Lassila-Perini, o co-coordenador de Preservação de Dados e Acesso Aberto do CMS. "Tem sido uma grande motivação para nós e esperamos continuar nossos esforços pioneiros para liberar dados abertos com qualidade de pesquisa do LHC nos próximos anos."

    © Ciência https://pt.scienceaq.com