p Fitas magnéticas, recuperado por braços robóticos, são usados para armazenamento de longo prazo. Crédito:Julian Ordan / CERN
p Este ano, o data center do CERN bateu seu próprio recorde, quando coletou mais dados do que nunca. p Durante outubro de 2017, o data center armazenou a quantidade colossal de 12,3 petabytes de dados. Para colocar isso em contexto, um petabyte é equivalente à capacidade de armazenamento de cerca de 15, 000 smartphones de 64 GB. A maioria desses dados vem dos experimentos do Grande Colisor de Hádrons, portanto, este recorde é um resultado direto do excelente desempenho do LHC, o resto é composto de dados de outros experimentos e backups.
p "Nos últimos dez anos, o volume de dados armazenados em fita no CERN tem crescido a uma taxa quase exponencial. No final de junho, já havíamos ultrapassado um marco de armazenamento de dados, com um total de 200 petabytes de dados permanentemente arquivados em fita, "explica o alemão Cancio, quem lidera a fita, seção de armazenamento de arquivos e backups no departamento de TI do CERN.
p O data center do CERN está no coração da infraestrutura da Organização. Aqui, os dados de cada experimento no CERN são coletados, a primeira etapa na reconstrução desses dados é realizada, e cópias de todos os dados dos experimentos são arquivadas em fitas de armazenamento de longo prazo.
p A maioria dos dados coletados no CERN serão armazenados para sempre, os dados da física são tão valiosos que nunca serão excluídos e precisam ser preservados para as futuras gerações de físicos.
p "Uma característica importante do arquivo de dados CERN é a sua longevidade, "Cancio acrescenta." Mesmo após o término de um experimento, todos os dados registrados devem permanecer disponíveis por pelo menos 20 anos, mas geralmente mais. Alguns dos arquivos produzidos por experimentos anteriores do CERN foram migrados para diferentes hardwares, geração de software e mídia por mais de 30 anos. Para arquivos como o CERN, que não apenas preservam os dados existentes, mas também continuam a crescer, nossa preservação de dados é particularmente desafiadora. "
p Embora as fitas possam soar como um modo de armazenamento desatualizado, eles são, na verdade, a tecnologia mais confiável e econômica para arquivamento de dados em grande escala, e sempre foram usados neste campo. Uma cópia dos dados em uma fita é considerada muito mais confiável do que a mesma cópia em um disco.
p O CERN atualmente gerencia o maior arquivo de dados científicos no domínio da Física de Altas Energias (HEP) e continua inovando no armazenamento de dados, "conclui Cancio.