• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Seus dados de internet estão apodrecendo

    A internet está crescendo, mas informações antigas continuam desaparecendo diariamente. Crédito:wk1003mike / shutterstock.com

    Muitos usuários do MySpace ficaram consternados ao descobrir no início deste ano que a plataforma de mídia social perdeu 50 milhões de arquivos carregados entre 2003 e 2015.

    A falha do MySpace em cuidar e preservar o conteúdo de seus usuários deve servir como um lembrete de que confiar em serviços gratuitos de terceiros pode ser arriscado.

    O MySpace provavelmente preservou os dados dos usuários; apenas perdeu seu conteúdo. Os dados foram valiosos para o MySpace; o conteúdo dos usuários nem tanto.

    O que aconteceu com o MySpace

    O MySpace é um site de mídia de rede social onde os artistas podem fazer upload de música ou outro conteúdo para acesso e distribuição à sua comunidade de usuários. Sempre foi um site gratuito, com receitas provenientes de anúncios e programação que visa usuários para produtos específicos.

    Formado em 2003 em imitação do site de jogos sociais Friendster, O MySpace cresceu rapidamente e foi comprado pela News Corporation de Rupert Murdoch em 2005. Em 2008, O MySpace era o principal site de rede social, avaliado em US $ 12 bilhões, mas declinou em popularidade - graças a uma prevalência excessiva de anúncios, preocupações sobre a exposição de menores a conteúdo sexual e outras questões. Em 2011, News Corporation vendeu o MySpace para mídias específicas, que o vendeu novamente em 2016 para a Time Inc., que, por sua vez, foi comprada pela Meredith Corporation em 2018.

    Então, a empresa passou por três mudanças de propriedade em um período de 12 anos, e viu as receitas e o número de membros caírem vertiginosamente ao longo desse tempo. Uma venda pode servir, mas três vendas no curto prazo sugerem para mim um negócio problemático que não estava em uma boa posição para zelar pela propriedade intelectual de terceiros.

    Qualquer pessoa que use o MySpace como serviço de armazenamento e não tenha backup alternativo está simplesmente sem sorte. Você deixou sua propriedade intelectual ao lado da superestrada da informação, e quando você voltou, 10 anos depois, ele havia sumido.

    O MySpace não é o único a encontrar problemas. Serviços de nuvem da Amazon, por exemplo, também experimentou uma interrupção substancial em 2011 e outra em 2017. Embora temporária, e sem perda real de dados, essas interrupções deixaram os usuários sem acesso a arquivos importantes e preciosos por algum tempo.

    Um problema muito maior

    Preservar conteúdo ou propriedade intelectual na Internet apresenta um enigma. Se estiver acessível, então não é seguro; se for seguro, então não está acessível.

    O conteúdo acessível está sujeito a adulteração, roubo ou outros tipos de más ações. Somente o conteúdo inacessível pode ser bloqueado e protegido contra hackers.

    A internet atualmente acessa cerca de 15 zetabytes de dados, e está crescendo a uma taxa de 70 terabytes por segundo. É um vaso reconhecidamente com vazamento, e o conteúdo fica constantemente offline para acabar perdido para sempre.

    Em um comunicado, MySpace disse, ‘Pedimos desculpas pelo transtorno.’ Crédito:chrisdorney / shutterstock.com

    Esforços massivos e desesperados estão em andamento para preservar tudo o que vale a pena preservar, mas mesmo separar o que é e o que não é, em si mesmo, é um empreendimento formidável. O que terá valor em 10 anos - ou 50 anos? E como preservá-lo?

    O papel sem ácido pode durar 500 anos; inscrições de pedra ainda mais longas. Mas mídias magnéticas como discos rígidos têm uma vida muito mais curta, durando apenas três a cinco anos. Eles também precisam ser copiados e verificados em um ciclo de vida muito curto para evitar a degradação dos dados em taxas de falha observadas entre 3% e 8% ao ano.

    Depois, há também um problema de preservação de software:como as pessoas hoje ou no futuro podem interpretar esses arquivos WordPerfect ou WordStar da década de 1980, quando as empresas de software originais pararam de apoiá-los ou fecharam as portas?

    Uma startup sem fins lucrativos chamada The Internet Archive está preservando instantâneos da web continuamente, mas isso é principalmente para páginas da web HTML públicas de nível superior, como o site do The New York Times e o Facebook, não para arquivos de conteúdo subjacentes. No outono passado, sua Wayback Machine continha mais de 450 bilhões de páginas em 25 petabytes de dados. Isso representaria 0,0003% do total da Internet.

    Universidades, governos e sociedades científicas estão lutando para preservar dados científicos em uma miscelânea de arquivos, como a Coalizão de Preservação Digital do Reino Unido, MetaArchive, ou a agora dissolvida Rede de Preservação Digital colaborativa. A preservação é difícil e cara no tempo, dinheiro e equipamento. Para ser mais útil, não só tem que ser armazenado, mas hospedado em um formato que seja acessível e disponível para reutilização futura.

    O armazenamento real custa menos de US $ 0,05 por gigabyte, mas o armazenamento é apenas uma pequena porcentagem dos custos de preservação. Aquisição, networking, manutenção e administração requerem trabalho humano substancial e caro.

    Modelos de orçamento sugerem uma despesa de preservação de 10 anos de cerca de US $ 2,50 por gigabyte, ou $ 2, 500 por terabyte, ou $ 625, 000 para os arquivos que o MySpace não conseguiu preservar.

    Considerando seus próprios dados

    Então sim, a internet está apodrecendo, mas arquivistas e bibliotecários digitais como eu sabiam que já estava podre, assim como qualquer pessoa que já tenha recebido um erro "404 Arquivo não encontrado".

    Onde houver incentivo econômico para manter e usar dados - como informações do usuário, perfis ou histórico de navegação - pode existir por muito tempo. Já foi dito por muitos que os dados são o novo petróleo, e as corporações estão ansiosas para perfurar e explorar esse recurso.

    Contudo, onde o conteúdo é menos valioso para o proprietário dos servidores, há menos incentivos para investir na sua preservação. Uma pesquisa com 10 milhões de acessos de 25 sites aleatórios em 2004 sugere que erros 404 ocorrem em cerca de 3% dos URLs direcionados. A internet está crescendo muito mais rápido do que apodrecendo, mas as duas coisas estão acontecendo ao mesmo tempo. Nenhuma empresa gigante da Internet tem os seus interesses mais importantes do que os seus.

    Uma rede de preservação é conhecida pela sigla LOCKSS - Lotes of Copies Keep Stuff Safe - e essa é uma boa regra prática. Sempre tenha um backup, e sempre ter vários backups. Proteja sua privacidade e seu conteúdo, pelo menos aquele conteúdo que você deseja ter preservado, como fotos, o email, aquele roteiro ou romance, ou arquivos de vídeo e música. As regras de direitos autorais não proíbem o armazenamento de conteúdo que você possa ter comprado, contanto que você não o divulgue para compartilhamento público.

    O armazenamento gratuito é uma ótima oferta, mas às vezes você só obtém o que pagou. A internet não é segura nem permanente. Nunca prometeu ser, e os usuários não devem presumir que isso acontecerá. As peças estão apodrecendo, corroendo e entrando em colapso enquanto digito isso. Apenas espere e planeje não estar descansando naquela plataforma quando ela cair.

    Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.




    © Ciência https://pt.scienceaq.com