• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Dragando o lago de dados

    Crédito CC0:domínio público

    Os data lakes permitem que as informações sejam adicionadas a um sistema sem pré-processamento ou modelagem. Compare isso com um banco de dados convencional, onde os dados devem ser entregues de uma maneira muito mais refinada e formal. Assim, um data lake oferece uma velocidade de entrada muito mais oportuna. Contudo, como mostra a pesquisa do Brasil, mesmo que um data lake preserve o nível de granularidade mais alto dos dados, essa flexibilidade útil também pode ser problemática. "Se não for gerenciado, é fácil perder o controle do repositório por causa do volume que ele contém e de seu crescimento, "explica a equipe.

    Os pesquisadores explicam ainda que os data lakes não carregam nenhuma da semântica de um banco de dados convencional, mas embora isso possa ser vantajoso para evitar certos tipos de viés ao extrair e analisar dias, isso significa que entender o conteúdo do data lake pode se tornar uma tarefa bastante complicada. Esse, a equipe sugere, talvez tenha prejudicado a ampla adoção e uso de data lakes no ambiente corporativo e impedido a aceitação dessa ferramenta útil devido a certos equívocos sobre como eles podem ser usados ​​em esforços de ciência de dados.

    A equipe agora se voltou para modelos de gestão do conhecimento para ajudá-los a resolver os problemas associados ao uso do data lake e para enriquecer os dados que flutuam nele para aprimorar a usabilidade das informações. Eles também acrescentam que, por meio do uso de uma plataforma de portal de dados e metadados associados, eles raciocinam que sua abordagem forneceria acesso fácil ao data lake, mantendo e aumentando sua utilidade e evitando sua degradação em um chamado pântano de dados.


    © Ciência https://pt.scienceaq.com