Crédito CC0:domínio público
Google, desde o primeiro dia, cresceu entrando no negócio de encontrar informações. Anos depois, O Google está falando sério sobre conjuntos de dados. O Google está lançando um novo mecanismo de busca para ajudar os cientistas a encontrar os conjuntos de dados de que precisam.
Na quarta-feira, A cientista de pesquisa de IA do Google, Natasha Noy, anunciou o lançamento do Dataset Search pelo Google. Agora você tem acesso fácil a conjuntos de dados, se você é cientista, ou apenas "geek" de dados em outro tipo de busca, à procura de dados para o seu trabalho, para as suas histórias e para a sua curiosidade intelectual.
O objetivo é oferecer a você mais de uma única interface. Jon Fingas em Engadget analisou como pode beneficiar a pesquisa de dados.
"A ferramenta fornece acesso mais direto aos dados apresentados em um padrão aberto que deixa claro quem criou as informações, como foi coletado e como você pode usá-lo. Você não pode apenas rastrear dados climáticos para um relatório, mas certifique-se de que é relevante e legal de usar. "
Este é um push global (como internacional) que funciona em vários idiomas com suporte para idiomas adicionais em breve. James Vincent em The Verge citou Noy:"Eu realmente acho que nos últimos anos o número de repositórios explodiu."
"Basta inserir o que você está procurando e ajudaremos a orientá-lo para o conjunto de dados publicado no site do provedor do repositório, "disse ela. Atualmente, conjuntos de dados e dados relacionados tendem a se espalhar por vários repositórios de dados e pode-se descobrir que as informações sobre esses conjuntos de dados não são vinculadas nem indexadas por mecanismos de pesquisa. Para a pessoa que faz uma pesquisa, a descoberta de dados torna-se tediosa na melhor das hipóteses.
Eles apoiam seriamente um ecossistema onde os próprios fornecedores de conjuntos de dados sejam incentivados, por meio de diretrizes que o Google desenvolveu, para descrever seus dados "de uma forma que o Google (e outros mecanismos de pesquisa) possam entender melhor o conteúdo de suas páginas, " ela disse.
Eles usaram o schema.org de padrão aberto para abordar isso. Na lista de desejos de Noy:que todos os provedores de conjuntos de dados sigam esse padrão comum. Espera-se que mais repositórios de dados usem o padrão schema.org para descrever seus conjuntos de dados. Dessa maneira, disse Noyes, conjuntos de dados são parte de um "ecossistema robusto".
"Uma ferramenta de pesquisa como esta é tão boa quanto os metadados que os editores de dados estão dispostos a fornecer. Esperamos ver muitos de vocês usando os padrões abertos para descrever seus dados, permitindo que nossos usuários encontrem os dados que procuram. "
Jon Fingas em Engadget :"Está longe de ser um recurso definitivo no momento. É um começo, Contudo, e o Google espera, sem dúvida, que isso incentive outras pessoas a tornar seus dados públicos mais pesquisáveis. "
E se tudo isso não bastasse, O Google estará abrindo alguns caminhos para aproveitar ao máximo os dados sobre os dados.
De acordo com The Verge , Jeni Tennison, chefe do Open Data Institute, disse que idealmente o Google publicará seu próprio conjunto de dados como o Dataset Search é usado. Ela disse que o Google deveria publicar um conjunto de dados sobre a pesquisa do conjunto de dados que seria indexado pela Pesquisa do conjunto de dados, acrescentou Vincent. Ele a citou:
"Simplesmente entender como as pessoas pesquisam é importante ... que tipo de termos elas usam, como eles os expressam, "diz Tennison." Se quisermos entender como as pessoas pesquisam dados e torná-los mais acessíveis, seria ótimo se o Google abrisse seus próprios dados sobre isso. "Em outras palavras, ele adicionou, O Google deve publicar um conjunto de dados sobre a pesquisa do conjunto de dados que seria indexado pela Pesquisa do conjunto de dados.
© 2018 Tech Xplore