O aprendizado de máquina melhora as pesquisas no maior banco de dados de literatura biomédica do mundo
p Resultados classificados por relevância, em vez de data, fornecem uma experiência aprimorada para os usuários do PubMed, o maior banco de dados de literatura biomédica do mundo, de acordo com um estudo publicado em 28 de agosto na revista de acesso aberto
PLOS Biology por Zhiyong Lu e colegas da National Library of Medicine (NLM) / National Center for Biotechnology Information (NCBI), que desenvolve e mantém PubMed. p PubMed contém mais de 28 milhões de resumos de artigos da literatura biomédica, com uma média de mais dois adicionados a cada minuto. É um recurso indispensável, global em escopo, acessado por milhões de usuários todos os dias. Desde o início, os resultados da pesquisa foram retornados apenas em ordem cronológica reversa, mais recente primeiro, um sistema de classificação que enfatizava a recência em vez da relevância para a consulta de pesquisa. Em 2013, um sistema de classificação de relevância foi introduzido, mas dependia de fatores de ponderação artificiais e exigia ajuste manual contínuo.
p Em junho de 2017, A equipe do NLM / NCBI apresentou um algoritmo de aprendizado de máquina que se baseia em dezenas de sinais de relevância, incluindo respostas do usuário - especificamente, a frequência de cliques nos artigos retornados para uma determinada pesquisa - para melhorar a classificação de relevância. Este sistema de classificação, chamada de melhor correspondência, é oferecido como uma alternativa à ordem cronológica. A equipe descobriu que a taxa de cliques aumentou 20% nos resultados retornados pela Melhor Correspondência em comparação com os mesmos resultados apresentados cronologicamente. O uso geral da classificação por relevância aumentou de 7,5% de todas as pesquisas antes da introdução da Melhor correspondência para 12% em abril de 2018. Como os sistemas de aprendizado de máquina dependem da entrada do usuário para melhorar, o aumento no uso deve permitir que o sistema "aprenda a si mesmo" para se tornar mais valioso para seus usuários ao longo do tempo.
p "Geral, o novo algoritmo Best-Match mostra uma melhoria significativa na localização de informações relevantes sobre a ordem de tempo padrão no PubMed, "afirmaram os autores." Encorajamos os usuários do PubMed a experimentar esta nova pesquisa de relevância e fornecer informações para nos ajudar a continuar a melhorar o método de classificação. "