Página de status para “Fim da Vigilância (Bill Hodges Trilogy # 3) por Stephen King”. Crédito:Maity, Panigrahi &Mukherjee.
Pesquisadores da Northwestern University, Microsoft Research India, e o Instituto Indiano de Tecnologia Kharagpur desenvolveram recentemente um modelo para prever se um livro se tornará um best-seller na Amazon dentro de 15 dias de sua publicação. O modelo deles, descrito em um estudo pré-publicado no arXiv, trabalha analisando o comportamento de leitura na plataforma online Goodreads.
"Temos trabalhado na análise da dinâmica de popularidade de várias entidades de mídia social, como hashtags no Twitter, tópicos no Quora etc. "Animesh Mukherjee, um dos pesquisadores que realizaram o estudo disse ao TechXplore. "Sentimos que uma abordagem semelhante poderia ser adotada para analisar a popularidade dos livros e descobrimos que Goodreads é ideal para esta investigação."
A popularidade de um livro depende de uma infinidade de fatores e pode ser medida usando vários parâmetros. Em seu estudo, os pesquisadores se concentraram em como as características de leitura de livros influenciam sua popularidade. Eles realizaram uma análise de plataforma cruzada de entidades Goodreads e tentaram vinculá-las ao volume de vendas de livros na Amazon.
"Seguimos a intuição de que a popularidade dos livros é principalmente impulsionada por seus leitores, daí a motivação para extrair o comportamento de leitura de livros para compreender a popularidade futura dos livros, "Mukherjee disse." Uma das melhores maneiras de quantificar a popularidade dos livros é olhar seu registro de vendas. Assim, tentamos quantificar a noção de popularidade em termos de best-sellers da Amazon. "
Começar com, os pesquisadores analisaram o comportamento coletivo de leitura dos usuários no Goodreads. Eles então quantificaram diferentes características de entidades Goodreads, que poderia ser usado para identificar diferenças entre os bestsellers da Amazon e outros livros menos vendidos. Finalmente, eles desenvolveram um modelo baseado em aprendizado de máquina que usa esses recursos característicos para prever se um livro se tornará um best-seller 15 dias após sua publicação.
"Usamos modelos de aprendizado de máquina de última geração para realizar nossas previsões, "Mukherjee explicou." Observamos que as classificações e resenhas recebidas por um livro no Goodreads não são tão eficazes em prever os mais vendidos quanto os padrões de status de leitura dos usuários. Por exemplo, no Goodreads, um leitor pode postar quanto do livro foi lido, em qual página ele está, pode comentar sobre o livro, etc. Consideramos esses recursos muito eficazes para prever se o livro será um best-seller no futuro. "
Propriedades características das postagens de status dos usuários do Goodreads:distribuição de a) número de atualizações de status por usuário b) número de usuários únicos atualizando status c) número de usuários atualizando várias vezes d) tempo de chegada entre status e) extensão máxima média de leitura f ) tempo médio para terminar a leitura do ABS vs outros livros. Crédito:Maity, Panigrahi &Mukherjee.
Seu modelo alcançou uma precisão média muito promissora de 88,72 por cento na previsão de livros que se tornariam best-sellers da Amazon algumas semanas após sua publicação. Seu método, que foi baseado em recursos derivados de postagens de usuários e propriedades relacionadas ao gênero, alcançou uma melhoria de 16,4 por cento em comparação com os métodos de linha de base que usam apenas fatores de popularidade tradicionais, como avaliações ou resenhas de livros.
"Um dos insights mais importantes que obtemos deste estudo é que os livros mais vendidos da Amazon podem não ser necessariamente qualificados por um texto de revisão de alta qualidade dos leitores ou um alto volume de avaliações, "Mukherjee disse." Em contraste, a grande maioria deles tem padrões de status de leitor que os distinguem fortemente do resto dos livros. "
Os pesquisadores também avaliaram o quão bem seu método poderia prever dois outros tipos de livros:aqueles com alta classificação que recebem um grande número de avaliações, mas não são bestsellers (HRHR), e livros indicados ao prêmio Goodreads Choice (GCAN) que não são bestsellers. Eles alcançaram uma alta precisão média de 87,1 por cento para GCAN e de 86,22 por cento para livros HRHR.
“Acreditamos que este trabalho seja uma contribuição importante para a literatura atual, pois não só desdobra o comportamento de leitura coletiva de uma plataforma de leitura de livros sociais por meio de um estudo de medição rigoroso, mas também estabelece uma forte ligação entre dois canais ortogonais - Goodreads e Amazon, "Mukherjee disse.
O modelo desenvolvido por Mukherjee e seus colegas poderia fomentar o desenvolvimento de ferramentas que ligam a Amazon e o Goodreads por meio de novos designs de política de plataforma cruzada. Eles acreditam que tais interações podem ser uma das razões por trás da aquisição da Goodreads pela Amazon em março de 2013. Os pesquisadores agora estão procurando expandir seu estudo analisando ainda mais o comportamento de leitura dos usuários.
"Existem várias direções que planejamos explorar no futuro, "Mukherjee disse." Uma é investigar a popularidade de diferentes gêneros de livros - por exemplo, quais são os padrões de postagem de status em diferentes gêneros de livros? Outra é estudar a inter-dinâmica do gênero e da demografia do leitor. Por exemplo, como os comportamentos de leitura dos homens diferem dos das mulheres, ou como eles diferem em vários continentes? "
© 2018 Tech Xplore