p O pipeline de aprendizado de máquina usado para treinar os modelos. Crédito:Greg Ross
p Um estudo no qual modelos de aprendizado de máquina foram treinados para avaliar mais de 1 milhão de empresas mostrou que a inteligência artificial (IA) pode determinar com precisão se uma empresa iniciante falirá ou se tornará bem-sucedida. O resultado é uma ferramenta, Venhound, que tem o potencial de ajudar os investidores a identificar o próximo unicórnio. p É bem sabido que cerca de 90% das startups são malsucedidas:entre 10% e 22% falham no primeiro ano, e isso representa um risco significativo para os capitalistas de risco e outros investidores em empresas em estágio inicial. Em uma tentativa de identificar quais empresas têm mais chances de sucesso, pesquisadores desenvolveram modelos de aprendizado de máquina treinados no desempenho histórico de mais de 1 milhão de empresas. Seus resultados, publicado no KeAi's
The Journal of Finance and Data Science , mostram que esses modelos podem prever o resultado de uma empresa com até 90% de precisão. Isso significa que potencialmente 9 em cada 10 empresas são avaliadas corretamente.
p "Esta pesquisa mostra como conjuntos de modelos de aprendizado de máquina não lineares aplicados a big data têm um enorme potencial para mapear grandes conjuntos de recursos para resultados de negócios, algo que é inatingível com os modelos tradicionais de regressão linear, "explica o co-autor Sanjiv Das, Professor de finanças e ciência de dados na Leavey School of Business da Universidade de Santa Clara, nos Estados Unidos.
p Os autores desenvolveram um novo conjunto de modelos em que a contribuição combinada dos modelos supera o potencial preditivo de cada um sozinho. Cada modelo classifica uma empresa, colocando-o em uma das várias categorias de sucesso ou uma categoria de falha com uma probabilidade específica. Por exemplo, uma empresa pode ter grande probabilidade de sucesso se o conjunto disser que ela tem 75% de probabilidade de estar no IPO (listada na bolsa de valores) ou na categoria de 'adquirida por outra empresa', enquanto apenas 25% de sua previsão cairia na categoria de falha.
p Os pesquisadores treinaram os modelos em dados provenientes do Crunchbase, uma plataforma de crowdsourcing contendo informações detalhadas sobre muitas empresas. Eles casaram as observações do Crunchbase com dados de patentes do USPTO (United States Patent and Trademark Office). Dada a natureza de crowdsourcing do Crunchbase, não foi nenhuma surpresa saber que faltam informações nas entradas de algumas empresas. Essa observação inspirou os autores a medir a quantidade de informações que faltam para cada empresa e usar esse valor como entrada para o modelo. Essa observação acabou sendo uma das características mais críticas para determinar se uma empresa seria adquirida ou faliria.
p O autor principal Greg Ross da Venhound Inc. observa que o conjunto de modelos, junto com novos recursos de dados, "gera um nível de precisão, precisão e recall que excede outros estudos semelhantes. Os investidores podem usar isso para avaliar rapidamente os clientes em potencial, levantar bandeiras vermelhas potenciais e tomar decisões mais informadas sobre a composição de seus portfólios. "