• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Outros
    Projetar os resultados da vida das pessoas com IA não é tão simples
    p O estudo de famílias frágeis coletou informações sobre crianças no nascimento e com 1 ano de idade, 3, 5, 9 e 15. Essas informações foram coletadas por meio de uma variedade de pesquisas, listadas à esquerda dessas idades no gráfico acima. O Fragile Families Challenge usou dados das ondas um a cinco para prever os resultados na onda seis. Crédito:Matthew Salganik et al. 2020, Universidade de Princeton

    p As técnicas de aprendizado de máquina que os cientistas usam para prever os resultados de grandes conjuntos de dados podem ser insuficientes quando se trata de projetar os resultados da vida das pessoas, de acordo com um estudo de massa liderado por pesquisadores da Universidade de Princeton em colaboração com pesquisadores de várias instituições, incluindo Virginia Tech. p Esta colaboração em massa, chamado Desafio Famílias Frágeis, representa uma coorte de cientistas que constroem modelos estatísticos e de aprendizado de máquina para prever e medir os resultados de vida das crianças, pais, e famílias nos Estados Unidos.

    p Publicado por 112 co-autores no Proceedings of the National Academy of Sciences , os resultados sugerem que sociólogos e cientistas de dados devem ter cuidado ao usar modelagem preditiva, especialmente no sistema de justiça criminal e programas sociais.

    p Mesmo depois de usar modelagem de última geração e um conjunto de dados de alta qualidade contendo 13, 000 pontos de dados para mais de 4, 000 famílias, os melhores modelos preditivos de IA não eram muito precisos.

    p Brian J. Goode, um cientista pesquisador do Fralin Life Sciences Institute da Virginia Tech, estava entre os cientistas sociais e de dados que participaram do Fragile Families Challenge.

    p A Figura A mostra a diferença entre as melhores apresentações para cada resultado em comparação com o modelo de referência. A Figura B-G comparou as previsões e a verdade para cada resultado. Crédito:Matthew Salganik et al. 2020, Universidade de Princeton

    p "É um esforço tentar capturar as complexidades e meandros que compõem a estrutura da vida humana em dados e modelos. Mas, é obrigatório dar o próximo passo e contextualizar os modelos em termos de como eles serão aplicados para melhor raciocinar sobre as incertezas e limitações esperadas de uma previsão. Esse é um problema muito difícil de enfrentar, e acho que o Fragile Families Challenge mostra que precisamos de mais apoio à pesquisa nesta área, principalmente porque o aprendizado de máquina tem um impacto maior em nossa vida cotidiana, "disse Goode. A modelagem de Goode foi conduzida por meio do Discovery Analytics Center na Virginia Tech. ele se juntou ao diretor do Discovery Analytics Center e ao professor de engenharia Thomas L. Phillips, Naren Ramakrishnan, e Debanjan Datta, um Ph.D. estudante do Departamento de Ciência da Computação da Faculdade de Engenharia, que foram fundamentais na coleta e análise de dados.

    p A equipe da Virginia Tech também publicou pesquisas em uma edição especial da Socius, um novo jornal de acesso aberto da American Sociological Association. A fim de apoiar pesquisas adicionais nesta área, todas as inscrições para o Desafio — código, previsões e explicações narrativas - estão publicamente disponíveis.

    p “O estudo também nos mostra que temos muito a aprender, e colaborações em massa como essa são extremamente importantes para a comunidade de pesquisa, "disse o co-autor do estudo PNAS Matt Salganik, professor de sociologia em Princeton e diretor interino do Center for Information Technology Policy, baseado na Escola Woodrow Wilson de Assuntos Públicos e Internacionais de Princeton.

    p O projeto foi inspirado na Wikipedia, uma das primeiras colaborações em massa do mundo, que foi criada em 2001 como uma enciclopédia compartilhada. Salganik ponderou sobre quais outros problemas científicos poderiam ser resolvidos por meio de uma nova forma de colaboração, e foi quando ele juntou forças com Sara McLanahan, o professor William S. Tod de Sociologia e Relações Públicas em Princeton, bem como os alunos de pós-graduação de Princeton Ian Lundberg e Alex Kindel, ambos no Departamento de Sociologia.

    p McLanahan é o principal investigador do Estudo de Famílias Frágeis e Bem-estar Infantil com base na Universidade de Princeton e Columbia, que tem estudado uma coorte de cerca de 5, 000 crianças nascidas em grandes cidades americanas entre 1998 e 2000, com uma amostragem excessiva de filhos nascidos de pais solteiros. O estudo longitudinal foi desenhado para compreender a vida de crianças nascidas em famílias não casadas.

    p Por meio de pesquisas coletadas em seis ondas (quando a criança nasceu e, em seguida, quando a criança atingiu 1 ano de idade, 3, 5, 9, e 15), o estudo capturou milhões de pontos de dados sobre crianças e suas famílias. Outra onda será capturada aos 22 anos.

    p Na época em que os pesquisadores projetaram o desafio, dados de 15 anos (que os pesquisadores chamam no artigo de "dados de resistência) ainda não haviam sido disponibilizados publicamente. Isso criou uma oportunidade para pedir a outros cientistas para prever os resultados de vida das pessoas no estudo por meio de uma colaboração em massa.

    p 160 equipes de pesquisa de dados e cientistas sociais construíram modelos estatísticos e de aprendizado de máquina para prever, medir seis resultados de vida para crianças, pais, e famílias. Mesmo depois de usar uma modelagem de última geração e um conjunto de dados de alta qualidade contendo 13, 000 pontos de dados sobre mais de 4, 000 famílias, os melhores modelos preditivos de IA não eram muito precisos. Crédito:Egan Jimenez, Universidade de Princeton

    p Os co-organizadores receberam 457 inscrições de 68 instituições de todo o mundo, incluindo de várias equipes baseadas em Princeton. Usando os dados de famílias frágeis, os participantes foram solicitados a prever um ou mais dos seis desfechos de vida aos 15 anos. Estes incluíam a média das notas da criança (GPA); grão de criança; despejo doméstico; privação do material doméstico; dispensa do cuidador principal; e participação do cuidador principal no treinamento para o trabalho.

    p O desafio foi baseado no método de tarefa comum, um projeto de pesquisa usado com frequência na ciência da computação, mas não nas ciências sociais. Este método libera alguns, mas não todos os dados, permitindo que as pessoas usem qualquer técnica que desejem para determinar os resultados. O objetivo é prever com precisão os dados de validação, não importa o quão sofisticada seja a técnica necessária para chegar lá.

    p A equipe está atualmente se candidatando a bolsas para continuar as pesquisas nesta área.

    p O papel, "Medindo a previsibilidade dos resultados da vida com uma colaboração científica em massa, "foi publicado em 30 de março por PNAS .


    © Ciência https://pt.scienceaq.com