• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • O debate sobre novas medidas de privacidade do censo ignora problemas maiores com erros de dados no financiamento do Título I

    Crédito:Pixabay/CC0 Public Domain

    A controvérsia envolve as novas medidas do U.S. Census Bureau para preservar a privacidade, mas um novo estudo examina como o erro de dados existente pode representar um problema ainda maior para políticas baseadas em evidências. A pedra angular das medidas de privacidade atualizadas do Census Bureau, privacidade diferencial, requer injetar incerteza estatística, ou ruído, ao compartilhar dados confidenciais. Acadêmicos, políticos e ativistas levantaram preocupações sobre o efeito desse ruído em usos cruciais de dados do censo. No entanto, a maioria das análises de trade-offs em torno da privacidade diferencial ignora incertezas mais profundas nos dados do censo. Em um novo estudo, os pesquisadores examinaram como as políticas educacionais que usam dados do censo alocam fundos de forma incorreta como resultado da incerteza estatística.
    O estudo descobriu que alocações incorretas devido ao ruído injetado para privacidade podem ser pequenas ou insignificantes, em comparação com alocações incorretas devido a fontes existentes de erro de dados, como relatórios incorretos ou não resposta. Mas o estudo também conclui que reformas simples de políticas podem ajudar as fórmulas de financiamento a lidar com a distribuição desigual de incerteza de erros de dados e facilitar o caminho para novas proteções de privacidade, oferecendo um caminho para o compromisso entre política direcionada, equidade e melhores proteções de privacidade.

    O estudo, conduzido por pesquisadores da Carnegie Mellon University (CMU) e publicado na Science , concentra-se no Título I da Lei de Educação Elementar e Secundária, que fornece assistência financeira a distritos escolares com alto número de crianças de famílias de baixa renda para ajudar a garantir que todas as crianças atendam aos padrões estaduais de educação. Os fundos federais são alocados por meio de fórmulas baseadas principalmente nas estimativas de pobreza do Censo e no custo da educação em cada estado. Em 2021, o governo dos EUA destinou mais de US$ 16,5 bilhões em fundos do Título I para mais de 13.000 distritos escolares e outras agências educacionais locais.

    Neste estudo, os pesquisadores usaram uma simulação exata do processo de alocação do Título I para comparar os impactos da política de ruído injetado para privacidade com os impactos da incerteza estatística existente. Especificamente, eles compararam os impactos do erro de dados quantificados e de um possível mecanismo de injeção de ruído diferencialmente privado. Por exemplo, dos US$ 11,7 bilhões em fundos do Título I de 2021 que este estudo examinou, US$ 1,06 bilhão foram alocados fora de alguns distritos em uma execução média da simulação devido apenas a erros de dados. Esse número aumentou apenas US$ 50 milhões quando os pesquisadores injetaram ruído para fornecer proteção de privacidade relativamente forte.

    "Demos atenção especial à forma como o Título I concentra implicitamente os impactos negativos da incerteza estatística em grupos marginalizados", explica Ryan Steed, Ph.D. estudante do Heinz College da CMU, que liderou o estudo. “O enfraquecimento da proteção da privacidade faz pouco para ajudar esses grupos e, para eles, participar de uma pesquisa do Censo pode ser especialmente arriscado”.

    Os resultados mostram que as alocações incorretas devido à incerteza estatística prejudicam particularmente os grupos marginalizados (por exemplo, estudantes negros e asiáticos; distritos com grandes populações de estudantes hispânicos). A perda de financiamento de um grupo demográfico dependia de seus membros tenderem a viver em distritos de alta ou baixa pobreza, incluindo aqueles em distritos mais densos, geralmente urbanos.

    “No entanto, também identificamos reformas de políticas que poderiam reduzir os impactos díspares de erros de dados e mecanismos de privacidade”, observa Steven Wu, professor assistente da Escola de Ciência da Computação da CMU. "Por exemplo, o uso de médias de vários anos, em vez de estimativas de um único ano, diminuiu tanto a má alocação geral quanto as disparidades nos resultados".

    Entre as limitações do estudo, os autores apontam que seu estudo não leva em conta subcontas sistemáticas e muitas outras formas não quantificadas de incerteza estatística que afetam as estimativas de pobreza, incluindo medidas anteriores para proteger a privacidade, como troca de dados.

    "Nossos resultados sugerem que os impactos da privacidade diferencial em relação a outras fontes de erro nos dados do censo podem ser mínimos", observa Alessandro Acquisti, professor de tecnologia da informação e políticas públicas do Heinz College da CMU, coautor do estudo. “Simplesmente reconhecer os efeitos do erro de dados pode melhorar o desenho de políticas futuras tanto para as fórmulas de financiamento quanto para evitar a divulgação”. + Explorar mais

    Privacidade diferencial a escolha correta para o Censo dos EUA de 2020




    © Ciência https://pt.scienceaq.com