p Crédito CC0:domínio público
p Depois que o U.S. Census Bureau anunciou que estava mudando a forma como protege as identidades de indivíduos para o Censo de 2020, uma equipe de pesquisa liderada pela Penn State começou a avaliar como essas mudanças podem afetar a integridade dos dados do censo. p O Census Bureau está propondo o uso de privacidade diferencial, um novo método que tenta proteger as identidades dos indivíduos ao publicar dados públicos. Os dados do censo são usados para distribuir fundos federais que afetam as comunidades e também determinam a representação no Congresso.
p Alexis Santos, professor assistente de desenvolvimento humano e estudos da família na Penn State, junto com os pesquisadores Jeffrey Howard, professor assistente da Universidade do Texas em San Antonio, e Ashton Verdery, professor assistente de sociologia, demografia, e análise de dados sociais na Penn State, examinaram as taxas de mortalidade em 2010. Os pesquisadores compararam os dois métodos de proteção da privacidade e a implicação dessa mudança para entender melhor as disparidades de saúde nos Estados Unidos. O trabalho foi publicado recentemente em
Proceedings of the National Academy of Sciences .
p A equipe de pesquisa descobriu que quando o método de privacidade diferencial foi usado nos dados do Censo, produziu mudanças dramáticas na contagem da população para as minorias raciais e étnicas em comparação com os métodos tradicionais.
p "Nós nos concentramos nas estimativas da taxa de mortalidade porque elas são uma métrica em nível populacional essencial para a qual os dados são coletados e disseminados em nível nacional e porque as taxas de mortalidade são um indicador crítico da saúde da população, "disse Santos.
p A equipe de pesquisa então explorou as mudanças nas taxas de mortalidade resultantes dos dois sistemas de prevenção de divulgação por classificações metropolitanas.
p "Descobrimos que, ao usar privacidade diferencial, houve casos de contagem insuficiente e excessiva da população. Nas áreas rurais, houve subestimação de minorias raciais e étnicas, enquanto nas áreas urbanas houve uma supercontagem dessas populações, "Disse Santos.
p Os pesquisadores descobriram que algumas discrepâncias entre os dois métodos de análise de dados ultrapassaram a diferença de 10%.
p "Isso é muito preocupante porque pode impactar o quanto os programas de financiamento recebem para uma área geográfica específica, "disse Santos." Essas discrepâncias podem resultar em riscos de saúde subestimados em algumas áreas, e exagerando em outros onde não há uma grande necessidade. "
p De acordo com Santos, os resultados destacam as consequências da implementação de privacidade diferencial e demonstram os desafios de usar os produtos de dados derivados desse método.
p "O Census Bureau tem sido muito receptivo à nossa pesquisa, e demonstrou preocupação com a precisão dos dados, "Disse Santos." Planejamos avançar com pesquisas adicionais para determinar como a privacidade diferencial pode afetar as estimativas de crescimento populacional e as mudanças populacionais de um censo para outro. Ainda temos tempo para ajustar o algoritmo de privacidade diferencial, e nossa pesquisa ajudará a identificar áreas de melhoria. "