Um novo estudo de Dressel et al. mostra que o software COMPAS não é mais preciso ou justo do que as previsões feitas por pessoas com pouca ou nenhuma experiência em justiça criminal. Crédito:Carla Schaffer / AAAS
Uma ferramenta de software de computador amplamente usada pode não ser mais precisa ou justa na previsão de comportamentos criminosos repetidos do que pessoas sem experiência em justiça criminal, de acordo com um estudo do Dartmouth College.
A análise de Dartmouth mostrou que os não especialistas que responderam a uma pesquisa online tiveram desempenho igual, bem como o sistema de software de Criação de Perfil de Gerenciamento de Criminosos Correcional para Sanções Alternativas (COMPAS) usado pelos tribunais para ajudar a determinar o risco de reincidência.
O artigo também demonstra que, embora o COMPAS use mais de cem informações para fazer uma previsão, o mesmo nível de precisão pode ser alcançado com apenas duas variáveis - a idade do réu e o número de condenações anteriores.
De acordo com o artigo de pesquisa, O COMPAS tem sido usado para avaliar mais de um milhão de infratores desde que foi desenvolvido em 1998, com seu componente de previsão de reincidência em uso desde 2000.
A análise, publicado no jornal Avanços da Ciência , foi conduzido pela equipe de pesquisa do corpo docente de Julia Dressel e Hany Farid.
"É preocupante que trabalhadores não treinados da Internet possam ter um desempenho tão bom quanto um programa de computador usado para tomar decisões que alteram a vida de réus criminais, "disse Farid, Albert Bradley, 1915, Professor de Ciência da Computação do Terceiro Século no Dartmouth College. "O uso de tal software pode não estar fazendo nada para ajudar as pessoas que poderiam ter uma segunda chance negada por algoritmos de caixa preta."
De acordo com o jornal, ferramentas de software são usadas no pré-julgamento, liberdade condicional, e decisões de sentença para prever o comportamento criminoso, incluindo quem provavelmente não comparecerá a uma audiência no tribunal e quem provavelmente reincidirá em algum momento no futuro. Os defensores de tais sistemas argumentam que o big data e o aprendizado de máquina avançado tornam essas análises mais precisas e menos tendenciosas do que as previsões feitas por humanos.
"Afirmações de que ferramentas de dados secretas e aparentemente sofisticadas são mais precisas e justas do que os humanos simplesmente não são suportadas por nossas descobertas de pesquisa, "disse Dressel, que realizou a pesquisa como parte de sua tese de graduação em ciência da computação em Dartmouth.
O documento de pesquisa compara o software comercial COMPAS com os trabalhadores contratados por meio do mercado de crowdsourcing Mechanical Turk da Amazon para ver qual abordagem é mais precisa e justa ao julgar a possibilidade de reincidência. Para efeitos do estudo, reincidência foi definida como o cometimento de contravenção ou crime dentro de dois anos da última prisão do réu.
Grupos de profissionais da Internet viram pequenas descrições que incluíam o sexo do réu, era, e história criminal anterior. Os resultados humanos foram então comparados com os resultados do sistema COMPAS, que utiliza 137 variáveis para cada indivíduo.
A precisão geral foi baseada na taxa em que um réu foi corretamente previsto para reincidência ou não. A pesquisa também relatou falsos positivos - quando um réu está previsto para reincidência, mas não o faz - e falsos negativos - quando um réu está previsto para reincidência, mas o faz.
Com consideravelmente menos informações do que COMPAS - sete recursos em comparação com 137 - quando os resultados foram agrupados para determinar a "sabedoria da multidão, "os humanos sem experiência presumida em justiça criminal foram precisos em 67 por cento dos casos apresentados, estatisticamente o mesmo que a precisão de 65,2 por cento do COMPAS. Os participantes do estudo e o COMPAS concordaram em 69,2 por cento dos 1000 réus ao prever quem iria repetir seus crimes.
De acordo com o estudo, a questão da previsão precisa da reincidência não se limita ao COMPAS. Uma revisão separada citada no estudo descobriu que oito dos nove programas de software não conseguiram fazer previsões precisas.
"Todo o uso de instrumentos de previsão de reincidência em tribunais deve ser questionado, "Dressel disse." Junto com o trabalho anterior sobre a justiça dos algoritmos de justiça criminal, esses resultados combinados lançam dúvidas significativas sobre todo o esforço de prever a reincidência. "
Em contraste com outras análises que enfocam se os algoritmos são racialmente tendenciosos, o estudo de Dartmouth considera a questão mais fundamental de saber se o algoritmo COMPAS é melhor do que humanos não treinados para prever a reincidência de uma forma precisa e justa.
Contudo, quando a raça foi considerada, a pesquisa descobriu que os resultados dos respondentes humanos e do software mostraram disparidades significativas entre como os réus negros e brancos são julgados.
De acordo com o jornal, é importante perguntar se poderíamos colocar essas decisões nas mãos de pessoas não treinadas que respondem a uma pesquisa online, Porque, no fim, "os resultados dessas duas abordagens parecem indistinguíveis."