A revisão das leis de bloqueio de Sydney destaca o papel vital da análise de dados transparente
p Mapa de Sydney e os recintos de entretenimento usado pelo BOCSAR em sua análise:azul - distrito de entretenimento CBD; vermelho - recinto de entretenimento de Kings Cross; verde - áreas de deslocamento próximas; amarelo - áreas externas de deslocamento. Crédito:Center for Translational Data Science, Autor fornecido
p O Bureau de Estatísticas e Pesquisas Criminais de New South Wales (BOCSAR) recentemente reivindicou os regulamentos de licenciamento de álcool de Sydney, comumente conhecidas como leis de bloqueio, reduziu os assaltos não domésticos em 13% no CBD. Seu cálculo baseou-se na decisão de alocar 1, 837 dessas ofensas a Kings Cross e a CBD - isto é, contagem dupla dos dados. Nossa análise concluiu que essa decisão foi crítica para a conclusão de que as agressões diminuíram no CBD. Para todas as outras opções sobre as áreas para as quais os dados de ofensas foram alocados e o tipo de análise, não encontramos diminuição. p Nossas descobertas destacam uma questão importante:como fazer as escolhas de coleta de dados, o pré-processamento e a análise afetam as decisões políticas?
p A atribuição de crimes a áreas é apenas uma das várias opções feitas ao usar dados para avaliar os impactos das políticas. Outras opções incluem como medir o crime violento, que período de tempo deve ser considerado e a extensão geográfica das áreas a serem incluídas. A questão é:se outras escolhas foram feitas, os resultados afetariam a decisão de revogar ou continuar as leis?
p Nossas descobertas apontam para a necessidade de seguir alguns princípios ao usar dados para informar a formulação de políticas. Primeiro, a instituição que coleta dados e a instituição que analisa os dados devem ser independentes uma da outra. Segundo, precisamos de tanta transparência quanto possível sobre os dados e sua análise.
p
Então, o que exatamente as análises mostram?
p O BOCSAR optou por usar assaltos não domésticos mensais a partir de 2009. Não há nada de errado com essas escolhas, mas outros poderiam ter sido feitos.
p Por exemplo, porque de 2009 em diante, não de 2005? Por que mensalmente, não diariamente? Por que denúncias de agressões não domésticas, não relatou assaltos que causem lesões corporais graves? Por que dividir a área apenas em CBD e Kings Cross?
p Uma forma de avaliar o impacto de tais escolhas é usar diferentes subconjuntos de dados, diferentes tipos de pré-processamento de dados e diferentes técnicas estatísticas e / ou de aprendizado de máquina. Se a conclusão ainda permanece a mesma, então nossa decisão é robusta para esta fonte de variabilidade. Se não, precisamos entender o porquê.
p Para o recinto de Kings Cross, a análise do Centre for Translational Data Science da University of Sydney mostrou que a conclusão permaneceu inalterada, independentemente da frequência e do período durante o qual os dados foram coletados e a análise realizada. Os ataques não domésticos diminuíram após a introdução das leis de bloqueio em 2014.
p Para o CBD, o inverso era verdadeiro. Somente se fizermos exatamente as mesmas escolhas que BOCSAR, em particular alocando 1, 837 crimes para a CBD e King Cross, poderíamos concluir que as agressões não-domésticas diminuíram muito ligeiramente.
p Sob todas as outras variações das análises, incluindo dados, metodologia e alocação espacial desses dados, não encontramos diminuição. Os ataques não-domésticos no CBD vinham diminuindo desde 2008 e, se alguma coisa, mais lentamente depois que as leis de bloqueio entraram em vigor.
p Então, por que foi a inclusão de 1, 837 crimes tão críticos para as conclusões sobre a CDB?
p Usando dados fornecidos pela BOCSAR, traçamos a localização mais provável desses 1, 837 crimes. A Figura 1 mostra que esses crimes ocorreram principalmente em Kings Cross, uma área em que a taxa de criminalidade caiu desde 2014. Dizemos "local mais provável" porque ainda não recebemos os dados adicionais que solicitamos do BOCSAR para nos ajudar a localizar exatamente onde esses crimes ocorreram.
p Contagens de crimes (por região SA1) que foram atribuídos à CBD e Kings Cross. Crédito:Center for Translational Data Science, Autor fornecido
p Com a remoção desses 1, 837 crimes da CBD, não detectamos nenhuma redução em agressões não-domésticas. Mas BOCSAR aparentemente sim. Depois de remover esses crimes do CBD, O BOCSAR divulgou um relatório atualizado para um inquérito parlamentar sobre a economia noturna de Sydney. Este relatório afirma que as agressões no CBD diminuíram 4% (muito menos do que os 13% originais).
p O comitê então pediu nossos comentários. Descobrimos que o relatório não forneceu um intervalo de confiança para essa diminuição. Ainda assim, o relatório teve a virtude de relatar estimativas de incerteza para outras quantidades e em outros lugares alegou resultados "estatisticamente significativos".
p Nós replicamos a análise do BOCSAR e descobrimos que a mudança no crime poderia ter sido tão baixa quanto uma redução de 12% e tão alta quanto um aumento de 6%. Em outras palavras, o resultado é "estatisticamente insignificante".
p
Quais são as implicações para a formulação de políticas?
p Por que isso importa? Existem duas razões.
p Primeiro, o perigo de não explicar, quantificar e relatar incertezas é que o público perde a confiança na formulação de políticas baseadas em dados. Somente se as conclusões reconhecerem e explicarem a incerteza inerente à inferência de quantidades complexas de dados, poderemos tomar decisões políticas robustas e explicáveis que construam a confiança do público.
p Segundo, se não aceitarmos e relatarmos incertezas, podemos parar de buscar outras explicações. Podemos então falhar em alcançar o resultado que todos desejam:uma redução da violência e uma economia noturna saudável.
p Como procedemos a partir daqui? Faríamos duas recomendações:
- A instituição que coleta e faz a curadoria dos dados deve ser distinta, informados, mas independentes da (s) instituição (ões) que analisam os dados.
- Deve haver o máximo de transparência de dados possível, o que permitiria a diferentes grupos realizar diferentes tipos de análises, usando diferentes fontes de dados.
p Estamos quase certos de que esses grupos diferentes produziriam resultados diferentes, mas a discussão subsequente pode fornecer percepções que nos levam mais perto de decisões políticas mais robustas e aceitáveis.
p Para citar o físico ganhador do Prêmio Nobel Richard Feynman:"Se apenas permitirmos, conforme progredimos, continuamos inseguros, vamos deixar oportunidades para alternativas ... para fazer progresso, deve-se deixar a porta para o desconhecido entreaberta. "
p A recomendação do comitê parlamentar de que o BOCSAR e o Center for Translational Data Science trabalhem juntos de forma mais próxima parece fazer exatamente isso. Esperamos uma colaboração contínua para aprofundar nossa compreensão dos fatores que levam ao crime violento. p Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.