Os pesquisadores gravaram sons semelhantes a tiros em locais onde havia probabilidade de disparos de armas, o que incluiu um parque ao ar livre. Crédito:Florida Atlantic University
De acordo com o Gun Violence Archive, houve 296 tiroteios em massa nos Estados Unidos este ano. Infelizmente, 2021 está a caminho de ser o ano mais mortal da violência armada nos Estados Unidos nas últimas duas décadas.
Discernir entre um evento de áudio perigoso, como um disparo de arma, e um evento sem risco de vida, como o estouro de um saco plástico, pode significar a diferença entre a vida e a morte. Além disso, também pode determinar se deve ou não implantar trabalhadores de segurança pública. Os humanos, assim como os computadores, muitas vezes confundem os sons de um saco plástico estourando e sons reais de tiros.
Nos últimos anos, houve um certo grau de hesitação sobre a implementação de alguns dos conhecidos sistemas de detecção de tiros acústicos disponíveis, uma vez que podem ser caros e muitas vezes não confiáveis.
Em um estudo experimental, pesquisadores da Faculdade de Engenharia e Estudos de Computação da Florida Atlantic University se concentraram em abordar a confiabilidade desses sistemas de detecção no que se refere à taxa de falsos positivos. A capacidade de um modelo de discernir corretamente os sons, mesmo nos cenários mais sutis, diferenciará um modelo bem treinado de um pouco eficiente.
Com a difícil tarefa de contabilizar todos os sons semelhantes a um som de tiro, os pesquisadores criaram um novo conjunto de dados composto por gravações de áudio de explosões de sacolas plásticas coletadas em uma variedade de ambientes e condições, como tamanho da sacola plástica e distância da gravação. microfones. As gravações dos clipes de áudio variaram de 400 a 600 milissegundos de duração.
Os pesquisadores também desenvolveram um algoritmo de classificação baseado em uma rede neural convolucional (CNN), como linha de base, para ilustrar a relevância desse esforço de coleta de dados. Os dados foram então usados, juntamente com um conjunto de dados de som de tiro, para treinar um modelo de classificação baseado em uma CNN para diferenciar eventos de tiro com risco de vida de eventos de explosão de saco plástico sem risco de vida.
Os pesquisadores usaram uma câmara anecóica como um dos ambientes, que fornece amostras “puras”, não perturbadas, que agregaram muitas informações à CNN, por sua vez, tornando o modelo mais robusto. Crédito:Florida Atlantic University
Os resultados do estudo, publicados na revista Sensors, demonstram como sons falsos de tiros podem confundir facilmente um sistema de detecção de som de tiros. Setenta e cinco por cento dos sons de estouro de sacolas plásticas foram classificados erroneamente como sons de tiros. O modelo de classificação baseado em aprendizado profundo treinado com um conjunto de dados de som urbano popular contendo sons de tiros não conseguiu distinguir sons de saco plástico de sons de tiros. No entanto, uma vez que os sons de pop de sacola plástica foram injetados no treinamento do modelo, os pesquisadores descobriram que o modelo de classificação da CNN teve um bom desempenho na distinção de sons reais de tiros de sons de sacolas plásticas.
"Como humanos, usamos entradas sensoriais adicionais e experiências passadas para identificar sons. Os computadores, por outro lado, são treinados para decifrar informações que muitas vezes são irrelevantes ou imperceptíveis aos ouvidos humanos", disse Hanqi Zhuang, Ph.D., autor sênior. , professor e presidente do Departamento de Engenharia Elétrica e Ciência da Computação da Faculdade de Engenharia e Ciência da Computação. "Semelhante a como os morcegos se movem em torno de objetos enquanto transmitem ondas sonoras de alta frequência que retornam a eles em diferentes intervalos de tempo, usamos diferentes ambientes para dar ao algoritmo de aprendizado de máquina uma melhor percepção da diferenciação dos sons intimamente relacionados. "
Para o estudo, sons semelhantes a tiros foram registrados em locais onde havia probabilidade de disparos de armas, que incluíam um total de oito locais internos e externos. O processo de coleta de dados iniciou-se com a experimentação de diversos tipos de sacolas, sendo os revestimentos de lixeiras selecionados como os mais adequados. A maioria dos clipes de áudio foram capturados usando seis dispositivos de gravação. Para verificar até que ponto um modelo de classificação de som pode ser confundido com tiros falsos, os pesquisadores treinaram o modelo sem expô-lo a sons de saco plástico.
Inicialmente, foram usadas 374 amostras de tiros para treinar o modelo, que foram obtidas do banco de dados de sons urbanos. Os pesquisadores usaram 10 classes do banco de dados (tiro de arma, cachorro latindo, crianças brincando, buzina de carro, ar condicionado, música de rua, sirene, motor em marcha lenta, britadeira e perfuração). Após o treinamento, o modelo foi usado para testar sua capacidade de rejeitar sons de estouro de sacolas plásticas como verdadeiros sons de tiros.
"A alta porcentagem de erros de classificação indica que é muito difícil para um modelo de classificação discernir sons semelhantes a tiros, como os de sacos plásticos, e sons reais de tiros", disse Rajesh Baliram Singh, primeiro autor e Ph.D. estudante do Departamento de Engenharia Elétrica e Ciência da Computação da FAU. “Isso garante o processo de desenvolvimento de um conjunto de dados contendo sons semelhantes aos sons de tiros reais”.
Na detecção de tiro, ter um banco de dados de um som específico que pode ser confundido com o som de tiro, mas rico em diversidade, pode levar a um sistema de detecção de tiro mais eficaz. Esse conceito motivou os pesquisadores a criar um banco de dados de sons de explosão de sacolas plásticas. Quanto maior a diversidade do mesmo som, maior a probabilidade de o algoritmo de aprendizado de máquina detectar corretamente esse som específico.
"Melhorar o desempenho de um algoritmo de detecção de tiro, em particular, para reduzir sua taxa de falsos positivos, reduzirá as chances de tratar eventos de áudio inócuos como eventos de áudio perigosos envolvendo armas de fogo", disse Stella Batalama, Ph.D., reitor, College de Engenharia e Ciência da Computação. "Este conjunto de dados desenvolvido por nossos pesquisadores, juntamente com o modelo de classificação que eles treinaram para tiros e sons semelhantes a tiros, é um passo importante que leva a muito menos falsos positivos e melhora a segurança pública geral, mobilizando pessoal crítico apenas quando necessário".