Crédito CC0:domínio público
Com milhares de fãs batendo palmas, cantando, gritando e zombando, os jogos de basquete universitário podem ser quase ensurdecedores. Algumas arenas têm medidores de decibéis, que, com precisão ou não, fornecer alguma indicação do volume do ruído gerado pelos espectadores e pelos sistemas de som. Contudo, o ruído da multidão raramente é o foco da investigação científica.
"Sempre que surge na literatura, é principalmente algo que os investigadores estão tentando contornar, "observou Brooks Butler, estudante de graduação em física na Brigham Young University e membro da equipe da BYU que apresentará pesquisas no 176º Encontro da Acoustical Society of America, realizada em conjunto com a Semana de Acústica de 2018 da Canadian Acoustical Association no Canadá, 5 a 9 de novembro, no Victoria Conference Centre em Victoria, Canadá.
"O ruído da multidão é normalmente tratado como interferência de fundo - algo para filtrar." Mas os pesquisadores da BYU sentiram que o ruído da multidão era digno de sua própria investigação. Em particular, eles queriam ver se os algoritmos de aprendizado de máquina poderiam identificar padrões nos dados acústicos brutos que indicavam o que a multidão estava fazendo em um determinado momento, fornecendo assim pistas sobre o que estava acontecendo no próprio jogo. Uma possível aplicação disso poderia ser a detecção precoce de comportamento indisciplinado ou violento da multidão - embora essa ideia não tenha sido testada.
A equipe da BYU fez medições acústicas de alta fidelidade durante os jogos de basquete masculino e feminino na universidade, mais tarde fazendo o mesmo para jogos de futebol e vôlei. Eles dividiram os jogos em intervalos de meio segundo, medir o conteúdo de frequência (conforme exibido nos espectrogramas), níveis de som, a proporção dos níveis de som máximo e mínimo dentro de um bloco de tempo definido, e outras variáveis. Em seguida, eles aplicaram ferramentas de processamento de sinal que identificaram 512 características acústicas distintas compostas por diferentes bandas de frequência, amplitudes e assim por diante.
O grupo usou essas variáveis para construir um espaço de 512 dimensões, utilizando técnicas de aprendizado de máquina para realizar um computadorizado, análise de agrupamento deste complicado, reino multidimensional.
O professor de física da BYU, Kent Gee, foi o principal investigador do projeto, juntamente com os professores Mark Transtrum e Sean Warnick. Juntos, eles lideraram uma equipe de vários alunos com foco em diferentes aspectos do problema, incluindo coleta de dados, análise e aprendizado de máquina.
Gee explicou o processo com uma analogia simples. "Suponha que você tenha um gráfico de pontos em uma dimensão bidimensional, gráfico x-y e medir a distância entre esses pontos, "ele disse." Você pode ver que os pontos estão agrupados em três grupos ou grupos. Fizemos algo semelhante com nosso espaço de 512 dimensões, embora você obviamente precise de um computador para controlar tudo isso. "
A chamada análise de "agrupamento de médias K" que eles executaram revelou seis grupos separados que correspondiam ao que estava acontecendo na arena, dependendo se as pessoas estavam torcendo, cantando, vaias, sendo quieto, ou deixar os alto-falantes dominarem a paisagem sonora.
Desta maneira, Gee e seus colegas foram capazes de avaliar o estado emocional do público, simplesmente a partir de uma análise dos dados de som executada por uma máquina. "Uma eventual aplicação importante de nossa pesquisa, " ele disse, "pode ser a detecção precoce de comportamento indisciplinado ou violento da multidão."