Gravações com muitos chapéus diferentes, fones de ouvido e estilos de roupas estão incluídos nos dados coletados pelos pesquisadores. Crédito:Laboratório de Ciência Coordenado na Universidade de Illinois em Urbana-Champaign
Os pesquisadores que estudam a tecnologia de escuta vestível agora têm um novo conjunto de dados para usar, agradecimentos ao estudante de graduação Ryan Corey da Universidade de Illinois em Urbana-Champaign e sua equipe.
Estreando na Conferência Internacional de Acústica, Fala, e Processamento de Sinal (ICASSP) esta semana, o primeiro conjunto de dados de resposta de impulso de microfone vestível de seu tipo é inestimável para a pesquisa de áudio por duas razões:primeiro, os dados incluem até 80 microfones em vez dos dois habituais que mostram como é ouvido em diferentes partes do corpo, e em segundo lugar, os dados estão disponíveis gratuitamente sob uma licença de acesso aberto.
"Nós acreditamos em aparelhos auditivos, fones de ouvido inteligentes e todos os dispositivos de escuta funcionariam melhor se tivessem muitos microfones, mas a maioria dos produtos tem apenas dois, "disse Corey." Não há dados lá fora para mais do que isso. Mesmo o trabalho que foi feito com mais não incluiu conjuntos de dados de acesso aberto. "
O conjunto de dados consiste em mais de 8, 000 respostas de impulso acústico medidas em 80 posições diferentes no corpo. Os 80 microfones foram testados em cinco estilos diferentes de chapéus / fones de ouvido e com seis tipos diferentes de roupas. O som nas gravações veio de 24 direções diferentes para simular multidões barulhentas.
Microfones foram colocados em 80 lugares diferentes em um manequim e o som foi reproduzido em 24 direções diferentes para criar o conjunto de dados. Crédito:Laboratório de Ciência Coordenado na Universidade de Illinois em Urbana-Champaign
O grupo, incluindo o conselheiro de Corey, Professor Andrew Singer do Laboratório de Ciência Coordenado (CSL), e o ex-aluno de graduação Naoki Tsuda, passou semanas colocando 80 microfones em um manequim e no próprio Corey no Laboratório de Escuta Aumentada da CSL. Eles então gravaram respostas de impulso acústico para estudar a acústica do corpo e se as roupas influenciam ou não na forma como os microfones captam o ruído. Os dados coletados são usados pela equipe no artigo que está sendo apresentado no ICASSP esta semana, mas eles queriam que os dados fossem mais longe.
"Ficamos frustrados ao tentar usar conjuntos de dados que não estão abertos, "disse Corey." Matrizes vestíveis são importantes e mais pessoas deveriam pesquisá-las. Ter esses dados disponíveis tornará isso mais conveniente. "
Futuros pesquisadores podem usar os dados para simular conjuntos de microfones vestíveis com diferentes números de microfones em diferentes pontos do corpo. Muitos humanos já usam vários dispositivos com microfones, e esses dados podem ajudar a tirar proveito disso. Os engenheiros podem usá-lo para projetar novos produtos e estudar as compensações de desempenho para diferentes aplicações. Algumas das aplicações potenciais para os dados incluem realidade aumentada, reconhecimento de fala, e detecção de evento acústico, entre outros. Sem o conjunto de dados criado pela equipe CSL, cada pesquisador teria que construir seus próprios protótipos e testá-los, o que é demorado e caro.
O líder da equipe Ryan Corey e um manequim, ambos cobertos por 80 microfones durante a pesquisa. Crédito:Laboratório de Ciência Coordenado na Universidade de Illinois em Urbana-Champaign
A apresentação acontece na terça-feira, 14 de maio, em Brighton, REINO UNIDO. Cantor, Fox Family Professor em Engenharia Elétrica e de Computação, e Corey espera que a apresentação aumente a conscientização sobre o conjunto de dados, incentive outros a usá-lo, e dar-lhes a oportunidade de receber feedback.
"Esta é a conferência com melhor participação de processamento de sinal de áudio, então, serei capaz de apresentar o conjunto de dados a muitos pesquisadores que poderiam tirar proveito dele, construir sobre isso, e nos dê feedback para melhorias futuras, "disse Corey.
O conjunto de dados está disponível sob uma Licença de Atribuição Creative Commons nos arquivos do Banco de Dados de Illinois da Biblioteca da Universidade de Illinois. Corey também escreveu sobre o conjunto de dados no blog do laboratório.