• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Astronomia
    Equipe criou técnicas para analisar milhares de horas de fita da NASA
    p A partir da esquerda:Dr. John H.L. Hansen, Chengzhu Yu PhD'17, O Dr. Abhijeet Sangwan e Lakshmish Kaushik posam com uma modelo de um astronauta no Centro Espacial Johnson da NASA em Houston. Os quatro supervisionaram o projeto de desenvolver técnicas de processamento de fala para reconstruir e transformar milhares de horas de áudio das missões lunares da NASA. Crédito:Universidade do Texas em Dallas

    p A NASA gravou milhares de horas de áudio das missões lunares Apollo, no entanto, a maioria de nós só conseguiu ouvir os destaques. p A agência registrou todas as comunicações entre os astronautas, especialistas em controle de missão e equipe de apoio nos bastidores durante as históricas missões lunares, além das famosas citações de Neil Armstrong da Apollo 11 em julho de 1969.

    p A maior parte do áudio permaneceu armazenada em fitas analógicas desatualizadas por décadas, até que pesquisadores da Universidade do Texas em Dallas lançaram um projeto para analisar o áudio e torná-lo acessível ao público.

    p Pesquisadores do Center for Robust Speech Systems (CRSS) da Escola de Engenharia e Ciência da Computação Erik Jonsson (ECS) receberam uma bolsa da National Science Foundation em 2012 para desenvolver técnicas de processamento de fala para reconstruir e transformar o enorme arquivo de áudio em Explore Apollo , um site que fornece acesso público aos materiais. O projeto, em colaboração com a Universidade de Maryland, incluiu áudio de toda a Apollo 11 e da maior parte da Apollo 13, Missões Apollo 1 e Gemini 8.

    p Um salto tecnológico gigante

    p Transcrever e reconstruir o enorme arquivo de áudio exigiria um salto gigante no processamento da fala e na tecnologia da linguagem. Por exemplo, as comunicações foram capturadas em mais de 200 fitas analógicas de 14 horas, cada um com 30 trilhas de áudio. A solução precisaria decifrar a comunicação com fala distorcida, interferência técnica e loops de áudio sobrepostos. Imagine o Siri da Apple tentando transcrever discussões em meio a interrupções aleatórias e até 35 pessoas em locais diferentes, frequentemente falando com sotaques regionais do Texas.

    p O projeto, liderado pelo fundador e diretor do CRSS, Dr. John H.L. Hansen e pelo cientista pesquisador Dr. Abhijeet Sangwan, incluiu uma equipe de alunos de doutorado que trabalhou para estabelecer soluções para digitalizar e organizar o áudio. Eles também desenvolveram algoritmos para processar, reconhecer e analisar o áudio para determinar quem disse o quê e quando. Os algoritmos são descritos na edição de novembro da Transações IEEE / ACM em áudio, Fala, e processamento de linguagem .

    p Sete equipes de design sênior de graduação, supervisionadas pelo CRSS, ajudaram a criar o Explore Apollo para tornar as informações acessíveis ao público. O projeto também recebeu assistência do Centro de Educação em Ciências e Engenharia da Universidade (SEEC), que avaliou o site Explore Apollo.

    p Cinco anos depois, a equipe está completando seu trabalho, que levou a avanços na tecnologia para converter voz em texto, analise os palestrantes e entenda como as pessoas colaboraram para cumprir as missões.

    p "O CRSS fez avanços significativos em aprendizado de máquina e extração de conhecimento para avaliar a interação humana em uma das tarefas de engenharia mais desafiadoras da história da humanidade, "disse Hansen, reitor associado de pesquisa em ECS, professor de engenharia elétrica e da computação, professor da Escola de Ciências Comportamentais e do Cérebro, e cadeira ilustre em telecomunicações. Definindo equipamento retro

    p Quando eles começaram seu trabalho, pesquisadores descobriram que a primeira coisa que precisavam fazer era digitalizar o áudio. Transferir o áudio para um formato digital provou ser um feito de engenharia em si. A única maneira de jogar os rolos era em um equipamento da década de 1960 no Centro Espacial Johnson da NASA em Houston, chamado SoundScriber.

    p "A NASA nos indicou o SoundScriber e disse para fazer o que você precisa fazer, "Hansen disse.

    p Dr. John H.L. Hansen está ao lado do SoundScriber, o único dispositivo capaz de reproduzir as gravações analógicas de milhares de horas de comunicações durante as missões lunares da NASA. Crédito:Universidade do Texas em Dallas

    p O dispositivo podia ler apenas uma faixa por vez. O usuário tinha que girar mecanicamente uma alça para mover o cabeçote de leitura de fita de uma trilha para outra. Pela estimativa de Hansen, levaria pelo menos 170 anos para digitalizar apenas o áudio da missão Apollo 11 usando a tecnologia.

    p "Não podíamos usar aquele sistema, então tivemos que projetar um novo, "Hansen disse." Nós projetamos nosso próprio cabeçote de leitura de 30 faixas, e construiu uma solução paralela para capturar todas as 30 trilhas ao mesmo tempo. Esta é a única solução que existe no planeta. "

    p O novo cabeçote de leitura reduziu o processo de digitalização de anos para meses. Essa tarefa passou a ser função de Tuan Nguyen, um graduado em engenharia biomédica que passou um semestre trabalhando em Houston.

    p Amplificando as vozes dos heróis por trás dos heróis

    p Depois de transferirem o áudio das bobinas para os arquivos digitais, pesquisadores precisavam criar um software que pudesse detectar a atividade da fala, incluindo o rastreamento de cada pessoa que fala e o que ela disse e quando, um processo denominado diarização. Eles também precisavam rastrear as características dos falantes para ajudar os pesquisadores a analisar como as pessoas reagem em situações tensas. Além disso, as fitas incluíam áudio de vários canais que precisavam ser colocados em ordem cronológica.

    p Os pesquisadores que trabalharam no projeto disseram que uma das partes mais desafiadoras foi descobrir como as coisas funcionavam na NASA durante as missões para que pudessem entender como reconstruir a enorme quantidade de áudio.

    p "Isso não é algo que você pode aprender em uma aula, "disse Chengzhu Yu PhD'17. Yu começou seu programa de doutorado no início do projeto e se formou na primavera passada. Agora, ele trabalha como cientista pesquisador com foco em tecnologia de reconhecimento de fala no centro de pesquisa de inteligência artificial da Tencent em Seattle.

    p Lakshmish Kaushik, um estudante de doutorado que deixou um emprego anterior para trabalhar no projeto, também tem como objetivo dedicar sua carreira à tecnologia de reconhecimento de voz. Seu papel era desenvolver algoritmos que distinguissem a matriz de vozes em vários canais.

    p "Os últimos quatro anos foram realmente estimulantes, "Kaushik disse.

    p A equipe demonstrou o site interativo no Museu Perot de Natureza e Ciência em Dallas. Para Hansen, o projeto tem sido uma chance de destacar o trabalho de muitas pessoas envolvidas nas missões lunares além dos astronautas.

    p "Quando se pensa em Apollo, nós gravitamos para as enormes contribuições dos astronautas que claramente merecem nosso elogio e admiração.

    p Contudo, os heróis por trás dos heróis representam os incontáveis ​​engenheiros, cientistas e especialistas que trouxeram sua experiência baseada em STEM coletivamente para garantir o sucesso do programa Apollo, "Hansen disse." Esperemos que os alunos de hoje continuem a comprometer sua experiência nos campos STEM para enfrentar os desafios de amanhã. "


    © Ciência https://pt.scienceaq.com