SeismoGen, uma técnica de aprendizado de máquina desenvolvida no Laboratório, é capaz de gerar formas de onda sísmicas sintéticas de alta qualidade. A técnica pode poupar esforços tediosos e intensos de rotulagem manual e ajudar a melhorar a detecção de terremotos. Crédito:Laboratório Nacional de Los Alamos
Um novo modelo de aprendizado de máquina que gera formas de onda sísmicas realistas reduzirá o trabalho manual e melhorará a detecção de terremotos, de acordo com um estudo publicado recentemente em JGR Solid Earth .
"Para verificar a eficácia do nosso modelo gerador, nós o aplicamos a dados de campo sísmico coletados em Oklahoma, "disse Youzuo Lin, um cientista computacional do grupo de Geofísica do Laboratório Nacional de Los Alamos e investigador principal do projeto. "Por meio de uma sequência de testes e benchmarks qualitativos e quantitativos, vimos que nosso modelo pode gerar formas de onda sintéticas de alta qualidade e melhorar os algoritmos de detecção de terremotos baseados em aprendizado de máquina. "
A detecção rápida e precisa de terremotos pode ser uma tarefa desafiadora. A detecção visual feita por pessoas há muito é considerada o padrão ouro, mas requer trabalho manual intensivo que se adapta mal a grandes conjuntos de dados. Nos últimos anos, os métodos de detecção automática baseados no aprendizado de máquina melhoraram a precisão e a eficiência da coleta de dados; Contudo, a precisão desses métodos depende do acesso a uma grande quantidade de produtos de alta qualidade, dados de treinamento rotulados, frequentemente dezenas de milhares de registros ou mais.
Para resolver esse dilema de dados, a equipe de pesquisa desenvolveu o SeismoGen com base em uma rede adversarial geradora (GAN), que é um tipo de modelo gerador profundo que pode gerar amostras sintéticas de alta qualidade em vários domínios. Em outras palavras, modelos generativos profundos treinam as máquinas para fazer coisas e criar novos dados que podem passar por reais.
Uma vez treinado, o modelo SeismoGen é capaz de produzir formas de onda sísmicas realistas de vários rótulos. Quando aplicado a conjuntos de dados sísmicos reais da Terra em Oklahoma, a equipe viu que o aumento de dados de formas de onda sintéticas geradas pelo SeismoGen poderia ser usado para melhorar os algoritmos de detecção de terremotos em casos em que apenas pequenas quantidades de dados de treinamento rotulados estão disponíveis.