• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Novos algoritmos de big data melhoram a detecção de terremotos; monitorar a saúde do gado e pragas agrícolas

    Crédito CC0:domínio público

    Dois novos algoritmos podem ajudar os sistemas de alerta precoce de terremotos a ganhar alguns segundos extras para cair, cobrir, e segure-se antes que o chão comece a tremer.

    Cientistas da computação da Universidade da Califórnia, A Riverside desenvolveu dois algoritmos que irão melhorar o monitoramento de terremotos e ajudar os agricultores a proteger suas plantações de insetos perigosos, ou monitorar a saúde de galinhas e outros animais. Os algoritmos detectam padrões em enormes conjuntos de dados rapidamente, com menos poder de computação e menor custo, do que outros métodos e têm sido usados ​​para melhorar a detecção de terremotos, monitorar o inseto vetor psilídeo cítrico asiático, e avaliar o comportamento alimentar das galinhas.

    Big data, grandes problemas

    Sensores, como sensores sísmicos, que registra automaticamente eventos que acontecem repetidamente ao longo de um período de tempo, ter um problema. Eles reúnem tantos dados que é difícil detectar padrões. A análise de série temporal corrige isso procurando outros exemplos de uma sequência de amostra dentro de um conjunto de dados, geralmente usando unidades de processamento gráfico, ou GPUs. Mas, para conjuntos de dados muito grandes, isso se torna impraticável porque requer muitas GPUs, o que aumenta o custo.

    Zachary Zimmerman, estudante de doutorado em ciência da computação na Faculdade de Engenharia de Marlan e Rosemary Bourns, construído em um algoritmo desenvolvido anteriormente pelo coautor e professor de ciência da computação Eamonn Keogh para lidar com conjuntos de dados extremamente grandes e executado em 40 GPUs hospedadas na nuvem Amazon Web Services.

    O algoritmo, chamado SCAMP, classificou quase dois anos de registros sísmicos de Parkfield Fault, na Califórnia, um segmento da falha de San Andreas localizado perto da cidade de Parkfield, em apenas 10 horas, a um custo razoável de cerca de US $ 300, e descobriu 16 vezes mais terremotos do que se conhecia.

    "É difícil enfatizar demais o quão escalonável esse algoritmo é, "Disse Keogh." Para demonstrar isso, fizemos um quintilhão - que é 1 seguido por 18 zeros - comparações entre pares de fragmentos de dados de terremotos. Nada mais na literatura chega a um décimo de um por cento desse tamanho. "

    Identificar terremotos nem sempre é fácil

    "O problema mais fundamental na sismologia é a identificação de terremotos. Houve uma série de melhorias metodológicas por sismólogos que aplicaram estratégias da ciência da computação para procurar padrões semelhantes, "disse o co-autor Gareth Funning, professor associado de sismologia. "O grande avanço aqui é que o conjunto de dados que você pode gerenciar é muito, muito maior. Quando olhamos para dados sísmicos, costumávamos pensar que estávamos indo bem comparando tudo em uma janela de tempo de dois meses. "

    Outros métodos de detecção de terremotos exigem que o algoritmo encontre sequências que correspondam a um terremoto conhecido. Em vez disso, o método UC Riverside compara tudo dentro de um determinado tempo e, portanto, pode identificar terremotos que não necessariamente correspondem a um dado como modelo.

    Por exemplo, sua análise dos dados de Parkfield descoberta sutil, terremotos de baixa frequência sob a falha de San Andreas. Seqüências desses terremotos, também conhecido como tremores não vulcânicos, acompanhar profundamente, movimentos lentos das placas tectônicas.

    As rajadas de terremotos de baixa frequência ocasionalmente precedem terremotos massivos, como aquele no Japão há 10 anos. Uma melhor detecção de terremotos de baixa frequência pode ajudar a melhorar as previsões dos maiores terremotos e também ajudar os cientistas a monitorar melhor os movimentos das placas tectônicas.

    De terremotos a galinhas e pragas de insetos

    O algoritmo SCAMP também pode detectar pragas agrícolas prejudiciais. Keogh conectou sensores que registraram os movimentos dos insetos enquanto sugavam os sucos das folhas e usou o algoritmo para identificar psilídeos cítricos asiáticos, o inseto responsável por devastar as plantações de cítricos, espalhando a bactéria que causa o Huanglongbing, ou doença de greening dos cítricos. Ele também usou o algoritmo para analisar um conjunto de dados de acelerômetros, que medem vários tipos de movimentos, anexado a galinhas por um período de dias. O SCAMP então identificou padrões específicos relacionados à alimentação e outros comportamentos.

    SCAMP tem uma limitação, Contudo.

    "O SCAMP exige que você tenha toda a série temporal antes de pesquisar. Em casos de mineração de dados históricos de sismologia, nós temos isso. Ou em um estudo científico, podemos fazer o frango funcionar por 10 horas e analisar os dados após o fato, "disse o co-autor Philip Brisk, professor associado de ciência da computação e orientador de doutorado de Zimmerman. "Mas com o fluxo de dados direto do sensor, não queremos esperar 10 horas. Queremos ser capazes de dizer que algo está acontecendo agora. "

    Detecção mais rápida de terremotos em tempo real

    Zimmerman usou bilhões de pontos de dados, chamado de perfil de matriz, gerado pela análise do SCAMP dos dados de falha de Parkfield para treinar um algoritmo que ele chamou de LAMP. O LAMP compara os dados de streaming com exemplos que viu antes para selecionar os dados mais relevantes à medida que saem do sensor.

    "Ter o perfil da matriz disponível para você no sensor significa que você pode saber imediatamente o que é importante e o que não é. Você pode fazer todas as suas verificações em tempo real porque está apenas olhando as partes importantes, "Zimmerman disse.

    A capacidade de interpretar os dados sísmicos mais rapidamente pode melhorar os sistemas de alerta de terremotos que já existem.

    "Com aviso prévio de terremoto, você está tentando detectar coisas em estações de monitoramento e, em seguida, encaminhar as informações para um sistema central que avalia se é ou não um grande terremoto, "disse Funning." Uma configuração como esta poderia potencialmente fazer grande parte do trabalho de discriminação antes de ser transmitida ao sistema. Você pode economizar tempo no cálculo necessário para determinar se um evento prejudicial está em andamento, dando às pessoas alguns segundos extras para largar, cobrir, e espere. "

    "Alguns segundos são enormes no aviso prévio de terremoto, " ele adicionou.

    O artigo sobre SCAMP, "Matrix Profile XIV:Scaling Time Series Motif Discovery with GPUs to Break a Quintillion Pairwise Comparisons a Day and Beyond, "foi apresentado no Simpósio ACM sobre Computação em Nuvem de 20 a 23 de novembro, 2019 em Santa Cruz. Os autores são Zachary Zimmerman, Kaveh Kamgar, Nader Shakibay Senobari, Brian Crites, Gareth Funning, Philip Brisk e Eamonn Keogh.

    O artigo sobre LAMP, "Perfil de matriz XVIII:Mineração de série temporal em face de fluxos de movimento rápido usando um perfil de matriz aproximada aprendida, "foi apresentado na Conferência Internacional IEEE de 2019 sobre mineração de dados realizada em Pequim no início de novembro. Os autores são Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Philip Brisk, e Eamonn Keogh.


    © Ciência https://pt.scienceaq.com