• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Estudantes ajudam a NASA a encontrar deslizamentos de terra treinando computadores para ler o Reddit

    Segundo a Organização Mundial da Saúde, os deslizamentos de terra são mais comuns do que qualquer outro evento geológico. Crédito:NASA

    Estudantes de pós-graduação da Universidade da Colúmbia Britânica treinaram computadores para "ler" artigos de notícias sobre deslizamentos de terra no Reddit para reforçar um banco de dados da NASA, o que poderia melhorar as previsões de quando e onde esses desastres naturais ocorrerão.
    Para o projeto de mestrado em Ciência de Dados em Linguística Computacional, Badr Jaidi e sua equipe, o grupo Social Landslides, treinaram computadores para extrair automaticamente informações úteis de notícias relevantes sobre deslizamentos de terra que foram postadas no Reddit. Neste Q&A, ele discute como essa ferramenta pode acabar salvando vidas.

    Por que precisamos dessa ferramenta?

    Segundo a Organização Mundial da Saúde, os deslizamentos de terra são mais comuns do que qualquer outro evento geológico. Eles são tão destrutivos, e não temos muitos dados sobre eles. Quanto mais dados precisos sobre deslizamentos de terra você tiver, mais será possível prever com precisão quais lugares têm maior risco, o que pode salvar vidas.

    A NASA coleta essas informações em um banco de dados público chamado Cooperative Open Online Repository, ou COOLR, e usa isso para prever quando e onde ocorrerão deslizamentos de terra. Mas as pessoas tiveram que enviar manualmente as informações do deslizamento de terra ou procurar artigos e dados de notícias um por um, o que é bastante tedioso. Nossa ferramenta automatiza esse processo, concluindo em minutos o que antes demorava meses.

    Isso liberaria recursos para pesquisas mais importantes e também significaria que obteríamos mais dados, mais rapidamente, potencialmente melhorando a pesquisa em deslizamentos de terra em geral, bem como as previsões de deslizamento da NASA.

    Como funciona?

    Guiada pela BGC Engineering Inc. e pela NASA para nosso projeto de conclusão, nossa equipe desenvolveu uma ferramenta que varre o Reddit em busca de notícias sobre deslizamentos de terra em um determinado período de tempo e, em seguida, extrai informações relevantes.

    Primeiro, um modelo de computador descobre se o artigo é realmente sobre deslizamentos de terra, em vez de dizer, uma eleição onde alguém ganha "por um deslizamento de terra", ou como também descobrimos, artigos sobre Pokémon com técnicas de terra como "deslizamento de rochas".

    Em seguida, treinamos um modelo de processamento de linguagem natural em dados de deslizamento, ensinando-o a reconhecer as informações que queríamos de um artigo. Esse tipo de modelo pode entender a linguagem, incluindo a análise de frases. Então, daríamos um artigo de notícias e perguntávamos onde um deslizamento de terra poderia ter acontecido. O modelo predizia a resposta com base na linguagem envolvida, por exemplo, "O deslizamento de terra provavelmente aconteceu aqui, de acordo com esta frase", e informaríamos se estava correto ou não.

    Dessa forma, o computador aprende quais informações extrair de forma automática e precisa, incluindo quando ocorreu um deslizamento de terra e onde, o que o causou e quantas fatalidades ocorreram.

    Isso tudo acontece muito rapidamente:ele retorna o valor de um mês de artigos em cerca de 15 minutos, em comparação com percorrê-los manualmente para encontrar essas informações. Os dados podem então ser alimentados no COOLR. Isso nos levou cerca de dois meses para construir. A NASA está atualmente avaliando se a ferramenta pode ser executada como está ou precisa de alguns ajustes para usar.

    A ferramenta pode ser usada em outros sites de mídia social?

    Usamos o Reddit porque é gratuito acessar sua interface de programação de aplicativos (API). Por exemplo, a API do Twitter tem muitas restrições e é muito cara para acessar. Além disso, a quantidade de dados seria enorme.

    Queríamos começar pequeno e provar que funciona com o Reddit. Mas poderia ser expandido para plataformas e fontes maiores, desde que tenham artigos de notícias. Você pode até expandir a ferramenta para usá-la em outros desastres, como terremotos, usando a mesma metodologia treinando os modelos com conjuntos de dados semelhantes.

    Melhorar o modelo e adicionar mais fontes de onde os deslizamentos de terra podem ser extraídos além do Reddit ajudaria a NASA a ter mais pontos de dados, mais rapidamente. Vou ficar de olho nisso. + Explorar mais

    Pesquisadores atualizam nomenclatura internacional da geometria de deslizamento




    © Ciência https://pt.scienceaq.com