• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Uma abordagem de aprendizado profundo para identificar a localização dos usuários do Twitter durante emergências
    p Arquitetura geral da Rede Neural Convolucional (CNN). Crédito:Singh e Kumar.

    p Pesquisadores do Instituto Nacional de Tecnologia de Patna, na Índia, desenvolveram recentemente uma ferramenta para identificar a localização geográfica de emergências e desastres, bem como das pessoas nelas envolvidas. A abordagem deles, delineado em um artigo no Jornal Internacional de Redução de Risco de Desastres , extrai informações de localização de tweets usando um modelo baseado em rede neural convolucional (CNN). p "Durante emergências, as informações de localização geográfica dos eventos, bem como dos usuários afetados, são de vital importância, "Jyoti Prakash Singh, um dos pesquisadores que realizou o estudo, disse TechXplore. "Identificar esta localização geográfica é uma tarefa desafiadora, já que os campos de localização disponíveis, como localização do usuário e nome do local dos tweets, não são confiáveis. A localização GPS precisa dos usuários é rara em tweets, e também às vezes incorreto em termos de informação espaço-temporal. "

    p Pessoas afetadas por desastres naturais ou outras emergências costumam compartilhar sua localização nas redes sociais, pedindo ajuda. Esta informação pode ajudar as unidades de resposta e as autoridades locais a detectar eventos precocemente, localize as vítimas e ajude-as. Contudo, extrair dados relacionados à localização de tweets é uma tarefa muito desafiadora, já que muitas vezes são escritos em inglês não padrão e contêm erros gramaticais, erros ortográficos ou abreviações.

    p "É quase impossível para os operadores humanos rastrearem os tuítes passarem por cada tuíte e encontrar as informações de localização mencionadas neles, "Singh disse." Isso nos motivou a desenvolver uma solução para extrair automaticamente informações de localização de tweets pedindo ajuda. Nesse trabalho, utilizamos o aprendizado profundo para determinar se um tweet contém nomes de locais e destacar essas palavras. "

    p Singh e seu colega Abhivan Kumar desenvolveram um modelo da CNN que pode identificar a localização dos usuários por meio da análise do conteúdo de seus tweets. Eles escolheram essa abordagem específica de aprendizado profundo porque ela pode aprender automaticamente a melhor representação dos dados de entrada e usar isso para identificar referências de localização.

    p "Usamos uma técnica de incorporação de palavras para representar os tweets na camada de entrada da CNN e as referências de localização presentes no tweet são representadas na camada de saída na forma de um vetor zero-um, "Singh explicou." As palavras de localização são codificadas como 1 e as palavras de não localização são codificadas como 0. Usamos várias combinações de 2 gramas, 3 gramas, 4 gramas, e filtros de 5 gramas para extrair recursos do tweet. Depois de treinar para o modelo para as 100 épocas, é capaz de prever as referências de localização mencionadas no tweet com uma precisão impressionante. "

    p Em uma avaliação inicial, o modelo da CNN desenvolvido por Singh e Kumar foi capaz de extrair todas as palavras relacionadas à localização de tweets com alta precisão, mesmo quando o texto de um tweet era barulhento. Os pesquisadores testaram seu modelo em tweets que não foram pré-processados ​​e continham erros gramaticais, erros de digitação, abreviações, e outros fatores de confusão.

    p "A principal implicação prática do nosso trabalho é que ele pode ser facilmente canalizado, usando modelos de detecção de eventos, "Singh disse." Os modelos de detecção de eventos podem identificar tweets relacionados ao desastre e nosso modelo pode extrair a localização das vítimas afetadas por esse desastre. "

    p No futuro, o modelo da CNN desenvolvido pelos pesquisadores pode ajudar a localizar rapidamente eventos de emergência e pessoas que precisam de atendimento urgente. A mesma abordagem também pode ser aplicada a distúrbios civis, publicidade direcionada, observando o comportamento humano regional, gerenciamento de tráfego rodoviário em tempo real e outros serviços baseados em localização.

    p "Neste trabalho, consideramos apenas tweets em inglês, mas, durante uma crise, os usuários também postam tweets em seus idiomas regionais, "Singh disse." Portanto, estamos trabalhando em um modelo que aborda essa limitação multilíngue, ao mesmo tempo, tentando desenvolver um modelo semissupervisionado para reduzir o problema de rotulagem de dados. " p © 2018 Science X Network




    © Ciência https://pt.scienceaq.com