Um exemplo de tweets que inspiraram o estudo de pesquisa. Crédito:Zhang et al.
Ataques distribuídos de negação de serviço (DDoS), que são projetados para impedir que usuários legítimos acessem sistemas de rede específicos, tornaram-se cada vez mais comuns na última década. Esses ataques tornam serviços como o Facebook, Reddit e sites de banco online extremamente lentos ou impossíveis de usar por esgotar os recursos da rede ou do servidor (por exemplo, largura de banda, CPU e memória).
Pesquisadores de todo o mundo vêm tentando desenvolver técnicas para prevenir ataques DDoS ou intervir rapidamente para reduzir seus efeitos negativos. Uma etapa importante na neutralização de tais ataques é a coleta imediata de feedback dos usuários para determinar seu impacto e chegar a soluções direcionadas.
Com isso em mente, uma equipe de pesquisadores da Universidade de Maryland desenvolveu um modelo de aprendizado de máquina que pode ajudar a determinar a escala do impacto dos ataques DoS à medida que ocorrem, com base em tweets postados por usuários. Seu estudo, recentemente pré-publicado no arXiv, foi financiado por um subsídio de inovação cibernética UMBC-USNA.
“A pesquisa partiu da constatação de que quando há dificuldades de acesso aos serviços da rede, os clientes às vezes compartilham essas informações nas redes sociais, "Dr. Tim Oates, um dos pesquisadores que realizou o estudo, disse TechXplore. "Nosso principal objetivo era desenvolver um sistema que rastreia ataques de negação de serviço (DoS), analisando seus efeitos propagadores por meio de postagens de mídia social."
Começar com, Dr. Oates e seus colegas coletaram um conjunto curado de tweets sobre ataques DoS com base em uma linha do tempo histórica de ataques que ocorreram no passado. Olhando para esses tweets, em que os usuários descreveram os problemas que estavam enfrentando durante um ataque, os pesquisadores foram capazes de identificar "padrões de linguagem" (ou seja, palavras-chave relevantes). Em seguida, eles treinaram um classificador de árvore de decisão para detectar ataques DDoS com base nessas palavras-chave.
"Nossa hipótese é que os clientes afetados usam linguagem semelhante nas mídias sociais para descrever problemas durante um ataque DDoS, como o sistema ou produto lento ou engatinhando, "Chi Zhang, outro pesquisador envolvido no estudo disse ao TechXplore. "Assim, quando novos tweets são coletados (historicamente ou em tempo real), o modelo primeiro descobre os tópicos (um conjunto de palavras-chave que definem amplamente uma área de discussão) dos tweets coletados nessa janela de tempo. "
Subseqüentemente, o classificador desenvolvido pelo Dr. Oates, Zhang e seus colegas classificam os tweets com base no quanto as palavras-chave diferem dos padrões de linguagem observados em postagens de usuários durante ataques DDoS anteriores. Finalmente, o modelo usa o número de tweets relacionados a DDos detectados para calcular a escala do impacto de um ataque.
Quando os pesquisadores avaliaram seu modelo, eles descobriram que alcançou resultados semelhantes às abordagens supervisionadas de última geração para determinar a escala dos ataques DDoS. Uma grande vantagem de seu classificador, Contudo, é que é fracamente supervisionado, portanto, requer muito pouca rotulagem humana de dados de treinamento.
"Fomos capazes de desenvolver um modelo fracamente supervisionado para a detecção de novos eventos que tem um desempenho quase tão bom quanto os modelos supervisionados, "Zhang disse." Sua natureza fracamente supervisionada significa que apenas uma pequena quantidade de dados humanos rotulados é necessária, assim, economiza muitos recursos em termos de trabalho humano, já que pedir às pessoas para fazer anotações em potencialmente milhares de Tweets costuma ser muito caro. "
No futuro, seu modelo fracamente supervisionado pode ajudar a determinar a escala de ataques DDoS de forma mais rápida e eficaz, exclusivamente com base nos dados do Twitter. Ele também pode ser adaptado e aplicado a outras tarefas que podem se beneficiar da análise de tweets do usuário em tempo real.
Em seus próximos estudos, os pesquisadores planejam desenvolver ainda mais seu modelo para analisar tweets escritos em outras línguas. Eventualmente, eles também gostariam de mudar sua camada de classificação para testar seu desempenho na determinação da escala de impacto de outros tipos de eventos, como surtos de doenças (por exemplo, Ebola).
“Percebemos que as pessoas têm muitas maneiras de descrever problemas no Twitter, "Ashwinkumar Ganesan, outro pesquisador que realizou o estudo, disse TechXplore. "Portanto, há uma necessidade de construir um cache maior de tweets e melhores modelos que lidem com essa variação na linguagem. Além disso, os ataques não se restringem a alvos no mundo de língua inglesa, portanto, projetar o sistema para que ele possa ser escalado para outras linguagens também é muito importante. "
© 2019 Science X Network