p A árvore da risada. Esta árvore de grafia para versões alongadas da palavra 'ha' mostra muitas das diferentes maneiras como essas palavras são soletradas à medida que são alongadas. Os padrões da árvore representam a grafia das palavras, com o 'h' inicial na raiz, e as letras seguintes ramificando à direita para um 'a' e à esquerda para um 'h'. Caminhos mais grossos representam padrões mais dominantes, com muitas palavras parando em um nó interno após algumas ramificações. Alguns dos padrões mais longos que atingem um nó terminal são anotados com estrelas. O gráfico inserido mostra a frequência com que diferentes versões alongadas de 'ha' são baseadas em quanto tempo são alongadas. Alguns pontos são anotados com exemplos de versões esticadas desse comprimento, mas o ponto representa todas as versões alongadas desse comprimento. Os pontos para um número par de caracteres tendem a ser maiores por causa da tendência de alternar perfeitamente 'h' e 'a' como em 'hahaha ...'. Crédito:Gray et al, 2020
p Uma investigação das mensagens do Twitter revela novos insights e ferramentas para estudar como as pessoas usam palavras complicadas, como "duuuuude, "" heyyyyy, "ou" noooooooo. "Tyler Gray e colegas da Universidade de Vermont em Burlington apresentam essas descobertas no jornal de acesso aberto
PLOS ONE em 27 de maio, 2020. p Na linguagem falada e escrita, palavras esticadas podem modificar o significado de uma palavra. Por exemplo, "suuuuure" pode implicar sarcasmo, enquanto "yeeessss" pode indicar entusiasmo. Palavras esticadas são raras na escrita formal, mas a ascensão das mídias sociais abriu novas oportunidades para estudá-los.
p Gray e seus colegas concluíram agora o estudo mais abrangente até agora sobre palavras "extensíveis" nas redes sociais. Eles desenvolveram um novo, estratégia mais completa para identificar palavras esticadas em tweets e usado para analisar um conjunto de dados selecionado aleatoriamente de cerca de 10 por cento de todos os tweets gerados entre setembro de 2008 e dezembro de 2016 - totalizando cerca de 100 bilhões de tweets.
p Os pesquisadores identificaram milhares de palavras "extensíveis" nos tweets, incluindo "ha" (por exemplo, "hahaha" ou "haaahaha"), "incrível" (por exemplo, "awesssssommmmmeeeeee") e "objetivo) (por exemplo, ggggoooooaaaaallllll).
p Eles também identificaram duas maneiras principais de medir as características das palavras extensíveis:equilíbrio e alongamento. O equilíbrio se refere ao grau em que letras diferentes tendem a se repetir. Por exemplo, "ha" tem um alto grau de equilíbrio porque quando é esticado, o "h" e o "a" tendem a se repetir quase igualmente. "Meta" é menos equilibrada, com "o" repetido mais do que qualquer outra letra da palavra.
p Esticar se refere a quanto tempo uma palavra tende a ser esticada. Por exemplo, palavras curtas ou sons como "ha" têm um alto grau de extensão porque as pessoas costumam repeti-los muitas vezes (por exemplo, "hahahahahahahaha"). Enquanto isso, palavras regulares como "infinito" têm extensão menor, frequentemente com apenas uma letra repetida:"infinitoaaa".
p Para esta análise, os pesquisadores desenvolveram várias ferramentas e métodos que podem ser usados em pesquisas futuras de palavras extensíveis, como investigações de erros de digitação e de ortografia. As ferramentas também podem ser aplicadas para melhorar o processamento de linguagem natural, motores de busca, e filtros de spam
p Os autores acrescentam:"Conseguimos coletar e contar de forma abrangente palavras estendidas como 'gooooooaaaalll' e 'hahahaha', e mapeá-los entre as duas dimensões de elasticidade geral e equilíbrio de alongamento, ao desenvolver novas ferramentas que também ajudarão em seu estudo lingüístico contínuo, e em outras áreas, como processamento de linguagem, aprimorando dicionários, melhorando os mecanismos de pesquisa, analisando a construção de sequências, e mais."