A análise de bilhões de palavras do Twitter revela como o inglês americano se desenvolve
p Crédito CC0:domínio público
p Linguistas e geógrafos analisaram 8,9 bilhões de palavras contidas em 980 milhões de tweets postados nos Estados Unidos entre 2013 e 2014 para identificar as regiões de onde as novas palavras tendem a se originar. p Liderado pelo Professor Jack Grieve, do Center for Corpus Research da University of Birmingham, os pesquisadores usaram tecnologia de computador avançada para analisar os tweets geocodificados, que revelaram a longitude e latitude precisas do usuário no momento da postagem.
p Eles rastrearam a origem de 54 palavras emergentes no inglês americano. Por exemplo, eles descobriram que a palavra 'baeless', que significa 'ser solteiro', originado de Deep South, enquanto a palavra 'mútuos', que é a abreviatura de 'amigos mútuos', originado da Costa Oeste.
p Dados geocodificados do Twitter permitiram que eles criassem mapas para essas 54 palavras, mostrando como as frases se espalharam pelo país ao longo do tempo.
p Aplicando técnicas computacionais modernas ao estudo da variação e mudança da linguagem, a equipe identificou o desenvolvimento de novas palavras em inglês americano moderno centrado em cinco regiões:a costa oeste, o Nordeste, o Atlântico Médio, o Deep South, e a Costa do Golfo.
p O professor Grieve comentou:"Esta é a primeira vez que uma amostra tão grande de palavras emergentes ou qualquer tipo de inovação linguística foi mapeada em um idioma. O Twitter é apenas uma variedade de idioma, mas dado que quase todas essas palavras são usadas na linguagem cotidiana, acreditamos que nossos resultados refletem a disseminação geral das palavras no inglês americano.
p "Nosso estudo fornece uma estrutura para pesquisas futuras, mostrando como a origem e a disseminação de palavras emergentes podem ser medidas e mapeadas. A lingüística está mudando de uma ciência social para uma ciência de dados, onde os linguistas estão cada vez mais analisando grandes quantidades de linguagem natural colhida online.
p "Isso nos permite buscar novas questões de pesquisa que teriam sido impossíveis de investigar apenas alguns anos atrás. Podemos analisar em detalhes como a linguagem muda em curtos períodos de tempo e entender os processos através dos quais as línguas evoluem - um dos as questões mais desafiadoras da ciência. "
p As descobertas dos pesquisadores também desafiam as teorias existentes sobre a disseminação de novas palavras. Eles mostram que novas palavras não se espalham simplesmente sem restrições de sua fonte, nem se espalham de uma grande cidade para a outra, conforme previsto por teorias desenvolvidas anteriormente para a disseminação de novas palavras, conhecidos como modelos de 'onda' e 'gravidade'.
p Em vez de, o estudo descobriu que a difusão de novas palavras é limitada por padrões culturais. Novas palavras tendem a se espalhar em regiões culturais, antes de chegar ao resto dos Estados Unidos. Ele também descobriu que o inglês afro-americano era uma importante fonte de inovação lexical no Twitter dos EUA.
p O professor Grieve está falando sobre a pesquisa da equipe na conferência New Ways of Analyzing Variation (NWAV) realizada na Universidade de Nova York de 18 a 21 de outubro. Ele se concentrará em como essas palavras se espalharam apenas na cidade de Nova York durante o período em questão, bem como ministrar um workshop sobre 'sociolinguística computacional'.