• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Outros
    Como a linguística computacional ajuda a entender como a linguagem funciona
    p Visão bidimensional da mudança no significado de três palavras em inglês, retirado de Hamilton et al. (2016). Crédito:upf

    p A semântica distributiva obtém representações do significado das palavras processando milhares de textos e extraindo generalizações usando algoritmos computacionais. Apesar da popularidade da semântica distributiva em campos como linguística computacional e ciência cognitiva, seu impacto na lingüística teórica tem sido muito limitado. p Pesquisa de Gemma Boleda, chefe do grupo de pesquisa em Linguística Computacional e Teoria da Linguagem (COLT) e professor de pesquisa do ICREA no Departamento de Tradução e Ciências da Linguagem da UPF, publicado no jornal Revisão Anual da Lingüística , fornece uma revisão crítica dos estudos abundantes disponíveis sobre semântica distributiva, colocando ênfase especial nos resultados que são relevantes para a lingüística teórica. Especificamente, existem três áreas:mudança semântica, polissemia e composição, e a interface de gramática-semântica.

    p A pesquisa de Gemma Boleda busca conectar abordagens teóricas e computacionais para avançar no conhecimento coletivo sobre o funcionamento da linguagem. Um dos métodos que ela pesquisou extensivamente é a semântica distributiva, que permite obter representações de palavras automaticamente. Essas representações demonstraram refletir propriedades linguísticas significativas, por exemplo, como duas palavras são semelhantes:uma pessoa dirá que "cachorro" e "cachorrinho" são muito semelhantes, e, no entanto, "cão" e "democracia" dificilmente são semelhantes; a semântica distributiva dirá o mesmo, graças ao fato de que induz propriedades linguísticas baseadas em textos escritos por pessoas. Portanto, a semântica distributiva fornece representações radicalmente empíricas.

    p A semântica distributiva permite analisar o uso das palavras e a evolução do seu significado

    p A semântica distributiva fornece um atrativo, quadro complementar a outro, métodos mais tradicionais, não apenas porque é radicalmente empírico, mas também porque fornece representações multidimensionais:duas palavras podem ser comparadas em uma dimensão de significado ("pizza" e "massa" são tipos de alimentos), ou em outro ("pizza" e "roda" são redondos). Para representar todos os aspectos do significado, são necessárias representações multidimensionais. A semântica distributiva pode capturar os usos comuns de duas palavras, bem como seus fatores de diferenciação.

    p Uma das aplicações importantes da semântica distributiva em linguística teórica é a detecção de mudanças no significado. Se os dados de idioma de diferentes períodos forem processados, como livros em inglês de 1900, 1950 e 1990, a semântica distributiva pode ser usada para detectar automaticamente a mudança de significado de algumas palavras. Por exemplo, a palavra "gay" em inglês no início do século passado significava "feliz" e tem sido cada vez mais usada para significar "homossexual".

    p Aspectos da pesquisa em semântica distributiva que contribuem para a teoria da linguagem

    p A partir da análise das obras estudadas, Boleda conclui que há evidências suficientes para que os resultados sólidos da semântica distributiva sejam importados diretamente para a pesquisa em lingüística teórica.

    p "Existem pelo menos quatro aspectos da pesquisa em semântica distributiva que podem contribuir para a teoria da linguagem. O primeiro aspecto é exploratório:as representações distribucionais podem ser usadas para explorar dados em grande escala, por exemplo, examinando a semelhança de palavras. O segundo é como uma ferramenta para identificar casos específicos de fenômenos linguísticos. Por exemplo, podem ser identificadas palavras cujos significados mudaram ao comparar as representações obtidas em textos de diferentes períodos. O terceiro é como uma bancada de teste:avaliando diferentes hipóteses linguísticas em termos de distribuição. O quarto e mais difícil é a descoberta de novos fenômenos linguísticos ou tendências teóricas relevantes nos dados, "explica a autora em seu trabalho.


    © Ciência https://pt.scienceaq.com