A conferência 2018 Dawn or Doom apresenta palestras de mais de três dezenas de membros do corpo docente Purdue e especialistas nacionais que representam quatro áreas - Máquinas:inteligência artificial, robótica, veículos autônomos e drones; Mente:efeitos da Internet e das redes sociais; Corpo:bioengenharia e design humano; e dados:Internet das coisas, privacidade e cibersegurança. Crédito:Purdue University
"Eu estou me sentindo doente." "Este videogame é DOENTE!" Para um computador, a palavra "doente" pode ter o mesmo significado nessas duas frases.
Mas um professor de Purdue está combinando o aprendizado de máquina com modelos de relações sociais e comportamento para ler nas entrelinhas do texto e capturar a intenção do autor de uma maneira mais profunda. A tecnologia pode ajudar a identificar preconceitos em postagens de mídia social e artigos de notícias, o melhor para julgar a validade da informação.
O processamento de linguagem natural tradicional envolve a localização de palavras-chave - por exemplo, a palavra "bom" normalmente indica uma opinião positiva. Isso funciona bem para certos aplicativos, mas não é útil quando o texto é ambíguo, por exemplo, se o autor pretendia que uma palavra ou frase fosse sarcástica ou irônica.
É aí que entra a abordagem do professor Dan Goldwasser de Purdue. Ele se concentra principalmente em eventos atuais e questões políticas, e analisa artigos de notícias e tweets de políticos para tentar determinar como o autor enquadra certas questões e qual é sua ideologia.
Goldwasser, um professor assistente de ciência da computação, falará sobre este trabalho na Dawn or Doom '18, Conferência anual de Purdue sobre os riscos e recompensas das tecnologias emergentes. Dawn or Doom será realizada no campus West Lafayette de Purdue na segunda e terça-feira (5 a 6 de novembro). A conferência, agora em seu quinto ano, é gratuito e aberto ao público.
Dawn or Doom está alinhada com a Campanha do Sesquicentenário dos Saltos Gigantes de Purdue e faz parte do tema do Festival de Ideias, Saltos gigantes na inteligência artificial, Algoritmos, e Automação:Equilibrando Humanidade e Tecnologia. O Festival de Idéias é a peça central da campanha e conecta palestrantes de renome mundial e a experiência da Purdue em uma conversa sobre os problemas e oportunidades mais críticos que o mundo enfrenta.
Em um projeto, Goldwasser está analisando postagens de funcionários políticos no Twitter. Os tweets podem ser uma forma de texto desafiadora para interpretar, porque são curtos e podem ser ambíguos. Como um exemplo, depois de um tiroteio em massa, a frase "pensamentos e orações" pode ser usada sinceramente para expressar simpatia pelas famílias das vítimas, mas também pode ser usado sarcasticamente como uma crítica à falta de ação do governo no controle de armas.
Goldwasser e sua equipe estão tentando entender como os políticos estruturam as questões ou eventos, e como essa estrutura esclarece sua posição sobre o assunto. Para fazer isso, ele está combinando a análise linguística com a modelagem de relações sociais e comportamento. As redes sociais podem fornecer informações sobre o significado do texto, porque se duas pessoas estão intimamente conectadas, eles provavelmente compartilham ideologias semelhantes. Comportamento, como quando um indivíduo publica nas redes sociais, pode prever quais problemas eles se preocupam. A combinação dos três modelos dá uma imagem mais completa da intenção do autor do que confiar apenas em qualquer um deles.
Em outro projeto, financiado pelo Google, Goldwasser está usando modelos de relacionamento social para tentar identificar preconceitos em fontes de notícias. Palavras-chave podem ser uma boa maneira de diferenciar ideologia para um pequeno conjunto de dados. Por exemplo, um artigo sobre um tiroteio em massa que enfoca a saúde mental do atirador tem mais probabilidade de ter um ponto de vista conservador, ao passo que um artigo que discute como a arma foi obtida tem mais probabilidade de ter uma visão liberal.
"O problema é que identificar manualmente os indicadores relevantes para cada evento é difícil de aumentar, "Goldwasser diz.
Em vez de, sua equipe está coletando vários artigos de notícias sobre o mesmo evento e construindo uma rede de pessoas que compartilham os artigos nas redes sociais. Com base na conexão da rede com indivíduos ou organizações com uma conotação política conhecida, a perspectiva do artigo pode ser inferida sem a necessidade de gerar manualmente as palavras-chave relevantes.