Uma nova ferramenta de IA criada para ajudar a identificar certos tipos de abuso de substâncias com base nas postagens de um jovem sem-teto no Facebook poderia fornecer aos abrigos de moradores informações vitais para incorporar ao plano de gerenciamento de caso de cada indivíduo. Crédito CC0:domínio público
Se você for como o usuário comum da Internet, você provavelmente não gastou as 244 horas estimadas que levaria para ler todas as políticas de privacidade de todos os sites visitados no ano passado. É exatamente por isso que uma equipe liderada pela Carnegie Mellon University acaba de lançar um site interativo com o objetivo de ajudar os usuários a entender sua privacidade na web.
"Combinamos crowdsourcing, aprendizado de máquina, e técnicas de processamento de linguagem natural para extrair anotações das políticas de privacidade que ajudam a responder às principais questões com as quais os usuários costumam se preocupar, "diz Norman Sadeh, o investigador principal do Projeto de Política de Privacidade Usável, um professor da Escola de Ciência da Computação no Carnegie Mellon's Institute for Software Research, e um membro do corpo docente do CyLab Security and Privacy Institute.
A equipe usou algoritmos de inteligência artificial (IA) para rastrear 7, 000 das políticas de privacidade dos sites mais populares e identifique aqueles que contêm linguagem sobre coleta e uso de dados, compartilhamento de terceiros, retenção de dados, e escolha do usuário, entre outras questões de privacidade. O site do projeto permite que as pessoas naveguem pelas políticas de privacidade anotadas por máquina e pule diretamente para as declarações de interesse delas, incluindo aqueles frequentemente enterrados profundamente no texto das políticas de privacidade.
A IA dos pesquisadores também avaliou a legibilidade de cada política de privacidade. Por exemplo, A ABC News liderou o ranking com uma política de privacidade escrita em nível de leitura de "Pós-Graduação" (Grau 26). Descobriu-se que a política de privacidade do Google foi redigida em nível de leitura universitária (14ª série), iguais aos do YouTube, Reddit e Amazon. A política de privacidade do Facebook foi considerada um pouco mais amigável, escrito no nível de leitura da 12ª série.
"Descobrimos que o texto das políticas costuma ser vago e ambíguo, e as pessoas tendem a se esforçar para interpretar e determinar quais informações pessoais são coletadas, como é usado, e com quais outras entidades é compartilhado, "Sadeh diz." Do ponto de vista jurídico, isso é problemático. "
Para "treinar" sua IA, a equipe pediu a um grupo de estudantes de direito que anotasse manualmente 115 políticas de privacidade. A IA aprendeu com essas anotações e, em seguida, rastreou as políticas de mais de 7, 000 dos sites mais populares da web.
"Embora não seja perfeito, nossas técnicas são capazes de extrair automaticamente um grande número de declarações de privacidade do texto das políticas de privacidade, "diz Sadeh." Eventualmente, o objetivo é disponibilizar essas informações aos usuários por meio de um plug-in de navegador simples e intuitivo que forneceria aos usuários resumos personalizados destacando os problemas com os quais eles provavelmente se preocupam. "