Crédito CC0:domínio público
Não é nenhuma surpresa que os dados do consumidor sejam continuamente coletados por várias organizações, incluindo governos locais, agências de marketing e empresas de mídia social. Essas organizações garantem o anonimato e a confidencialidade ao coletar esses dados, Contudo, as leis de privacidade de dados existentes não garantem que não ocorrerão violações de dados. De acordo com um relatório recente, mais de 2, 000 violações de dados confirmadas ocorridas apenas em 2019, com 34% dos executados por atores internos, como funcionários. Para adicionar a isso, agências municipais e estaduais coletam dados confidenciais que são obrigados por lei a compartilhar com o público - cortesia de movimentos de dados abertos e da Lei de Liberdade de Informação.
As leis de privacidade de dados exigem criptografia e, em alguns casos, transformar os dados originais em "dados protegidos" antes de serem liberados para terceiros. Mas para pesquisadores como Matthew Schneider, Ph.D., professor assistente de Ciências da Decisão e Sistemas de Informação de Gestão na LeBow College of Business da Drexel University, isso não é adequado.
"A criptografia definitivamente ajuda, mas não evita a violação de dados, "disse ele." É semelhante a proteger a senha do seu e-mail. Um ator interno com acesso à chave de criptografia pode facilmente causar uma violação de dados. É mais conservador, do ponto de vista do risco, presumir que todos os dados serão eventualmente divulgados e devem ser transformados antes de serem compartilhados em qualquer lugar da organização. "
Em um artigo recente publicado no Journal of Marketing Analytics , Schneider e Dawn Iacobucci, Ph.D., da Vanderbilt University, propôs uma nova metodologia que altera permanentemente os conjuntos de dados de pesquisa para proteger a privacidade dos consumidores - quando os dados são compartilhados - enquanto ainda preserva um nível de precisão razoável para esses conjuntos de dados.
De acordo com os autores, os dados da pesquisa são freqüentemente mantidos dentro das organizações e usados para finalidades além do motivo original para a coleta dos dados. "Bancos de dados e informações de clientes se tornaram um ativo contemporâneo que torna uma empresa atraente para outra ao formar alianças, "Schneider disse." Mesmo as empresas com altos padrões de segurança de dados podem encontrar um desafio para proteger a privacidade dos dados do consumidor. "
Outro menos comum, mas muito real, ameaça, de acordo com os autores, são casos em que os funcionários pegaram ilegalmente dados de suas antigas empresas para uma posição em um novo empregador - por motivos que vão desde obter uma impressão favorável com a nova empresa, prejudicar a antiga empresa, até ter que fornecer os dados como condição da oferta de trabalho.
Para Schneider, a solução para cumprir as promessas de privacidade de dados acaba sendo tecnológica.
"Os dados da pesquisa são cada vez mais usados para análises no nível do entrevistado, como na ligação a outros conjuntos de dados proprietários, e as promessas de privacidade podem não ser garantidas na miríade de usos subsequentes dos dados, "disse Schneider." A confidencialidade não garante o anonimato. São necessárias cerca de três ou quatro perguntas cuidadosamente colocadas em uma pesquisa para identificar alguém de maneira única. "
No papel, os autores analisaram um conjunto de dados de pesquisa que foi coletado em 2015 pela cidade de Austin, Texas e lançado ao público na sequência de um movimento de dados abertos. Outras cidades têm movimentos semelhantes, incluindo Nova York e Filadélfia.
"Existem muitos riscos de privacidade em dados abertos, uma vez que eles não protegem a privacidade tão bem quanto o governo federal, que tem grande orçamento e recursos para contratar estatísticos, economistas ou cientistas da computação para resolver este problema tecnológico, "disse Schneider." A proteção geralmente depende de como os dados são usados. "
A cidade de Austin administrou uma pesquisa a 2, 614 asiático-americanos que vivem na cidade para explorar as necessidades de saúde e serviços de uma das populações de crescimento mais rápido da cidade com o objetivo de criar níveis mais elevados de envolvimento da comunidade, políticas e identificar recursos para atender às necessidades da comunidade asiático-americana. Funcionários em Austin postaram seus conjuntos de dados, como requerido, para torná-los prontamente disponíveis para os usuários.
Em um conjunto de dados de pesquisa, cada entrevistado foi questionado sobre sua origem étnica, que teve 32 categorias; era, que teve 77 categorias; Código postal, que teve 61 categorias; e gênero.
"Quase todos são identificáveis com essas quatro variáveis - alguns mais do que outros, "disse Schneider." Depois de identificá-los, esta pesquisa revelou outras respostas sensíveis, como status de emprego, Filiação Religiosa, renda familiar, acessibilidade de habitação e muitas questões de atitude. "
De forma similar, A cidade de Nova York experimentou um problema de dados abertos com a Comissão de Táxis e Limusines da cidade de Nova York, onde 124 milhões de rotas de direção podiam ser rastreadas até o endereço residencial de um motorista.
Um grande desafio ao considerar metodologias para alterar os dados dos participantes de forma eficaz é fazer isso de uma forma que não mude muito a precisão dos resultados da pesquisa. A metodologia proposta pelos autores, foi desenvolvido com base em uma técnica encontrada em aplicativos de sequenciamento genômico que foi capaz de disfarçar a identidade dos consumidores, mantendo a precisão dos insights em 5%.
"Nosso método basicamente 'embaralha' os dados demográficos em um conjunto de dados de pesquisa, "disse Schneider." Mas, ao contrário dos métodos anteriores, o nosso só embaralha os dados quando mantém as correlações entre variáveis importantes que são essenciais para os analistas. Os dados protegidos são simulados no nível do consumidor, mas ainda são valiosos para o usuário final. Se este conjunto de dados vazou, então, apenas os insights da organização seriam conhecidos. "
O papel, "Protegendo os dados da pesquisa no nível do consumidor, "foi publicado no Journal of Marketing Analytics e está disponível neste link. Detalhes sobre a nova metodologia estão incluídos no artigo.