Figura 1:Recursos derivados de indicadores são alimentados a um modelo que gera previsões junto com intervalos de confiança. Crédito:IBM
Governos de todo o mundo se reuniram em Marrakesh em dezembro passado para ratificar um pacto para melhorar a cooperação na migração internacional. Entre outros objetivos, o Global Compact for Migration busca usar “dados precisos e desagregados como base para políticas baseadas em evidências”. Como as tecnologias de aprendizado de máquina podem ajudar a polarizar profundamente as questões sociais, como a migração?
No início de 2018, com o suporte da IBM Corporate Citizenship e do Ministério Dinamarquês de Relações Exteriores, A IBM e o Conselho de Refugiados Dinamarquês (DRC) embarcaram em uma parceria voltada diretamente para a necessidade de entender melhor os impulsionadores da migração e orientações políticas baseadas em evidências para uma série de partes interessadas. No recente keynote da THINK Copenhagen, o Secretário-Geral da RDC, Christian Friis Bach, apresentou os primeiros resultados deste esforço.
Se pudermos prever os fluxos de migração e refugiados, poderemos prevenir e melhorar a proteção das pessoas em trânsito. Excelente parceria com @IBM em modelagem preditiva. Apresentou os primeiros resultados em # THINK2018CPH! pic.twitter.com/x1JDyI8s6L
- Christian Friis Bach (@christianfbach) 7 de novembro 2018
Nesta postagem, Percorrerei o desenvolvimento de um sistema de aprendizado de máquina que fornece previsões estratégicas de migração mista junto com análise de cenário. A migração mista refere-se a movimentos transfronteiriços de pessoas que são motivadas por uma multiplicidade de fatores para se mover, incluindo refugiados que fogem de perseguições e conflitos, vítimas de tráfico, e pessoas que buscam melhores vidas e oportunidades. Essas populações têm uma variedade de status legais, alguns dos quais não estão refletidos nas estatísticas oficiais do governo.
Compreender a dinâmica e os motivadores da migração é inerentemente complexo. As circunstâncias variam de pessoa para pessoa. A pergunta "por que você decidiu se mudar?" não é fácil para as pessoas responderem. Contudo, na medida em que as decisões individuais refletem fatores sociais estruturais, a dinâmica pode ser parcialmente explicada por medidas agregadas. Por exemplo, Pode-se esperar que os impulsionadores econômicos do movimento estejam relacionados às oportunidades de emprego e, portanto, aos indicadores macro de emprego. Esses desafios são agravados pela disponibilidade de dados e cobertura de indicadores específicos.
O sistema de previsão
Começamos aproveitando o programa de monitoramento 4MI executado pela RDC, por meio do qual milhares de migrantes em movimento são entrevistados. A análise dos dados da pesquisa revela grupos de alto nível de motivadores para a migração. Esses grupos variaram de falta de direitos e outros serviços sociais, à necessidade econômica e ao conflito. Esses drivers são então mapeados para indicadores quantitativos. Os recursos derivados desses indicadores são alimentados a um modelo que gera previsões juntamente com intervalos de confiança (Figura 1). Além disso, o sistema também gera contexto para cada previsão, mostrando fatores específicos que contribuíram para a previsão.
Usando esses indicadores, desenvolvemos um modelo de conjunto para fazer previsões estratégicas anualmente para fluxos bilaterais em volumes de migração mista anualmente. Nossas avaliações mostram que as taxas de erro estão dentro de alguns milhares de pessoas por ano, mesmo para países com condições voláteis. O sistema permite ainda a análise de cenários, onde mudanças relativas nos fatores de influência podem ser modeladas para fazer previsões ajustadas.
Dinâmicas contra-intuitivas interessantes emergem dessa análise. Por exemplo, as taxas de desemprego na Etiópia estão acima da média em comparação com os países subsaarianos. Um grande número de etíopes viaja para a Arábia Saudita a trabalho. Aumentos nas taxas de emprego para o quinto melhor lugar da região resultarão em maior migração para o Reino Unido (aumento de 2%), Suécia (aumento de 2%) e Arábia Saudita (aumento de 8%). Isso reflete uma maior capacidade e meios dos etíopes de atender às suas aspirações no exterior. Se o desemprego aumentar para os piores níveis, o modelo prevê um aumento da migração para a África do Sul (aumento de três por cento) e Arábia Saudita (aumento de quatro por cento), com destinos na UE em grande parte invariante para aumentos no desemprego.
Figura 2:Matriz de correlação para todos os recursos considerados no modelo (sem efeitos temporais). Crédito:IBM
Essa análise quantitativa detalhada não estava disponível anteriormente para as partes interessadas que precisam formular respostas de políticas.
Inferência causal
O sistema de previsão descrito acima é puramente orientado por dados, onde contamos com o modelo para derivar relacionamentos entre todas as variáveis. Alternativamente, se buscarmos explorar a experiência no assunto e incluir percepções específicas no sistema, poderíamos adotar a abordagem de modelos gráficos probabilísticos.
Em um workshop realizado na IBM Research - Irlanda, Especialistas no assunto do Centro de Migração Mista em Genebra e na RDC elaboraram a rede "espaguete" mostrando como eles esperam que os clusters de indicadores sejam causalmente ligados. Usando isso como entrada, em seguida, combinamos a opinião dos especialistas com os dados. Usamos uma técnica chamada aprendizagem de estrutura para desenvolver tal rede.
A previsão usando tais redes normalmente não tem um desempenho tão bom quanto as abordagens puramente baseadas em dados apresentadas acima; no entanto, eles ajudam na análise de cenários e na análise de políticas.
Qual é o próximo?
Figura 3:(esquerda) rede causal desenhada por especialistas e (direita) rede aprendida com base na opinião de especialistas e evidências baseadas em dados para toda a África Subsaariana. Crédito:IBM
Esses são os primeiros passos em direção a um futuro em que os formuladores de políticas tenham acesso instantâneo às evidências quando e onde forem necessárias e onde relações complexas possam ser exploradas facilmente para fornecer mais insights que conduzam a melhores políticas.
Por enquanto, continuamos a melhorar o sistema e a reunir feedback do usuário com especialistas no assunto dentro da RDC. Após uma validação mais detalhada, procuraremos expandir o escopo geográfico e as capacidades de análise de cenário.
Esta história foi republicada por cortesia da IBM Research. Leia a história original aqui.