Amostra de instalações para suínos (esquerda) e aves (direita), com a imagem original (parte superior) e um mapa de calor da forma como os modelos algorítmicos processaram a imagem (parte inferior). As áreas vermelhas mostram onde o modelo detectou a probabilidade de localização das instalações. Crédito:National Agriculture Imagery Program / Departamento de Agricultura dos EUA
Como localizar fazendas de animais potencialmente poluentes tem sido um problema para os reguladores ambientais. Agora, Estudiosos de Stanford mostram como um algoritmo de leitura de mapas pode ajudar os reguladores a identificar instalações com mais eficiência do que nunca.
Professor de Direito Daniel Ho, junto com Ph.D. estudante Cassandra Handan-Nader, descobriram uma maneira de aprendizado de máquina - ensinando um computador a identificar e analisar padrões em dados - para localizar com eficiência as operações industriais com animais e ajudar os reguladores a determinar o risco ambiental de cada instalação. As descobertas dos pesquisadores devem ser publicadas em 8 de abril em Sustentabilidade da Natureza .
"Nosso trabalho mostra como uma agência governamental pode alavancar avanços rápidos na visão computacional para proteger a água potável de forma mais eficiente, "disse Ho, o professor de direito William Benjamin Scott e Luna M. Scott, e um membro sênior do Instituto de Stanford para Pesquisa de Política Econômica.
Um problema básico, com consequências complexas
De acordo com a Agência de Proteção Ambiental (EPA), a agricultura é o principal contribuinte de poluentes para o abastecimento de água do país, com poluição substancial que se acredita ser proveniente de grande escala, operações concentradas de alimentação animal, também conhecido como CAFOs.
Mas os esforços de monitoramento ambiental foram bloqueados por um problema básico:os reguladores não têm uma maneira sistemática de determinar onde os CAFOs estão localizados, Ho disse. O Escritório de Responsabilidade do Governo dos Estados Unidos informa que nenhuma agência federal possui informações confiáveis sobre o número, tamanho e localização das operações agrícolas em grande escala.
Embora a Lei da Água Limpa exija alguma autorização federal, aplica-se apenas a operações que realmente descarregam poluentes nas hidrovias dos EUA - não a instalações que possam causar contaminação - intencionalmente ou não, Ho disse.
Sem uma lista definida para a qual recorrer, esforços para monitorar instalações potencialmente poluentes são difíceis e, em alguns casos, impossível.
"Este déficit de informações sufoca a aplicação das leis ambientais dos Estados Unidos, "Ho disse.
Alguns grupos ambientais e de interesse público tentaram identificar as próprias instalações, digitalizando o terreno manualmente ou examinando fotos aéreas, mas eles descobriram que é uma tarefa incrivelmente demorada. Um grupo ambientalista levou mais de três anos para olhar as imagens de apenas um estado. Esforços de monitoramento como esses nunca poderiam ser escalonados ou feitos em tempo real, Ho disse.
Usando big data para preencher as lacunas
Ho e Handan-Nader, em seguida, um bolsista de pesquisa na Stanford Law School e agora buscando um doutorado em ciências políticas, voltaram sua atenção para um tipo de inteligência artificial chamado aprendizado profundo. Um subconjunto do aprendizado de máquina, algoritmos de aprendizado profundo revolucionaram a capacidade de detectar objetos complexos em imagens.
Com a ajuda de várias ferramentas de código aberto e uma equipe de alunos de economia e ciência da computação para auxiliar na análise de dados, Ho e Handan-Nader conseguiram retreinar um modelo de reconhecimento de imagem existente para reconhecer instalações de animais em grande escala usando informações coletadas por dois grupos sem fins lucrativos e imagens de satélite publicamente disponíveis do National Agricultural Imagery Program (NAIP) do USDA. Os pesquisadores se concentraram em tentar identificar as instalações avícolas na Carolina do Norte, porque a maioria não é obrigada a obter licenças, Ho disse.
O modelo, já experiente em digitalizar imagens com base em um enorme corpus de imagens digitais, foi treinado novamente para pegar pistas semelhantes de que as organizações ambientais vinham monitorando manualmente. Por exemplo, As fazendas de suínos eram identificáveis por celeiros retangulares compactos confinados por grandes fossas de esterco líquido, e aves em celeiros retangulares longos e armazenamento de esterco seco. Ao se concentrar nessas características proeminentes, o modelo também foi capaz de fornecer estimativas de tamanho para as instalações.
Os pesquisadores descobriram que seu algoritmo foi capaz de identificar 15 por cento mais granjas avícolas do que o que foi originalmente encontrado por meio de esforços manuais. E porque sua abordagem pode escalar ao longo de anos de imagens NAIP, seu algoritmo foi capaz de estimar com precisão o crescimento nas proximidades de uma fábrica de rações construída recentemente.
"O modelo detectou 93 por cento de todos os CAFOs de aves na área, e foi 97 por cento preciso ao determinar quais apareceram após a abertura da fábrica de rações, "Handan-Nader e Ho escrevem no jornal.
Complementar, Abordagem interdisciplinar
Ho e Handan-Nader esperam que o aprendizado de máquina possa complementar os esforços de monitoramento humano de agências ambientais e grupos de interesse.
"Agora, todos os tipos de pesquisadores com capacidade de programação podem aproveitar essas ferramentas de código aberto para novos aplicativos, "disse Handan-Nader, um co-autor no artigo. "Você pode se colocar sobre os ombros de gigantes e expandir o que os especialistas nesse tipo de técnicas de aprendizado de máquina fizeram."
Usar o aprendizado de máquina para tarefas rotineiras pode liberar as pessoas para tarefas mais complexas, como determinar os possíveis riscos ambientais de uma instalação, Handan-Nader disse. Os pesquisadores estimaram que seu algoritmo poderia capturar 95 por cento das instalações de grande escala existentes usando menos de 10 por cento dos recursos necessários para um censo manual.
Ho e Handan-Nader esperam que, eventualmente, avanços em imagens aéreas permitirão que um modelo de computador detecte a descarga real em cursos de água.
"Cada vez mais, problemas sociais complexos não podem ser resolvidos apenas a partir dos limites de uma disciplina estreita, e a capacidade de alavancar a inovação entre os campus pode ajudar a resolver os principais problemas jurídicos e de políticas públicas, "Ho disse.