Legenda:Imagens de satélite de fluxos de rios para o Oceano Atlântico na esteira do furacão Florença mostram água descolorida por detritos e poluentes. Crédito:NASA
À medida que o furacão Florence avançava pela Carolina do Norte, liberou o que educadamente pode ser chamado de tempestade de excrementos. Grandes poças de esterco de criação de suínos levaram um ensopado de bactérias perigosas e metais pesados para os cursos d'água próximos.
Uma supervisão mais eficiente pode ter evitado alguns dos piores efeitos, mas mesmo nos melhores momentos, os reguladores ambientais estaduais e federais estão sobrecarregados e subfinanciados. A ajuda está à mão, Contudo, na forma de aprendizado de máquina - treinamento de computadores para detectar automaticamente padrões nos dados - de acordo com pesquisadores de Stanford.
Seu estudo, publicado em Sustentabilidade da Natureza , descobre que as técnicas de aprendizado de máquina podem detectar duas a sete vezes mais infrações do que as abordagens atuais, e sugere aplicações de longo alcance para investimentos públicos.
"Especialmente em uma era de orçamentos decrescentes, identificar maneiras econômicas de proteger a saúde pública e o meio ambiente é fundamental, "disse a co-autora do estudo, Elinor Benami, um estudante de pós-graduação no Programa Interdisciplinar de Emmett sobre Meio Ambiente e Recursos (E-IPER) na Escola da Terra de Stanford, Energia e Ciências Ambientais.
Otimizando recursos
Assim como o IRS não pode auditar todos os contribuintes, a maioria das agências governamentais deve constantemente tomar decisões sobre como alocar recursos. Os métodos de aprendizado de máquina podem ajudar a otimizar esse processo, prevendo onde os fundos podem render mais benefícios. Os pesquisadores se concentraram na Lei da Água Limpa, sob o qual a Agência de Proteção Ambiental dos EUA e os governos estaduais são responsáveis por regulamentar mais de 300, 000 instalações, mas são capazes de inspecionar menos de 10 por cento delas em um determinado ano.
Usando dados de inspeções anteriores, os pesquisadores implantaram uma série de modelos para prever a probabilidade de falha em uma inspeção, com base nas características da instalação, como localização, histórico da indústria e da inspeção. Então, eles executaram seus modelos em todas as instalações, incluindo aqueles que ainda não foram inspecionados.
Esta técnica gerou uma pontuação de risco para cada instalação, indicando a probabilidade de reprovação em uma inspeção. O grupo, então, criou quatro cenários de inspeção refletindo diferentes restrições institucionais - orçamentos de inspeção variados e frequências de inspeção, por exemplo - e usou a pontuação para priorizar inspeções e prever violações.
No cenário com o menor número de restrições - improvável no mundo real - os pesquisadores previram alcançar até sete vezes o número de violações em comparação com o status quo. Quando eles levaram em consideração mais restrições, o número de violações detectadas ainda era o dobro do status quo.
Limites de algoritmos
Apesar de seu potencial, o aprendizado de máquina tem falhas contra as quais se proteger, os pesquisadores avisam. "Algoritmos são imperfeitos, eles podem perpetuar o preconceito às vezes e podem ser enganados, "disse o autor principal do estudo, Miyuki Hino, também é aluno de pós-graduação na E-IPER.
Por exemplo, agentes, tais proprietários de fazendas de suínos, podem manipular seus dados relatados para influenciar a probabilidade de receber benefícios ou evitar penalidades. Outros podem alterar seu comportamento - relaxar os padrões quando o risco de serem pegos é baixo - se souberem que têm probabilidade de serem selecionados pelo algoritmo. Institucional, restrições políticas e financeiras podem limitar a capacidade do aprendizado de máquina de melhorar as práticas existentes. A abordagem poderia potencialmente exacerbar as preocupações com a justiça ambiental se direcionar sistematicamente a supervisão para longe de instalações localizadas em áreas de baixa renda ou de minorias. Também, a abordagem de aprendizado de máquina não leva em consideração as possíveis mudanças ao longo do tempo, como nas prioridades de políticas públicas e tecnologias de controle de poluição.
Os pesquisadores sugerem soluções para alguns desses desafios. Selecionando algumas instalações aleatoriamente, independentemente de suas pontuações de risco, e ocasionalmente treinar novamente o modelo para refletir os fatores de risco atualizados pode ajudar a manter as instituições de baixo risco em alerta quanto à conformidade. Preocupações com a justiça ambiental podem ser incorporadas às práticas de fiscalização. Examinar o valor e as compensações do uso de dados auto-relatados pode ajudar a gerenciar as preocupações sobre o comportamento estratégico e a manipulação pelas instalações.
Os pesquisadores sugerem que trabalhos futuros podem examinar complexidades adicionais de integração de uma abordagem de aprendizado de máquina aos esforços mais amplos de aplicação da EPA, como a incorporação de prioridades de aplicação específicas ou identificação técnica, limitações financeiras e de recursos humanos. Além disso, esses métodos podem ser aplicados em outros contextos dentro dos EUA e além, onde os reguladores estão procurando fazer uso eficiente de recursos limitados.
“Este modelo é um ponto de partida que poderia ser ampliado com mais detalhes sobre os custos e benefícios de diferentes inspeções, violações e respostas de aplicação, "disse a coautora e colega de pós-graduação da E-IPER, Nina Brooks.