Campo de sorgo, importante cultura utilizada na alimentação e na produção de biocombustíveis. Crédito:Pixabay
Como a inteligência artificial (IA) pode impactar a agricultura, a indústria de alimentos, e o campo da bioengenharia? Dan Jacobson, membro da equipe de pesquisa e desenvolvimento da Divisão de Biociências do Laboratório Nacional de Oak Ridge (ORNL) do Departamento de Energia dos EUA (DOE), tem algumas ideias.
Nos últimos 5 anos, Jacobson e sua equipe estudaram as plantas para entender as variáveis genéticas e os padrões que as tornam adaptáveis a ambientes e climas mutáveis. Como biólogo computacional, Jacobson usa alguns dos supercomputadores mais poderosos do mundo para seu trabalho, incluindo o recém-desativado Cray XK7 Titan e o supercomputador mais poderoso e inteligente do mundo para ciência aberta, o supercomputador IBM AC922 Summit, ambos localizados no Oak Ridge Leadership Computing Facility (OLCF), um DOE Office of Science User Facility em ORNL.
Ano passado, Jacobson e sua equipe ganharam um Prêmio Gordon Bell da Association for Computing Machinery depois de usar uma técnica de computação especial conhecida como "precisão mista" na Summit para se tornar o primeiro grupo a atingir a velocidade exascale - aproximadamente um quintilhão de cálculos por segundo.
A equipe de Jacobson está atualmente trabalhando em vários projetos que formam um roteiro integrado para o futuro da IA no melhoramento de plantas e bioenergia. O trabalho da equipe foi destaque em Tendências em Biotecnologia em outubro.
Neste Q&A, Jacobson fala sobre o trabalho de sua equipe em um algoritmo de seleção genômica, sua visão para o futuro da genômica ambiental, e o espaço onde a simulação encontra a IA.
No que sua equipe tem trabalhado no ano passado?
Jacobson:Estamos trabalhando em algumas coisas. Recentemente, desenvolvemos novas maneiras de fazer o que é chamado de "seleção genômica, "ou projetar um organismo para fins de reprodução. Desenvolvemos um novo algoritmo de seleção genômica que é impulsionado por métodos emergentes de aprendizado de máquina chamados coletivamente de" IA explicável, "que é um campo que aprimora os métodos do classificador de caixa preta de IA ao tentar entender como esses algoritmos tomam decisões.
Esse algoritmo nos ajuda a determinar quais variações em um genoma precisamos combinar para produzir plantas que podem se adaptar a seus ambientes. Isso informa os esforços de criação, esforços de edição de genes, ou combinações daqueles, dependendo do tipo de estratégia de bioengenharia que você deseja seguir.
No ano passado, você ganhou um Prêmio Gordon Bell depois de quebrar a barreira exascale com um código que permite estudar interações combinatórias entre organismos e seus ambientes. Como esse algoritmo se encaixa nessa pesquisa?
Jacobson:Ainda estamos usando o modelo que usamos no ano passado, mas agora, introduzimos este algoritmo de seleção genômica baseado em IA em nosso código Combinatorial Metrics [CoMet] e estamos alimentando-o com informações ambientais todos os dias do ano, para que possamos fazer estudos de associação de todo o genoma ao longo do tempo climático.
Adicionalmente, expandimos para uma escala global nossos esforços no que chamamos de "tipos climáticos" - o clima e as informações ambientais aos quais as plantas estão se adaptando. Com a ajuda de Peter Thornton do ORNL e a experiência de seu grupo em biogeografia e clima, construímos modelos de cada quilômetro quadrado de terra do planeta e codificamos 50 anos de dados ambientais e climáticos nesses modelos, variando do solo, através da qualidade espectral da luz, e tudo mais.
Para entender todas as relações entre diferentes ambientes, comparamos esses ambientes entre si no Summit usando um novo algoritmo chamado Duo que adicionamos à nossa base de código CoMet. Para nosso conhecimento, este é o maior cálculo científico já feito.
Isso soa como uma realização bastante robusta. Que tipo de informação essas comparações podem fornecer a você?
Jacobson:Essas comparações podem nos ajudar a determinar exatamente onde podemos visar certos ambientes e quais mutações genéticas e alelos precisamos incluir para ajudar essas plantas a se adaptarem a diferentes ambientes. Podemos olhar para um ambiente e dizer:“Para este ambiente, isso é o que vamos precisar ter no genoma desta planta para que ela prospere tão bem quanto pode. "
É este o futuro da genômica ambiental?
Jacobson:A visão integrada que vemos é a conexão de todas as camadas "-omics", da genômica (expressão gênica), proteômica (expressão de proteínas), e metabolômica (expressão de metabólitos) em todo o caminho até os fenótipos - características observáveis; tão, do genoma ao fenômeno e tudo mais.
Idealmente, gostaríamos de ter uma combinação de dados de genótipos com dados climáticos e ambientais em um modelo integrado, de nucleotídeos únicos - as estruturas moleculares que compõem o DNA - até o meio ambiente e o clima em escala planetária. Esses modelos integrados abrangentes agora são possíveis porque nós realmente calculamos a escala espectral de luz de cada ponto do planeta - que é um fenótipo astrofísico que vem de nossa estrela mais próxima, o sol.
Primeiro, precisamos olhar para as interações combinatórias em tais modelos para ver como elas levam às propriedades emergentes que estamos tentando otimizar nas plantas para produtividade e sustentabilidade futuras. Então, podemos conectar isso com a forma como as plantas se adaptaram historicamente aos ambientes para projetar novos genótipos ideais para bioenergia ou produção de alimentos que são otimizados para prosperar em ambientes específicos.
Isso é algo que será necessário na agricultura no futuro?
Jacobson:Conforme o mundo muda, há uma pressão crescente para utilizar "terras marginais, "isso é terra que muitas vezes não é usada atualmente para agricultura ou não é usada de forma eficiente para a agricultura. Então, se projetarmos genótipos que prosperam nesses ambientes marginais, seremos capazes de aumentar nossa produção de alimentos além de nossa produção de energia. Esta é uma tecnologia de dupla utilização.
Também estamos muito preocupados com a fertilização excessiva da terra porque pode levar ao escoamento que tem grandes consequências ecológicas. Se pudermos otimizar as plantas para usar os nutrientes que existem com poucos fertilizantes adicionais, isso também é um grande benefício para a sustentabilidade. Então, estamos realmente tentando olhar para isso de forma holística e construir o máximo dessas adaptações que pudermos no modelo, para que possamos saber os efeitos em certos ambientes.
Em que você irá trabalho em seguida?
Jacobson:A próxima etapa é olhar para os dados históricos e todas essas relações e, em seguida, projetar adiante para que possamos realmente projetar genótipos que não apenas prosperarão nas zonas ambientais atuais, mas continuarão a prosperar no futuro conforme a rede global muda. A capacidade de projetar para a frente, tanto para safras anuais quanto para safras perenes de longo prazo, é muito importante.
Quais são os desafios restantes?
Jacobson:Tudo o que estamos fazendo é um levantamento pesado, mas estamos estudando como podemos projetar essa nova abordagem na Summit e no futuro sistema exascale do OLCF, Fronteira, para que possamos realmente entender todas essas relações. Também, agora que temos esses dados em todas essas camadas "-omics", temos que executar essas combinações de camadas - chamadas politopos - milhares ou dezenas de milhares ou centenas de milhares de vezes. O próximo conjunto de algoritmos que estamos construindo é para encontrar todos os relacionamentos e associações possíveis dentro e entre todos os politopos. Essa é a próxima fronteira.
O seu trabalho vai se cruzar com os modelos tradicionais de simulação climática?
Jacobson:Esta é uma visão baseada em dados e IA das informações climáticas, que é diferente de uma abordagem de simulação. Hora extra, será interessante ver onde eles se cruzam, e pode haver coisas que aprendemos aqui que são muito informativas para modelos climáticos e vice-versa. Também sabemos que esse mesmo tipo de tecnologia de IA explicável pode ajudar muito nos estudos de simulação. Idealmente, poderíamos desenvolver modelos orientados a IA explicáveis que podem ajudar os modelos de simulação com alguns de seus gargalos. Se pudermos aprender como os modelos de simulação de padrões usam e substituir alguns de seus gargalos por um resultado aprendido, então, esses modelos podem fazer coisas mais criativas. É realmente aí que podemos ver parte desse espaço se cruzando no futuro.