Perguntas e Respostas:Como tornar produtos sustentáveis mais rápido com inteligência artificial e automação
Uma ilustração que mostra como o uso de IA e automação pode acelerar enormemente o pipeline de pesquisa e desenvolvimento em comparação com os atuais processos altamente iterativos e trabalhosos. Por exemplo, foram necessárias 575 pessoas-anos de trabalho para criar uma rota de produção sustentável e de base biológica para um produto químico amplamente utilizado chamado 1,3-propanodiol. Crédito:Jenny Nuss/Berkeley Lab Ao modificar os genomas de plantas e microrganismos, os biólogos sintéticos podem projetar sistemas biológicos que atendam a uma especificação, como produzir compostos químicos valiosos, tornar as bactérias sensíveis à luz ou programar células bacterianas para invadir células cancerígenas.
Este campo da ciência, embora tenha apenas algumas décadas de existência, permitiu a produção em larga escala de medicamentos e estabeleceu a capacidade de fabricar produtos químicos, combustíveis e materiais isentos de petróleo. Parece que os produtos biofabricados vieram para ficar e que contaremos cada vez mais com eles à medida que nos afastamos dos processos de fabrico tradicionais e com utilização intensiva de carbono.
Mas há um grande obstáculo:a biologia sintética exige muito trabalho e é lenta. Desde a compreensão dos genes necessários para fabricar um produto, até fazê-los funcionar adequadamente num organismo hospedeiro e, finalmente, fazer com que esse organismo prospere num ambiente industrial em grande escala para que possa produzir produtos suficientes para satisfazer a procura do mercado, o desenvolvimento de um processo de biofabricação pode levar muitos anos e muitos milhões de dólares de investimento.
Héctor García Martín, cientista da área de Biociências do Laboratório Nacional Lawrence Berkeley (Berkeley Lab), está trabalhando para acelerar e refinar esse cenário de P&D aplicando inteligência artificial e as ferramentas matemáticas que dominou durante sua formação como físico.
Conversamos com ele para saber como a IA, algoritmos personalizados, modelagem matemática e automação robótica podem se unir como uma soma maior do que suas partes e fornecer uma nova abordagem para a biologia sintética.
Por que a pesquisa em biologia sintética e a expansão de processos ainda demoram tanto tempo?
Penso que todos os obstáculos que encontramos na biologia sintética para criar produtos renováveis resultam de uma deficiência científica fundamental:a nossa incapacidade de prever sistemas biológicos. Muitos biólogos sintéticos podem discordar de mim e apontar para a dificuldade em escalar processos de mililitros para milhares de litros, ou para as lutas para extrair rendimentos suficientemente elevados para garantir a viabilidade comercial, ou mesmo para a árdua pesquisa na literatura de moléculas com as propriedades certas para sintetizar. E isso é tudo verdade.
Mas acredito que todos são consequência da nossa incapacidade de prever sistemas biológicos. Digamos que alguém com uma máquina do tempo (ou Deus, ou seu ser onisciente favorito) veio e nos deu uma sequência de DNA perfeitamente projetada para colocar em um micróbio para criar a quantidade ideal de nossa molécula alvo desejada (por exemplo, um biocombustível) em grande escala (milhares de litros).
Levaria algumas semanas para sintetizá-lo e transformá-lo em uma célula, e de três a seis meses para cultivá-lo em escala comercial. A diferença entre esses 6,5 meses e os cerca de 10 anos que levamos agora é o tempo gasto no ajuste fino das sequências genéticas e das condições de cultura - por exemplo, diminuindo a expressão de um determinado gene para evitar o acúmulo tóxico ou aumentando os níveis de oxigênio para um crescimento mais rápido. – porque não sabemos como isso afetará o comportamento celular.
Se pudéssemos prever isso com precisão, seríamos capazes de projetá-los com muito mais eficiência. E é assim que é feito em outras disciplinas. Não projetamos aviões construindo novos formatos de aviões e pilotando-os para ver se funcionam bem. Nosso conhecimento de dinâmica de fluidos e engenharia estrutural é tão bom que podemos simular e prever o efeito que algo como uma mudança na fuselagem terá durante o vôo.
Como a inteligência artificial acelera esses processos? Você pode dar alguns exemplos de trabalhos recentes?
Estamos usando aprendizado de máquina e inteligência artificial para fornecer o poder preditivo que a biologia sintética precisa. Nossa abordagem ignora a necessidade de compreender completamente os mecanismos moleculares envolvidos, e é assim que economiza um tempo significativo. No entanto, isto levanta algumas suspeitas nos biólogos moleculares tradicionais.
Normalmente, essas ferramentas precisam ser treinadas em enormes conjuntos de dados, mas simplesmente não temos tantos dados em biologia sintética quanto em algo como astronomia, por isso desenvolvemos métodos exclusivos para superar essa limitação. Por exemplo, usamos o aprendizado de máquina para prever quais promotores (sequências de DNA que medeiam a expressão genética) escolher para obter produtividade máxima.
Também usamos o aprendizado de máquina para prever o meio de crescimento correto para a produção ideal, para prever a dinâmica metabólica das células, para aumentar o rendimento de precursores de combustível de aviação sustentáveis e para prever como projetar sintases de policetídeo funcionais (enzimas que podem produzir uma enorme variedade de moléculas valiosas, mas são extremamente difíceis de projetar de forma previsível).
Em muitos destes casos, precisámos de automatizar as experiências científicas para obter as grandes quantidades de dados de alta qualidade de que necessitamos para que os métodos de IA fossem verdadeiramente eficazes. Por exemplo, usamos manipuladores robóticos de líquidos para criar novos meios de crescimento para micróbios e testar sua eficácia, e desenvolvemos chips microfluídicos para tentar automatizar a edição genética. Estou trabalhando ativamente com outras pessoas no Laboratório (e colaboradores externos) para criar laboratórios autônomos para biologia sintética.
Há muitos outros grupos nos EUA fazendo um trabalho semelhante? Você acha que esse campo aumentará com o tempo?
O número de grupos de investigação com experiência na intersecção entre IA, biologia sintética e automação é muito pequeno, especialmente fora da indústria. Destaco Philip Romero, da Universidade de Wisconsin, e Huimin Zhao, da Universidade de Illinois Urbana-Champaign. No entanto, dado o potencial desta combinação de tecnologias para ter um enorme impacto social (por exemplo, no combate às alterações climáticas, ou na produção de novos medicamentos terapêuticos ), acho que este campo crescerá muito rapidamente no futuro próximo.
Participei de vários grupos de trabalho, comissões e workshops, incluindo uma reunião de especialistas da Comissão de Segurança Nacional sobre Biotecnologia Emergente, que discutiram as oportunidades nesta área e estão elaborando relatórios com recomendações ativas.
Que tipo de avanços você prevê no futuro com a continuidade deste trabalho?
Acho que uma aplicação intensa de IA e robótica/automação à biologia sintética pode acelerar os cronogramas da biologia sintética em cerca de 20 vezes. Poderíamos criar uma nova molécula comercialmente viável em aproximadamente 6 meses em vez de aproximadamente 10 anos. Isto é extremamente necessário se quisermos permitir uma bioeconomia circular – a utilização sustentável de biomassa renovável (fontes de carbono) para gerar energia e produtos intermédios e finais.
Existem cerca de 3.574 produtos químicos de alto volume de produção (HPV) (produtos químicos que os EUA produzem ou importam em quantidades de pelo menos 1 milhão de libras por ano) provenientes da petroquímica atualmente. Uma empresa de biotecnologia chamada Genencor precisou de 575 pessoas-ano de trabalho para produzir uma rota renovável para a produção de um destes produtos químicos amplamente utilizados, o 1,3-propanodiol, e este é um número típico.
Se presumirmos que esse é o tempo que levaria para projetar um processo de biofabricação para substituir o processo de refino de petróleo para cada um desses milhares de produtos químicos, precisaríamos de aproximadamente 2.000.000 pessoas-ano. Se colocarmos todos os cerca de 5.000 biólogos sintéticos dos EUA (digamos 10% de todos os cientistas biológicos nos EUA, e isso é uma estimativa exagerada) para trabalhar nisso, levaria cerca de 371 anos para criar essa bioeconomia circular.
Com a anomalia de temperatura crescendo a cada ano, não temos realmente 371 anos. Esses números são obviamente cálculos rápidos, mas dão uma ideia da ordem de grandeza se continuarmos no caminho atual. Precisamos de uma abordagem disruptiva.
Além disso, esta abordagem permitiria a prossecução de objectivos mais ambiciosos que são inviáveis com as abordagens actuais, tais como:engenharia de comunidades microbianas para fins ambientais e de saúde humana, biomateriais, tecidos de bioengenharia, etc.
Como o Berkeley Lab é um ambiente único para fazer esta pesquisa?
O Berkeley Lab tem feito um forte investimento em biologia sintética nas últimas duas décadas e demonstra considerável experiência na área. Além disso, o Berkeley Lab é o lar da "grande ciência":ciência multidisciplinar, com grandes equipes e
Penso que este é o caminho certo para a biologia sintética neste momento. Muito foi conseguido nos últimos setenta anos desde a descoberta do ADN através de abordagens tradicionais de biologia molecular de um único investigador, mas penso que os desafios futuros exigem uma abordagem multidisciplinar envolvendo biólogos sintéticos, matemáticos, engenheiros eléctricos, cientistas da computação, biólogos moleculares, engenheiros químicos , etc. Acho que o Berkeley Lab deveria ser o lugar natural para esse tipo de trabalho.
Conte-nos um pouco sobre sua formação, o que o inspirou a estudar modelagem matemática de sistemas biológicos?
Desde muito cedo me interessei muito por ciências, especificamente biologia e física. Lembro-me vividamente de meu pai me contando sobre a extinção dos dinossauros. Também me lembro de ter ouvido falar de como, no período Permiano, havia libélulas gigantes (~75 cm) porque os níveis de oxigênio eram muito mais altos do que agora (~30% vs. 20%) e os insetos obtinham seu oxigênio por difusão, não pelos pulmões. Conseqüentemente, níveis maiores de oxigênio permitiram insetos muito maiores.
Também fiquei fascinado pela capacidade que a matemática e a física nos proporcionam para compreender e projetar as coisas ao nosso redor. A física foi minha primeira escolha, porque a forma como a biologia era ensinada naquela época envolvia muito mais memorização do que previsões quantitativas. Mas sempre tive interesse em aprender quais princípios científicos levaram à vida na Terra como a vemos agora.
Obtive meu doutorado em física teórica, no qual simulei condensados de Bose-Einstein (um estado da matéria que surge quando partículas chamadas bósons, um grupo que inclui fótons, estão próximas da temperatura do zero absoluto) e usando integral de caminho Monte Carlo, mas também forneceu uma explicação para um quebra-cabeça de mais de 100 anos em ecologia:por que o número de espécies em uma área aumenta com uma lei de potência aparentemente universal dependente da área (S=cA
z
, z=0,25)? A partir de então, eu poderia ter continuado trabalhando em física, mas pensei que poderia causar maior impacto aplicando capacidades preditivas à biologia.
Por esse motivo, apostei muito no doutorado em física. e aceitou um pós-doutorado no DOE Joint Genome Institute em metagenômica – sequenciamento de comunidades microbianas para desvendar suas atividades celulares subjacentes – com a esperança de desenvolver modelos preditivos para microbiomas. Descobri, no entanto, que a maioria dos ecologistas microbianos tinha interesse limitado em modelos preditivos, por isso comecei a trabalhar em biologia sintética, que necessita de capacidades de previsão porque visa projetar células de acordo com uma especificação.
Minha posição atual me permite usar meu conhecimento matemático para tentar projetar células de maneira previsível para produzir biocombustíveis e combater as mudanças climáticas. Fizemos muitos progressos e fornecemos alguns dos primeiros exemplos de biologia sintética guiada por IA, mas ainda há muito trabalho a fazer para tornar a biologia previsível.