Visão geral do fluxo de trabalho do método iterativo de Otimização de Peptídeos com Aprendizado Ótimo (POOL). Crédito: Nature Communications (2018). DOI:10.1038 / s41467-018-07717-6
Cientistas e engenheiros há muito se interessam por sintetizar peptídeos - cadeias de aminoácidos responsáveis pela condução de muitas funções dentro das células - tanto para imitar a natureza quanto para realizar novas atividades. Um peptídeo projetado, por exemplo, pode ser um medicamento funcional que atua em certas áreas do corpo sem degradar, uma tarefa difícil para muitos peptídeos.
Mas os métodos para descobrir e sintetizar peptídeos são caros e demorados, frequentemente envolvendo meses ou anos de suposições e falhas.
Pesquisadores da Northwestern University, em parceria com colaboradores da Cornell University e da University of California, San Diego, desenvolveram uma nova maneira de encontrar sequências peptídicas ideais:usando um algoritmo de aprendizado de máquina como um colaborador.
O algoritmo analisa os dados experimentais e oferece sugestões sobre a próxima melhor sequência a ser tentada, criando um processo de seleção para frente e para trás que reduz drasticamente o tempo necessário para encontrar o peptídeo ideal.
Os resultados, que poderia fornecer uma nova estrutura para experimentos em ciência de materiais e química, foram publicados em Nature Communications em 7 de dezembro.
"Vemos isso como a próxima onda de como projetamos moléculas e materiais, "disse o professor da Northwestern Nathan Gianneschi, um autor correspondente no artigo. "Podemos combinar o que sabemos por intuição com o poder de um algoritmo e encontrar a solução com menos experimentos."
Gianneschi é o professor Jacob e Rosaline Cohn no departamento de química do Weinberg College of Arts and Sciences da Northwestern e nos departamentos de ciência e engenharia de materiais e de engenharia biomédica na Northwestern Engineering.
Para criar o método, Gianneschi, que também é diretor associado do Instituto Internacional de Nanotecnologia da Northwestern, juntou-se a Peter Frazier, um professor associado da Cornell que trabalha com pesquisa operacional e aprendizado de máquina, e Michael Burkart, um biólogo químico e especialista em enzimologia na UC San Diego, para encontrar uma maneira melhor de fazer peptídeos que poderiam gerar biomateriais - especificamente nanoestruturas e microestruturas que poderiam modificar proteínas de certas maneiras. O primeiro passo foi encontrar os peptídeos certos que atuariam como substratos enzimáticos para essas estruturas.
Os peptídeos são construídos a partir de cadeias de aminoácidos que podem ter até 20 aminoácidos de comprimento, com 20 possibilidades diferentes para cada ácido. Uma vez que a sequência determina a função do peptídeo, descobrir as sequências ideais requer experimentos caros, muitas vezes conduzidos com suposições.
Os experimentalistas, Gianneschi e Burkart, trabalhou com Frazier durante vários anos para desenvolver um sistema que combinava dados experimentais com um algoritmo de aprendizado de máquina para encontrar as melhores estratégias para a criação de novos materiais.
Depois que Frazier projetou o algoritmo e os dois trabalharam juntos para treiná-lo, os experimentalistas desenvolveram uma matriz de 100 peptídeos, realizaram experimentos para descobrir quais funcionavam como deveriam, em seguida, alimentou essa informação no algoritmo. O algoritmo então recomendou o que mudar para a próxima rodada de desenvolvimento de peptídeo, e também recomendou estratégias que pensava que iriam falhar.
"Agora estávamos começando a ter seletividade, "Gianneschi disse. Ao concluir este processo várias vezes, eles foram capazes de se concentrar em peptídeos ideais.
"Em vez de adivinhar e olhar para milhões de peptídeos, fomos capazes de olhar para centenas de peptídeos e convergir muito rapidamente para sequências que se comportavam de maneiras completamente novas, "disse ele. Quando comparado com mutações aleatórias ou suposições, o método do algoritmo foi estatisticamente muito mais bem-sucedido.
Embora este trabalho tenha focado em substratos, este processo pode ser usado para descobrir peptídeos para qualquer tipo de finalidade, como entrega de drogas, e talvez até mesmo ser usado para descobrir sequências de DNA, também. Porque qualquer tipo de sequência ideal pode ser descoberta, os pesquisadores também não estão limitados às sequências de aminoácidos encontradas no código genético.
A próxima etapa será automatizar todo o processo. Gianneschi também está interessado em usar o método para encontrar superfícies ideais para polímeros, especificamente polímeros usados em implantes médicos. Encontrar as superfícies certas que se ligam ao tecido ou músculo pode ajudar a prevenir o tecido cicatricial ou a rejeição do implante.
"Você pode essencialmente descobrir sequências que fazem coisas específicas, que é realmente o cerne do que os peptídeos e ácidos nucleicos fazem na natureza, "disse ele." Isso pode revolucionar a forma como fazemos peptídeos. "