• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Química
    A abordagem de aprendizado de máquina pode ajudar no design de processos industriais para a fabricação de medicamentos

    Um novo sistema de computador prevê os produtos de reações químicas. “A visão é que você será capaz de chegar a um sistema e dizer:‘Eu quero fazer esta molécula.’ O software irá dizer a rota a partir da qual você deve fazer isso, e a máquina vai fazer isso, ”Diz o professor Klays Jensen. Crédito:MIT News

    Quando os químicos orgânicos identificam um composto químico útil - uma nova droga, por exemplo - cabe aos engenheiros químicos determinar como produzi-lo em massa.

    Pode haver 100 sequências diferentes de reações que produzem o mesmo produto final. Mas alguns deles usam reagentes mais baratos e temperaturas mais baixas do que outros, e talvez o mais importante, alguns são muito mais fáceis de executar continuamente, com técnicos ocasionalmente completando reagentes em diferentes câmaras de reação.

    Historicamente, determinar a maneira mais eficiente e econômica de produzir uma determinada molécula tem sido tanto arte quanto ciência. Mas os pesquisadores do MIT estão tentando colocar esse processo em uma base empírica mais segura, com um sistema de computador treinado em milhares de exemplos de reações experimentais e que aprende a prever quais serão os principais produtos de uma reação.

    O trabalho dos pesquisadores foi publicado no jornal da American Chemical Society. ACS Central Science . Como todos os sistemas de aprendizado de máquina, o deles apresenta seus resultados em termos de probabilidades. Em testes, o sistema foi capaz de prever o principal produto de uma reação 72% das vezes; 87 por cento do tempo, classificou o principal produto entre seus três resultados mais prováveis.

    "Claramente, há muito que se sabe sobre as reações hoje, "diz Klavs Jensen, o professor Warren K. Lewis de Engenharia Química do MIT e um dos quatro autores seniores do artigo, "mas é altamente evoluído, adquiriu habilidade para olhar para uma molécula e decidir como você vai sintetizá-la a partir de materiais iniciais. "

    Com o novo trabalho, Jensen diz, "a visão é que você será capaz de chegar a um sistema e dizer:'Eu quero fazer esta molécula.' O software lhe dirá a rota a partir da qual você deve fazer, e a máquina vai fazer isso. "

    Com 72 por cento de chance de identificar o principal produto de uma reação, o sistema ainda não está pronto para ancorar o tipo de síntese química totalmente automatizada que Jensen prevê. Mas poderia ajudar os engenheiros químicos a convergir mais rapidamente para a melhor sequência de reações - e possivelmente sugerir sequências que eles não teriam investigado de outra forma.

    Jensen é acompanhado no artigo pelo primeiro autor Connor Coley, um estudante de graduação em engenharia química; William Green, o Professor Hoyt C. Hottel de Engenharia Química, quem, com Jensen, co-aconselha Coley; Regina Barzilay, o Professor Delta Eletrônica de Engenharia Elétrica e Ciência da Computação; e Tommi Jaakkola, o professor Thomas Siebel de Engenharia Elétrica e Ciência da Computação.

    Atuando localmente

    Uma única molécula orgânica pode consistir em dezenas e até centenas de átomos. Mas uma reação entre duas dessas moléculas pode envolver apenas dois ou três átomos, que quebram suas ligações químicas existentes e formam novas. Milhares de reações entre centenas de reagentes diferentes muitas vezes se resumem em um único, reação compartilhada entre o mesmo par de "locais de reação".

    Uma grande molécula orgânica, Contudo, pode ter vários locais de reação, e quando encontra outra grande molécula orgânica, apenas uma das várias reações possíveis entre eles realmente ocorrerá. Isso é o que torna a previsão de reação automática tão complicada.

    No passado, os químicos construíram modelos de computador que caracterizam as reações em termos de interações nos locais de reação. Mas eles frequentemente exigem a enumeração de exceções, que devem ser pesquisados ​​independentemente e codificados à mão. O modelo pode declarar, por exemplo, que se a molécula A tiver local de reação X, e a molécula B tem local de reação Y, então X e Y vão reagir para formar o grupo Z - a menos que a molécula A também tenha locais de reação P, Q, R, S, T, VOCÊ, ou V.

    Não é incomum que um único modelo exija mais de uma dúzia de exceções enumeradas. E descobrir essas exceções na literatura científica e adicioná-las aos modelos é uma tarefa trabalhosa, que limitou a utilidade dos modelos.

    Um dos principais objetivos do novo sistema dos pesquisadores do MIT é contornar esse árduo processo. Coley e seus co-autores começaram com 15 anos, 000 reações empiricamente observadas relatadas em registros de patentes dos EUA. Contudo, porque o sistema de aprendizado de máquina teve que aprender quais reações não ocorreriam, bem como aqueles que seriam, exemplos de reações bem-sucedidas não foram suficientes.

    Exemplos negativos

    Portanto, para cada par de moléculas em uma das reações listadas, Coley também gerou uma bateria de possíveis produtos adicionais, com base nos locais de reação das moléculas. Ele então alimentou descrições de reações, junto com suas listas expandidas artificialmente de produtos possíveis, a um sistema de inteligência artificial conhecido como rede neural, que tinha a tarefa de classificar os produtos possíveis em ordem de probabilidade.

    A partir deste treinamento, a rede aprendeu essencialmente uma hierarquia de reações - quais interações em quais locais de reação tendem a ter precedência sobre quais outros - sem a laboriosa anotação humana.

    Outras características de uma molécula podem afetar sua reatividade. Os átomos em um determinado local de reação podem, por exemplo, têm diferentes distribuições de carga, dependendo de quais outros átomos estão ao seu redor. E a forma física de uma molécula pode dificultar o acesso a um local de reação. Portanto, o modelo dos pesquisadores do MIT também inclui medidas numéricas de ambos esses recursos.

    De acordo com Richard Robinson, pesquisador de tecnologias químicas da empresa farmacêutica Novartis, o sistema dos pesquisadores do MIT "oferece uma abordagem diferente para o aprendizado de máquina no campo da síntese direcionada, que no futuro poderia transformar a prática do design experimental em moléculas direcionadas. "

    "Atualmente, confiamos fortemente em nosso próprio treinamento retrosintético, que está alinhado com nossas próprias experiências pessoais e ampliado com motores de busca de banco de dados de reação, "Robinson diz." Isso nos serve bem, mas muitas vezes ainda resulta em uma taxa de falha significativa. Mesmo os químicos mais experientes ficam frequentemente surpresos. Se você fosse somar todas as falhas de síntese cumulativas como uma indústria, isso provavelmente se relacionaria a um investimento significativo de tempo e custo. E se pudéssemos melhorar nossa taxa de sucesso? "

    Os pesquisadores do MIT, Robinson diz, "demonstraram de forma inteligente uma nova abordagem para alcançar um desempenho de reação preditiva superior em relação às abordagens convencionais. Aumentando a literatura relatada com exemplos de reações negativas, o conjunto de dados tem mais valor. "

    Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.




    © Ciência https://pt.scienceaq.com