Pipeline de Rede Multi-Stream para Retrossíntese (MSNR). Crédito:Fronteiras da Ciência da Computação (2023). DOI:10.1007/s11704-023-3103-z A retrossíntese visa prever um conjunto de reagentes para a produção de determinadas moléculas, o que desempenha um papel significativo no campo da bioquímica, como o design de vias moleculares e a descoberta de medicamentos. A maioria dos métodos existentes beneficia apenas de um tipo de informação, em vez de considerar ainda mais os diversos aspectos da informação molecular.
Para resolver esse problema, uma equipe de pesquisa conduziu um estudo, agora publicado na Frontiers of Computer Science .
A equipe propôs uma rede multi-stream para previsão de retrossíntese, descrevendo moléculas de múltiplas perspectivas usando seus descritores SMILES e ECFPs.
O MSNR consiste em três módulos principais:(i) A CNN paralela e a CNN de texto que recebe os ECFPs e SMILES após a codificação one-hot como entrada para produzir os recursos profundos. (ii) A representação combinada é concebida pela fusão dos dois tipos de características profundas dos ECFPs e SMILES, que fornecem uma perspectiva aprofundada da representação molecular. (iii) Três classificadores densos foram implementados para prever a probabilidade de reagentes para moléculas, o que aproveita as características profundas extraídas por diferentes fluxos como representação molecular, respectivamente.
Ao fundir esses resultados de previsão multifluxo com pesos variados, o modelo chega a uma previsão final de retrossíntese. Além disso, o modelo é treinado usando uma função de perda global que é capaz de explorar as diversas informações disponíveis de cada tipo de recurso profundo.