Como o relato mais claro de resultados experimentais negativos melhoraria o planejamento de reações em química
Crédito:Angewandte Chemie
Bancos de dados contendo grandes quantidades de dados experimentais estão disponíveis para pesquisadores em uma ampla variedade de disciplinas químicas. No entanto, uma equipe de pesquisadores descobriu que os dados disponíveis não conseguem prever os rendimentos de novas sínteses usando inteligência artificial (IA) e aprendizado de máquina. Seu estudo publicado na revista
Angewandte Chemie International Edition sugere que isso se deve em grande parte à tendência dos cientistas de não relatar experimentos fracassados.
Embora os modelos baseados em IA tenham sido particularmente bem-sucedidos na previsão de estruturas moleculares e propriedades de materiais, eles retornam previsões bastante imprecisas para informações relacionadas a rendimentos de produtos em síntese, como Frank Glorius e sua equipe de pesquisadores da Westfälische Wilhelms-Universität Münster, Alemanha, descobriram .
Os pesquisadores atribuem essa falha aos dados usados para treinar sistemas de IA. "Curiosamente, a previsão dos rendimentos da reação (reatividade) é muito mais desafiadora do que a previsão das propriedades moleculares. Reagentes, reagentes, quantidades, condições, a execução experimental - tudo determina o rendimento e, portanto, o problema da previsão do rendimento se torna muito dado -intensivo", explica Glorius. Assim, apesar da enorme quantidade de literatura e resultados disponíveis, os pesquisadores perceberam que os dados não são adequados para previsões precisas do rendimento esperado.
O problema não se deve apenas à falta de experimentos. Em contraste, a equipe identificou três possíveis causas para dados tendenciosos. Em primeiro lugar, os resultados de sínteses químicas podem ser falhos devido a erros experimentais. Em segundo lugar, quando os químicos estão planejando seus experimentos, eles podem, consciente ou inconscientemente, introduzir preconceitos baseados na experiência pessoal e na confiança em métodos bem estabelecidos. Finalmente, uma vez que se acredita que apenas as reações com resultado positivo contribuem para o progresso, as reações malsucedidas são relatadas com menos frequência.
Para descobrir qual desses três fatores teve a maior influência, Glorius e a equipe alteraram propositalmente os conjuntos de dados para quatro reações orgânicas diferentes, comumente usadas (e, portanto, ricas em dados). Eles aumentaram artificialmente o erro experimental, reduziram o tamanho dos conjuntos de amostragem de dados ou removeram resultados negativos dos dados. Suas investigações mostraram que o erro experimental teve a menor influência no modelo, enquanto a contribuição feita pela falta de resultados negativos foi fundamental.
O grupo espera que essas descobertas encorajem os cientistas a sempre relatar experimentos fracassados, bem como seus sucessos. Isso melhoraria a disponibilidade de dados para treinamento de IA, ajudando a acelerar o planejamento e tornando a experimentação mais eficiente. Glorius acrescenta que "o aprendizado de máquina em química (molecular) aumentará drasticamente a eficiência e menos reações terão que ser executadas para atingir um determinado objetivo, por exemplo, uma otimização. Isso capacitará os químicos e os ajudará a fazer processos químicos - e a mundo - mais sustentável."
+ Explorar mais Os químicos usam a energia da luz para produzir pequenos anéis moleculares