Crédito CC0:domínio público
A tecnologia de sequenciamento de última geração inaugurou uma nova era na medicina, tornando mais fácil identificar uma sequência de nucleotídeos no DNA ou uma sequência de aminoácidos nas proteínas de um indivíduo específico e usar essas informações para diagnóstico e tratamento. Alterações mínimas nessas sequências podem ser indicativas de um distúrbio menor, e às vezes uma doença grave.
Cientistas da Skoltech, a Universidade Técnica de Munique, Universidade Politécnica de São Petersburgo e Instituto Indiano de Tecnologia Madras (Chennai, Índia) desenvolveram um método baseado em aprendizado de máquina para analisar as estruturas atômicas das proteínas e prever a patogenicidade das mutações. O método é adaptado para proteínas transmembrana que respondem por 25 a 30 por cento de todas as proteínas em uma célula, e muitas vezes servem como alvos para drogas.
"Neste estudo, usamos uma combinação de informações 1-D nas sequências de aminoácidos das proteínas e informações 3-D nas estruturas atômicas da proteína para criar um modelo eficaz baseado em aprendizado de máquina que ajuda a identificar substituições de aminoácidos associadas a doenças em proteínas de membrana, "diz o primeiro autor do estudo e professor assistente da Skoltech, Petr Popov.