Crédito CC0:domínio público
Pesquisadores do Broad Institute of MIT e Harvard levaram o Connectivity Map - um recurso amplamente usado de ferramentas e dados - a novos patamares com uma versão massivamente ampliada. Para esta nova plataforma, os pesquisadores também melhoraram sua acessibilidade para a comunidade científica, possibilitando estudos de pequenas moléculas e funções de genes e informando ensaios clínicos.
O Mapa de Conectividade, ou CMap, é um conjunto de dados de referência funcional do genoma humano que conecta genes, drogas, e estados de doença por meio de padrões comuns de atividade genética, conhecidas como assinaturas de expressão gênica. A versão original do CMap incluía apenas algumas centenas de perfis de expressão gênica em algumas linhas de células, produzido usando microarranjos de DNA caros. Cientistas amplos desenvolveram agora um modelo de baixo custo, método de alto rendimento para expressão gênica, em que a expressão de um subconjunto de genes é medida, e a expressão dos genes não medidos restantes são inferidos computacionalmente. Este método, chamado L1000, permitiu que a equipe ampla expandisse o CMap existente em mais de 1, 000 vezes, tornando-o um recurso muito mais abrangente e útil para a comunidade científica.
O trabalho está descrito na edição de 30 de novembro da Célula .
Contendo mais de 1,3 milhão de perfis de expressão gênica e desenvolvidos por meio do Consórcio NIH LINCS, esta "próxima geração" CMap pode ser explorada por pesquisadores de todo o mundo por meio de um novo ambiente de análise baseado em nuvem, permitindo que eles anotem funcionalmente variantes genéticas de genes de doenças, descobrir o mecanismo de ação de pequenas moléculas não caracterizadas, e gerar novas hipóteses terapêuticas.
"O mapa de conectividade expandido é um exemplo de novas direções na pesquisa genômica. Estamos entusiasmados em ver que nossos dados e ferramentas já estão sendo usados por cientistas em toda a academia e indústria, para apoiar a ciência básica e a descoberta de medicamentos, "disse Todd Golub, autor sênior do estudo e diretor científico da Broad, onde também é diretor do Programa de Câncer do instituto. "É provável que os dados e ferramentas sejam usados de maneiras que nem imaginamos, e esperamos que os usuários nos ajudem a melhorar as ferramentas e tornar o CMap ainda mais útil à medida que continuamos a expandir os recursos. "
A utilidade da versão piloto do CMap foi limitada por seu pequeno tamanho. Os cientistas do CMap sabiam que, para construir um recurso verdadeiramente abrangente que pudesse gerar uma visão biológica mecanística e de nível de circuito, eles precisariam expandir muito o compêndio com muitas perturbações químicas e genéticas em diversos tipos de células.
Porque fazer isso usando microarrays ou mesmo sequenciamento de RNA seria muito caro, a equipe CMap desenvolveu um novo método de criação de perfil conhecido como "L1000". Em vez de traçar o perfil da expressão de cada gene codificador de proteína no genoma, o método gera uma escala de genoma na expressão medindo a atividade de 1, 000 genes "marcos" e usando essas medições para inferir a atividade da maioria dos genes não medidos. Os pesquisadores analisaram os dados existentes sobre os padrões de expressão gênica para escolher os genes de referência que podem servir como representantes precisos para todo o transcriptoma.
Esta abordagem permitiu que a equipe aumentasse drasticamente a escala do experimento, de modo que o CMap agora inclui mais de 1 milhão de perfis de expressão gênica de várias linhas de células tratadas com perturbações químicas ou genéticas. Em comparação com os 164 medicamentos analisados no piloto CMap, o novo conjunto de dados inclui perfis de expressão de células tratadas com 42, 080 perturbagens, incluindo drogas de pequenas moléculas, compostos de ferramentas, e compostos não otimizados de mecanismos de ação até então desconhecidos.
Para demonstrar a utilidade do recurso, a equipe mostrou com sucesso que o CMap pode ajudar a prever como uma pequena molécula ou droga funciona, o que pode acelerar os esforços de descoberta de medicamentos. Se o perfil de expressão de células perturbadas por uma pequena molécula corresponder à assinatura de expressão de células perturbadas com compostos de função conhecida, sugere que a pequena molécula pode funcionar através da mesma via celular e dá aos cientistas uma vantagem experimental ao explorar a função de compostos não estudados ou terapêuticas potenciais.
A equipe também mostrou que o CMap pode ajudar os pesquisadores a descobrir compostos com atividades desejadas. Em uma instância, eles usaram para descobrir um composto que inibe a caseína quinase 1 alfa, uma proteína envolvida em certas leucemias e que também confere resistência a uma classe de medicamentos contra o câncer de pulmão chamados inibidores de EGFR.
Isso ressalta o poder do Mapa de Conectividade expandido como um valioso ponto de partida para a descoberta de medicamentos.
Em um teste do potencial do CMap para informar a pesquisa clínica, os pesquisadores analisaram amostras de tumor obtidas antes e depois do tratamento em testes de drogas contra o câncer. Os resultados mostraram mudanças nos padrões de atividade genética das células tumorais devido à terapia do câncer, e a comparação com perturbágenos CMap sugeriu o envolvimento de vias conhecidas de resistência a drogas.
O Mapa de Conectividade está constantemente sendo curado com novos dados gerados pela equipe do Broad. A nova versão contém assinaturas de expressão de compostos que foram previamente estudados, mas também aqueles que ainda não foram caracterizados.
Todos os dados e ferramentas estão agora disponíveis em um ambiente de análise baseado em poder desenvolvido por pesquisadores da Broad e conhecido como CLUE, que a equipe CMap incentiva os usuários a acessar e explorar. A equipe CMap está planejando expandir o recurso para incluir mais tipos de células, mais perturbações, e mais tipos de dados, incluindo dados de imagem proteômica e celular.
A próxima geração do CMap foi possível por meio de colaborações estreitas entre a equipe do CMap, outros membros do Consórcio NIH LINCS, e vários outros grupos do Broad Institute, incluindo o Centro para o Desenvolvimento de Terapêutica (CDoT), a Plataforma de Perturbação Genética, a equipe PRISM, e a Plataforma Proteômica.
"Esse esforço só foi possível com a experiência combinada de muitos programas e plataformas Broad, exigindo uma quantidade incrível de trabalho em equipe, "disse Aravind Subramanian, um co-autor do artigo, juntamente com os pesquisadores da Broad, Steven Corsello e Rajiv Narayan. "Nossa aspiração é que o CMap se torne uma parte rotineira da descoberta de medicamentos, fornecendo pistas úteis à medida que os alvos e as moléculas passam pelos vários estágios do desenvolvimento terapêutico. Temos o prazer de compartilhar os resultados de nossos esforços com a comunidade científica. Mais importante, ainda não terminamos - convidamos os caçadores de drogas da academia e da indústria a usar o recurso e nos enviar seus comentários. "