Usando análise computacional, os pesquisadores descobriram que muitas sequências repetitivas são compartilhadas entre proteínas e são semelhantes em espécies de bactérias a humanos. Crédito:Byron Lee et al, eLife (2022). DOI:10.7554/eLife.77058
Cerca de 70% de todas as proteínas humanas incluem pelo menos uma sequência que consiste em um único aminoácido repetido muitas vezes, com alguns outros aminoácidos polvilhados. Essas "regiões de baixa complexidade" também são encontradas na maioria dos outros organismos.
As proteínas que contêm essas sequências têm muitas funções diferentes, mas os biólogos do MIT agora encontraram uma maneira de identificá-las e estudá-las como um grupo unificado. Sua técnica permite analisar semelhanças e diferenças entre LCRs de diferentes espécies e os ajuda a determinar as funções dessas sequências e as proteínas nas quais são encontradas.
Usando sua técnica, os pesquisadores analisaram todas as proteínas encontradas em oito espécies diferentes, de bactérias a humanos. Eles descobriram que, embora os LCRs possam variar entre proteínas e espécies, eles geralmente compartilham um papel semelhante – ajudando a proteína na qual são encontrados a se juntar a um conjunto de maior escala, como o nucléolo, uma organela encontrada em quase todas as células humanas.
“Em vez de olhar para LCRs específicos e suas funções, que podem parecer separadas porque estão envolvidas em processos diferentes, nossa abordagem mais ampla nos permite ver semelhanças entre suas propriedades, sugerindo que talvez as funções dos LCRs não sejam tão díspares, afinal. ", diz Byron Lee, um estudante de pós-graduação do MIT.
Os pesquisadores também encontraram algumas diferenças entre os LCRs de diferentes espécies e mostraram que essas sequências LCR específicas da espécie correspondem a funções específicas da espécie, como a formação de paredes celulares de plantas.
Lee e a estudante de pós-graduação Nima Jaberi-Lashkari são os principais autores do estudo, que aparece hoje na
eLife . Eliezer Calo, professor assistente de biologia no MIT, é o autor sênior do artigo.
Estudo em grande escala Pesquisas anteriores revelaram que os LCRs estão envolvidos em uma variedade de processos celulares, incluindo adesão celular e ligação ao DNA. Esses LCRs geralmente são ricos em um único aminoácido, como alanina, lisina ou ácido glutâmico.
Encontrar essas sequências e estudar suas funções individualmente é um processo demorado, então a equipe do MIT decidiu usar a bioinformática – uma abordagem que usa métodos computacionais para analisar grandes conjuntos de dados biológicos – para avaliá-los como um grupo maior.
"O que queríamos fazer é dar um passo para trás e, em vez de olhar para LCRs individuais, tentar dar uma olhada em todos eles e ver se poderíamos observar alguns padrões em uma escala maior que podem nos ajudar a descobrir o que o aqueles que têm funções atribuídas estão fazendo e também nos ajudam a aprender um pouco sobre o que os que não têm funções atribuídas estão fazendo", diz Jaberi-Lashkari.
Para isso, os pesquisadores usaram uma técnica chamada matriz de pontos, que é uma forma de representar visualmente sequências de aminoácidos, para gerar imagens de cada proteína em estudo. Eles então usaram métodos de processamento de imagem computacional para comparar milhares dessas matrizes ao mesmo tempo.
Usando essa técnica, os pesquisadores conseguiram categorizar os LCRs com base em quais aminoácidos foram repetidos com mais frequência no LCR. Eles também agruparam proteínas contendo LCR pelo número de cópias de cada tipo de LCR encontrado na proteína. A análise desses traços ajudou os pesquisadores a aprender mais sobre as funções desses LCRs.
Como demonstração, os pesquisadores escolheram uma proteína humana, conhecida como RPA43, que possui três LCRs ricos em lisina. Essa proteína é uma das muitas subunidades que compõem uma enzima chamada RNA polimerase 1, que sintetiza o RNA ribossômico. Os pesquisadores descobriram que o número de cópias de LCRs ricos em lisina é importante para ajudar a proteína a se integrar ao nucléolo, a organela responsável pela síntese de ribossomos.
Montagens biológicas Em uma comparação das proteínas encontradas em oito espécies diferentes, os pesquisadores descobriram que alguns tipos de LCR são altamente conservados entre as espécies, o que significa que as sequências mudaram muito pouco ao longo das escalas de tempo evolutivas. Essas sequências tendem a ser encontradas em proteínas e estruturas celulares também altamente conservadas, como o nucléolo.
"Essas sequências parecem ser importantes para a montagem de certas partes do nucléolo", diz Lee. "Alguns dos princípios que são conhecidos por serem importantes para a montagem de ordem superior parecem estar em jogo porque o número de cópias, que pode controlar quantas interações uma proteína pode fazer, é importante para a proteína se integrar nesse compartimento".
Os pesquisadores também encontraram diferenças entre os LCRs observados em dois tipos diferentes de proteínas que estão envolvidas na montagem do nucléolo. Eles descobriram que uma proteína nucleolar conhecida como TCOF contém muitos LCRs ricos em glutamina que podem ajudar na formação de montagens, enquanto proteínas nucleolares com apenas alguns desses LCRs ricos em ácido glutâmico podem ser recrutadas como clientes (proteínas que interagem com o andaime ).
Outra estrutura que parece ter muitos LCRs conservados é o speckle nuclear, que se encontra dentro do núcleo da célula. Os pesquisadores também encontraram muitas semelhanças entre os LCRs que estão envolvidos na formação de montagens em maior escala, como a matriz extracelular, uma rede de moléculas que fornece suporte estrutural às células de plantas e animais.
A equipe de pesquisa também encontrou exemplos de estruturas com LCRs que parecem ter divergido entre as espécies. Por exemplo, as plantas têm sequências de LCR distintas nas proteínas que usam para estruturar suas paredes celulares, e essas LCRs não são vistas em outros tipos de organismos.
Os pesquisadores agora planejam expandir sua análise de LCR para espécies adicionais.
“Há muito para explorar, porque podemos expandir este mapa para essencialmente qualquer espécie”, diz Lee. "Isso nos dá a oportunidade e a estrutura para identificar novos conjuntos biológicos".
+ Explorar mais Proteína revelada como cola que mantém biomoléculas dentro do nucléolo
Esta história foi republicada como cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisa, inovação e ensino do MIT.