Crédito CC0:domínio público
A era do big data está aqui:o mundo criou mais dados nos últimos dois anos do que em toda a história anterior da raça humana. Os pesquisadores da Escola de Gerontologia do USC Leonard Davis estão dissecando tesouros de informações - de fontes tão diversas como varreduras cerebrais e o genoma humano - para alimentar pesquisas inovadoras sobre como envelhecermos, e remodelar a educação em gerontologia para permitir que futuros cientistas tenham um impacto em um campo em mudança.
A gerontologia está pronta para assumir as ferramentas mais recentes, em parte porque o campo sempre envolveu conjuntos de big data, disse Mireille Jacobson, microeconomista e professor associado de gerontologia na Escola Leonard Davis da USC. Por exemplo, seu trabalho se baseou em grandes conjuntos de dados populacionais e, de certa forma, isso não mudou, ela diz. "É principalmente porque mais e mais dados estão disponíveis."
Jacobson trabalha com dados do Medicare e outros bancos de dados disponíveis publicamente para entender como o seguro saúde afeta o bem-estar dos idosos. Por exemplo, uma análise dos dados do Medicare descobriu que receber benefícios do Medicare pode ajudar a reduzir o estresse financeiro em pessoas com mais de 65 anos. Ela também pesquisa profissionais de saúde e como eles tomam decisões sobre cuidados em resposta a vários fatores externos. incluindo novas recomendações de triagem e escassez de medicamentos.
"O esforço para digitalizar e disponibilizar tudo eletronicamente é uma coisa nova, " Ela adiciona.
Jacobson faz parte de um grupo de pesquisadores de gerontologia da USC Leonard Davis School que estão mergulhando em vastos conjuntos de dados para entender melhor o envelhecimento e a expectativa de vida. Seu trabalho tem implicações importantes para o treinamento de alunos e para a criação de melhores conjuntos de dados, o que pode ajudar os pesquisadores a entender melhor os fatores de risco individuais, identificar o papel dos genes nas doenças e desenvolver intervenções mais precisas.
Movendo-se entre as Disciplinas
Em Arpawong, professor assistente de pesquisa de gerontologia e diretor do Núcleo de Gerontologia Bioinformática, procura reunir diversas informações para compreender melhor como os componentes genéticos e ambientais interagem para resultar em diferentes resultados de saúde em idosos. Seu trabalho atual integra o uso de abordagens de modelagem genômica e de gêmeos e famílias de grandes conjuntos de dados que representam centenas de milhares de indivíduos ao longo de muitas décadas, como o U.S. Health and Retirement Study e o Project Talent Aging Study, ambos abrangendo décadas de acompanhamento com dezenas de milhares de participantes.
Arpawong diz que estudar o envelhecimento é algo único no campo da pesquisa em saúde porque há muitas coisas que acontecem no início da vida e afetam a trajetória de uma pessoa mais tarde.
"Eu adoto uma abordagem de desenvolvimento ao longo da vida para estudar os efeitos de condições de vida anteriores sobre a saúde na velhice, incluindo genética, comportamentos e fatores contextuais, como status socioeconômico e adversidade familiar, " ela diz, "e isso exige a junção de muitos dados."
Trabalhar em projetos como a criação de um índice de fragilidade, desenvolver uma varredura genômica para sintomatologia depressiva em adultos mais velhos, calcular como os fatores genéticos e ambientais contribuem para as mudanças cognitivas relacionadas ao envelhecimento e avaliar a estabilidade dos marcadores de ressonância magnética para demência requer muitas habilidades em diferentes áreas - e colaboração. Há uma camada extra de complexidade quando os pesquisadores precisam traduzir as descobertas de estudos de marcadores genéticos em animais para humanos.
"O foco do meu trabalho com o Bioinformatics Core é a tradução, ou colaborar com pessoas na tradução, de suas descobertas de sistemas modelo, como camundongos, em dados da população humana, "diz Arpawong.
É um processo um pouco circular:muitas vezes, os pesquisadores usam dados de humanos para observar o impacto das descobertas dos sistemas de modelos animais. Depois de encontrarem algumas coisas nos dados humanos, eles voltam e fazem esses experimentos nos modelos animais para ver se existem alguns mecanismos causais. Esta exploração baseada em dados abre muitas novas maneiras de entender o envelhecimento, porque não é possível fazer esses tipos de estudos de gerontologia translacional e integrativa apenas em humanos, dada a nossa longa expectativa de vida e ambientes de vida muito diferentes.
"[Esta tradução] tornou-se uma grande parte do trabalho aqui em Gerontologia que tem sido fascinante e está ajudando a acelerar o ritmo das descobertas de pesquisa em disciplinas que tradicionalmente funcionaram de forma mais independente, "Arpawong diz.
O trabalho se tornou naturalmente colaborativo, envolvendo muitos investigadores diferentes com experiências diversas.
"Há muitos cruzamentos em departamentos diferentes e vários benefícios de trabalhar com o pessoal do Dornsife College, Escola de Medicina Keck e Instituto de Ciências da Informação, incluindo da psicologia à biologia computacional, "explica Arpawong." É realmente uma teia emaranhada em toda a USC. Apenas aponta para toda a natureza transdisciplinar deste trabalho. Você precisa conversar e trabalhar com muitas pessoas para ter certeza de que está indo na direção certa. "
Arpawong recentemente usou diversos conjuntos de dados para encontrar a conexão entre genética e memória verbal. Ela descobriu que um marcador genético da doença de Alzheimer não estava sozinho - há um segundo gene que desempenha um papel específico nos efeitos sobre a capacidade de memória relacionada ao envelhecimento.
O big data também mudou a maneira como as pessoas colaboram, diz Eileen Crimmins, Professor da USC University e AARP Professor de Gerontologia. Nenhum pesquisador pode conhecer todas as partes de um projeto, Ela explica.
“Existem muitos grupos multidisciplinares maiores onde todos têm uma especialização e ninguém sabe tudo, "ela diz." Portanto, há muito mais confiança nas pessoas que elas sabem e podem fazer isso direito. "
Todos esses dados exigem soluções mais recentes para hospedagem e transferência, especialmente ao trabalhar com diferentes pesquisadores ao redor do globo.
"A escala é muito maior naquilo com que temos que lidar e [na] frequência e na necessidade de transferir essas coisas, mantendo a segurança dos dados, e ter as ferramentas disponíveis para fazer isso, "diz Arpawong." Muitas das análises de dados que precisamos fazer requerem a codificação em diferentes linguagens de programação para as quais alguns dos softwares estatísticos mais comuns não têm capacidade, e armazenar os dados de maneiras que vão além do próprio disco rígido. "
A educação também deve corresponder aos mais recentes desenvolvimentos na ciência de big data, exigindo que os alunos sejam proficientes em codificação, orientado por dados e capaz de fazer novas perguntas sobre a ciência do envelhecimento. Big data mudou o jogo para estudantes de graduação, diz Crimmins, que dirige o Programa de Treinamento em Pesquisa Multidisciplinar em Gerontologia da Escola Leonard Davis da USC. O programa ajuda os alunos pré e pós-doutorais a se familiarizarem com o estudo do envelhecimento em várias disciplinas.
"Há muito mais atividade multidisciplinar porque as questões realmente mudaram, "Crimmins explica.
Os alunos de hoje estão constantemente adquirindo novos conjuntos de habilidades e conhecimentos, da patologia da poluição do ar à genética, além de seus estudos fundamentais em gerontologia. Muito do que as pessoas estão fazendo é aprender no trabalho para adquirir habilidades que não são ensinadas em sala de aula, Arpawong acrescenta.
Para alunos que entram no campo, compreender estatísticas e ter um bom domínio de numeramento é crucial. Em sua classe, Jacobson apresenta alguns "dados estranhos", por exemplo, por que a média de um conjunto de dados pode ser muito maior do que a mediana.
"Se você pensar na renda média nos EUA em oposição à mediana, que pode nos dizer algo sobre os americanos em geral, "ela diz." Em certo sentido, o big data disponível deve nos forçar a voltar ao básico e ver os fundamentos. "
A competência de codificação também está no centro das ferramentas que os novos pesquisadores usam no campo - e às vezes isso requer codificação em vários idiomas.
Ajustando-se para o futuro
A disponibilidade e os tipos de dados só aumentarão no futuro, e os pesquisadores estão pensando em como ajustar seus estudos para abrir espaço para novas informações. Crimmins é co-investigador do Health and Retirement Study, que vem acontecendo há cerca de 30 anos. O estudo é realizado a cada dois anos, metade pessoalmente e metade ao telefone. Desde 2006, os pesquisadores coletaram biomarcadores de pessoas que visitam pessoalmente - métricas como peso e altura, pressão arterial e uma amostra de sangue.
Essas métricas permitirão que os pesquisadores façam associações maiores nos dados existentes - e também diminuem os outros dados na análise. "Dois milhões de marcadores para cada pessoa, e temos 20, 000 pessoas no estudo, "Crimmins diz." Realmente requer computação de alta capacidade. "
Usando dados do Health and Retirement Study, O Crimmins fez várias descobertas surpreendentes. Uma é que as pessoas estão realmente tendo mais anos de boa saúde cerebral depois dos 65 anos do que no passado. Outro estudo dos dados descobriu que a educação dá às pessoas uma vantagem em seus anos posteriores, ajudando-os a manter a demência sob controle e suas memórias intactas. A coleta de biomarcadores de participantes do estudo também permitiu o ex-aluno Morgan Levine '08 do USC Leonard Davis, Ph.D. '15 e Crimmins para desenvolver um método promissor de medição biológica, em oposição à cronológica, era. Seu trabalho resultou em descobertas que mostram que os americanos podem estar envelhecendo mais lentamente do que há duas décadas.
A USC surgiu como uma universidade produtora de dados. É necessário muito trabalho para incentivar o uso de dados, tornando-os disponíveis e em um formato utilizável, Crimmins diz. Isso representa uma grande parte do que ela faz:prestar serviço para o campo mais amplo.
"É algo esperado em nosso campo para aqueles de nós que são produtores de dados, o que é importante aqui na USC porque produzimos muitos conjuntos de dados internacionais, " ela diz.
O big data está quebrando os limites tradicionais entre os campos, diz Arpawong. Os resultados mais fortes provavelmente virão de uma mistura de diferentes tipos de dados - por exemplo, faturamento e imagens médicas, ou genômica e dados ambientais.
"Você precisa dividi-lo em partes. Você precisa de pessoas que saibam como manipular os dados para conseguir o que você deseja - e é muito matizado para cada parte, "diz ela." Você pode obter resultados de qualquer maneira que codifique algo, mas está correto? E um grande problema para a bioinformática é garantir que as pessoas sejam treinadas nesses tipos de recursos de dados para ter certeza de que estão fazendo o que pretendem fazer. "
O Reitor da Escola USC Leonard Davis Pinchas Cohen concorda que, no ambiente de pesquisa moderno de hoje, aproveitar dados de uma variedade de fontes é tão importante quanto compreender as funções celulares. Em seu próprio laboratório, ele está liderando estudos baseados em big data para identificar genes mitocondriais até então desconhecidos, trabalhando para entender suas funções e se eles podem ser alvos de tratamentos para Alzheimer, diabetes e outras doenças.
"Em vez de uma mentalidade de tamanho único, a era dos big data nos permite ter uma abordagem do século 21 para abordar o risco de doenças e promover o envelhecimento saudável com um conhecimento profundo dos fatores de risco de um indivíduo, "Cohen diz." A ciência não se trata mais de olhar em um microscópio no próprio laboratório; trata-se de olhar para fora, para dados de milhões de pessoas em todo o mundo. "