Uma nova pesquisa descreve uma única rede neural que pode coletar dados ausentes de um paciente e adicioná-los ao seu gráfico. Crédito:MIT News
Os pesquisadores do MIT desenvolveram um modelo que pode assimilar vários tipos de dados de saúde de um paciente para ajudar os médicos a tomar decisões com informações incompletas.
O campo da "análise preditiva" é promissor para muitos aplicativos de saúde. Modelos de aprendizado de máquina podem ser treinados para procurar padrões nos dados do paciente para prever o risco de um paciente de doença ou morte na UTI, para ajudar no tratamento da sepse, ou para projetar regimes de quimioterapia mais seguros.
O processo envolve a previsão de variáveis de interesse, como risco de doença, de variáveis conhecidas, como sintomas, dados biométricos, testes de laboratório, e varreduras corporais. Contudo, que os dados do paciente podem vir de várias fontes diferentes e geralmente estão incompletos. Por exemplo, pode incluir informações parciais de pesquisas de saúde sobre bem-estar físico e mental, misturado com dados altamente complexos que compreendem medições da função cardíaca ou cerebral.
Usar o aprendizado de máquina para analisar todos os dados disponíveis pode ajudar os médicos a diagnosticar e tratar melhor os pacientes. Mas a maioria dos modelos não consegue lidar com dados altamente complexos. Outros não conseguem capturar o escopo completo das relações entre as diferentes variáveis de saúde, por exemplo, como os padrões de respiração ajudam a prever as horas de sono ou os níveis de dor.
Em um artigo apresentado na Conferência AAAI sobre Inteligência Artificial na próxima semana, Os pesquisadores do MIT descrevem uma única rede neural que recebe como entrada dados simples e altamente complexos. Usando as variáveis conhecidas, a rede pode então preencher todas as variáveis ausentes. Dados dados de, dizer, sinal de eletrocardiografia (ECG) de um paciente, que mede a função cardíaca, e nível de fadiga auto-relatado, o modelo pode prever o nível de dor do paciente, que o paciente pode não se lembrar ou relatar corretamente.
Testado em um conjunto de dados de estudo do sono real - que continha pesquisas de saúde, e ECG e outros sinais complexos - a rede alcançou 70 a 80 por cento de precisão na previsão de qualquer uma das oito variáveis ausentes, com base nas sete outras variáveis conhecidas.
A rede funciona costurando vários submodelos, cada um adaptado para descrever uma relação específica entre as variáveis. Os submodelos compartilham dados à medida que fazem previsões, e, por fim, produzir uma variável de destino prevista. "Temos uma rede de modelos que se comunicam entre si para prever o que não sabemos, usando as informações que conhecemos desses diferentes tipos de dados, "diz o autor principal Hao Wang, pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL). "Se você tem, dizer, oito tipos diferentes de dados, e eu tenho informações completas sobre um paciente de sete anos, a comunicação entre os modelos nos ajudará a preencher as lacunas que faltam no oitavo tipo de dados dos outros sete tipos. "
Juntando-se a Wang no papel estão Chengzhi Mao, um estudante de graduação na Universidade Tsinghua; CSAIL Ph.D. os alunos Hao He e Mingmin Zhao; Dina Katabi, o professor Andrew e Erna Viterbi de Engenharia Elétrica e Ciência da Computação no MIT e diretor do Centro de Redes Sem Fio e Computação Móvel do MIT; e Tommi S. Jaakkola, o professor Thomas Siebel do Departamento de Engenharia Elétrica e Ciência da Computação e do Institute for Data, Sistemas, e sociedade.
Previsões bidirecionais
Usar modelos tradicionais de aprendizado de máquina para analisar o número de variáveis que a rede de pesquisadores pode manipular é praticamente inviável, porque o número de modelos aumenta exponencialmente com o número de variáveis.
"Nós perguntamos, 'É possível projetar um único modelo que pode usar todos esses grupos de dados, apesar do fato de que em cada grupo temos informações diferentes? '”, diz Wang.
A principal inovação foi dividir a rede em submodelos individuais, cada um adaptado para se ajustar a um tipo diferente de dados de entrada. Uma rede neural é uma rede interconectada de nós que trabalham juntos para processar dados complexos. Um nó faz cálculos relativamente simples antes de enviar a saída para o próximo nó. Em redes com submodelos, Contudo, cada nó pode funcionar como uma rede separada que pode lidar com cálculos mais complexos. Submodelos podem ser muito mais eficientes, dependendo da aplicação.
Em seu trabalho, os pesquisadores criaram um submodelo probabilístico para cada saída variável. Eles também desenvolveram uma técnica para permitir que os submodelos se comuniquem uns com os outros enquanto fazem previsões, chamadas Redes de Inferência Bidirecional (BIN). Essa técnica alavanca uma técnica de treinamento de rede neural conhecida como retropropagação. Em treinamento, backpropagation envia erros de computação de volta pelos nós para atualizar os valores dos parâmetros da rede. Mas essa técnica nunca é usada em testes, especialmente quando há dependências condicionais complexas envolvidas. Em vez de, em testes tradicionais, os dados inseridos são processados de nó a nó em uma direção, até que um nó final no final da sequência produza uma previsão.
Os pesquisadores programaram sua rede para usar tanto o método tradicional quanto a retropropagação durante os testes. Nesse contexto, backpropagation é basicamente pegar uma saída variável, em seguida, prevendo uma entrada dessa saída, e enviar o valor de entrada para um nó anterior. Isso cria uma rede onde todos os submodelos estão trabalhando juntos e co-dependentes uns dos outros, para gerar uma probabilidade alvo.
Preenchendo os espaços em branco
Os pesquisadores treinaram sua rede no conjunto de dados do mundo real Sleep Heart Health Study 2 (SHHS2). Os dados incluem leituras de eletroencefalografia (EEG), que medem a função cerebral; ECG; e sinais de padrão de respiração. Também inclui informações de uma pesquisa de saúde para medir oito variáveis de saúde, incluindo bem-estar emocional, funcionamento social, e energia / fadiga - classificados em uma escala de 0 a 100.
Em treinamento, a rede aprende padrões de como cada variável pode afetar outra. Por exemplo, se alguém prender a respiração por longos períodos, eles podem estar tensos, o que pode indicar dor física. Em teste, a rede é capaz de analisar os relacionamentos para prever qualquer uma das oito variáveis, com base em qualquer uma das outras informações, com precisão de 70 a 80 por cento.
A rede pode ajudar a quantificar variáveis de saúde às vezes ambíguas para pacientes e médicos, tais como níveis de dor e fadiga. Quando os pacientes dormem após a cirurgia, por exemplo, eles podem acordar no meio da noite com dor, mas pode não se lembrar de um nível de dor apropriado no dia seguinte.
Próximo, os pesquisadores esperam implementar a rede como um componente de software para um dispositivo que eles construíram, chamado de rádio EQ, que pode rastrear a respiração e a frequência cardíaca de alguém usando apenas sinais sem fio. Atualmente, o dispositivo analisa essas informações para inferir se alguém está feliz, nervoso, ou triste. Com a rede, o dispositivo pode fazer previsões continuamente atualizadas sobre a saúde de um paciente, passivamente, dada apenas informações parciais. "Isso poderia ser muito útil em instalações de vida assistida, onde os médicos podem monitorar as dimensões emocionais e físicas da saúde de um paciente o dia todo, todos os dias, "Wang diz.
Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.