Com cada notícia, os conceitos de mineração de dados de informações sobre saúde ocupam um lugar ainda mais alto na agenda de pesquisas e políticas nessa área. As informações clínicas e os dados genéticos contidos nos registros eletrônicos de saúde (EHRs) representam uma importante fonte de informações úteis para a pesquisa biomédica, mas acessá-las de maneira útil pode ser difícil.
Escrevendo no International Journal of Intelligent Engineering Informatics, Hassan Mahmoud e Enas Abbas da Benha University e Ibrahim Fathy Ain Shams University, No Egito, discuta a necessidade de métodos inovadores e eficazes para representar essa enorme quantidade de dados. Eles ressaltam que existem técnicas de mineração de dados, bem como técnicas baseadas em ontologia, que podem desempenhar um papel importante na detecção de síndromes em pacientes com eficiência e precisão. Uma síndrome é definida como um conjunto de sintomas médicos concomitantes e indicadores associados a uma determinada doença ou distúrbio.
A equipe revisou o estado da arte e também se concentrou na revisão das técnicas de mineração de dados bem conhecidas, como árvores de decisão (J48), Baías ingénuas, perceptron multicamadas (MLP), e técnicas de floresta aleatória (RF) e comparou o quão bem cada uma desempenha na classificação de uma síndrome particular, doença cardíaca.
A equipe conclui que, em experimentos com um conjunto de dados públicos, o classificador RF oferece o melhor desempenho em termos de precisão. No futuro, eles sugerem que a mineração de dados beneficiará a saúde e a medicina de forma significativa para a construção de um sistema capaz de detectar uma síndrome específica.