Visualização usando HyperTools para representar o conteúdo dos artigos da Wikipedia. Cada ponto representa um único artigo da Wikipedia (de um conjunto de 3, 000 artigos escolhidos aleatoriamente). As posições dos pontos refletem sobre o que os artigos tratam (os pontos próximos são sobre tópicos semelhantes), e as cores dos pontos refletem "grupos" descobertos automaticamente de artigos sobre temas semelhantes. Crédito:Imagem estática do Laboratório de Dinâmica Contextual, Dartmouth College
Cada conjunto de dados no universo observável tem uma geometria ou forma fundamental, mas essa estrutura pode ser altamente complicada. Para facilitar a visualização de conjuntos de dados complicados, uma equipe de pesquisa de Dartmouth criou o HyperTools - um pacote de software de código aberto que alavanca um conjunto de técnicas matemáticas para obter intuições sobre conjuntos de dados de alta dimensão por meio das estruturas geométricas subjacentes que eles refletem. Os resultados são publicados no Journal of Machine Learning Research .
O HyperTools pode ser usado para transformar dados em formas ou animações visualizáveis, que pode ser usado para:comparar diferentes conjuntos de dados, obter insights sobre os padrões subjacentes de uma forma intuitiva, fazer generalizações entre conjuntos de dados, e desenvolver e testar teorias relacionadas ao Big Data.
"Os conjuntos de dados que enfrentamos como cientistas modernos podem ser extremamente complexos, muitas vezes refletindo muitos componentes de interação, "explica o autor sênior, Jeremy R. Manning, professor assistente de ciências psicológicas e do cérebro e diretor do Laboratório de dinâmica contextual em Dartmouth. "Nossa ferramenta transforma dados complexos em formas 3-D intuitivas que podem ser examinadas e comparadas visualmente. Essencialmente, estamos aproveitando a incrível capacidade do sistema visual de encontrar padrões no mundo ao nosso redor para também encontrar padrões em dados científicos complexos. "
Os pesquisadores demonstram como o HyperTools pode ser aplicado a vários tipos de dados. No papel, eles mostram visualizações de:atividade cerebral, frames do filme e respostas cerebrais ao assistir esses frames; mudanças nas medições de temperatura na superfície da Terra de 1875 a 2013; e o conteúdo temático de tweets políticos emitidos por Hillary Clinton e Donald Trump durante a campanha presidencial de 2016 nos EUA.
O HyperTools gerou a visualização das mudanças de temperatura na superfície da Terra de 1875-2013. A visualização destaca a natureza cíclica (sazonal) das temperaturas globais que ocorre juntamente com um aumento gradual nas temperaturas globais ao longo do tempo. A imagem está entre as incluídas na Figura 1 do artigo de jornal. Crédito:Imagem estática do Laboratório de Dinâmica Contextual, Dartmouth College.
Além de usar o HyperTools para entender diretamente a estrutura geométrica dos dados, os insights revelados pela ferramenta também podem ser usados para orientar o desenvolvimento de algoritmos de aprendizado de máquina. Por exemplo, as visualizações de dados podem revelar como diferentes tipos de observações formam clusters distintos e estruturados (por exemplo, tweets de Trump vs. tweets de Clinton) que podem ser usados para entender as semelhanças e diferenças entre os grupos.
Como parte da caixa de ferramentas do HyperTools, O laboratório de Manning continua a desenvolver e lançar outros tipos de análises de visualização geométrica, incluindo as análises de texto recentemente lançadas.
Visualização usando HyperTools para representar o conteúdo de artigos de periódicos. Cada ponto representa um único artigo publicado em Neural Information Processing Systems (NIPS). As posições dos pontos refletem sobre o que os artigos são (os pontos próximos são sobre tópicos semelhantes), e as cores dos pontos refletem "grupos" descobertos automaticamente de papéis que tratam de temas semelhantes. Crédito:Laboratório de Dinâmica Contextual, Dartmouth College.
Animação 3D de uma visualização usando HyperTools para representar o conteúdo dos artigos da Wikipedia. Crédito:Laboratório de Dinâmica Contextual, Dartmouth College