• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Como encontrar o centróide em uma análise de agrupamento

    A análise de agrupamento é um método de organizar dados em grupos representativos com base em características semelhantes. Cada membro do cluster tem mais em comum com outros membros do mesmo cluster do que com membros dos outros grupos. O ponto mais representativo dentro do grupo é chamado de centróide. Normalmente, essa é a média dos valores dos pontos de dados no cluster.

    Organize os dados. Se os dados consistirem em uma única variável, um histograma pode ser apropriado. Se duas variáveis ​​estiverem envolvidas, represente graficamente os dados em um plano de coordenadas. Por exemplo, se você estiver observando a altura e o peso das crianças em idade escolar em uma sala de aula, trace os pontos de dados de cada criança em um gráfico, com o peso sendo o eixo horizontal e a altura como o eixo vertical. Se mais de duas variáveis ​​estiverem envolvidas, matrizes podem ser necessárias para exibir os dados.

    Agrupe os dados em clusters. Cada cluster deve consistir nos pontos de dados mais próximos a ele. No exemplo de altura e peso, agrupe todos os pontos de dados que pareçam estar próximos. O número de clusters e se cada ponto de dados deve estar em um cluster pode depender dos propósitos do estudo.

    Para cada cluster, adicione os valores de todos os membros. Por exemplo, se um cluster de dados consistisse nos pontos (80, 56), (75, 53), (60, 50) e (68,54), a soma dos valores seria (283, 213).

    Divida o total pelo número de membros do cluster. No exemplo acima, 283 dividido por quatro é 70,75 e 213 dividido por quatro é 53,25, portanto, o centróide do cluster é (70,75, 53,25).

    Faça um gráfico dos centróides do cluster e determine se os pontos estão mais próximos para um centróide de outro cluster do que para o centróide de seu próprio cluster. Se algum ponto estiver mais próximo de um centróide diferente, redistribua-o ao cluster que contém o centróide mais próximo.

    Repita os passos 3, 4 e 5 até que todos os pontos de dados estejam no cluster contendo o centróide ao qual eles estão mais próximos

    Dica

    Se o centroide tem que ser um ponto particular de dados em vez de um ponto médio entre os dados, então a mediana pode ser usada para determiná-lo, ao invés da média.

    © Ciência https://pt.scienceaq.com