Análises bivariadas e multivariadas são métodos estatísticos que ajudam a investigar as relações entre amostras de dados. A análise bivariada analisa dois conjuntos de dados pareados, estudando se existe uma relação entre eles. A análise multivariada usa duas ou mais variáveis e análises que, se houver, estão correlacionadas com um resultado específico. O objetivo no último caso é determinar quais variáveis influenciam ou causam o resultado.
Análise Bivariada
A análise bivariada investiga a relação entre dois conjuntos de dados pareados. Os dois conjuntos de dados são pareados porque um par de observações é obtido de uma única amostra ou indivíduo, mas cada amostra é independente. Os dados são analisados, usando ferramentas como testes t e testes qui-quadrado, para ver se os dois grupos de dados se correlacionam entre si e, se as variáveis são quantitativas, elas são geralmente representadas graficamente em um gráfico de dispersão. A análise bivariada também examina a força de qualquer correlação.
Exemplos de análise bivariada
Um exemplo de análise bivariada é uma equipe de pesquisa registrando a idade do marido e da mulher em um único casamento. Esses dados são pareados porque as duas idades vêm do mesmo casamento, mas independentes porque a idade de uma pessoa não causa a idade de outra pessoa. Os dados são plotados, mostrando uma correlação nos dados: os maridos mais velhos têm esposas mais velhas. Um segundo exemplo é registrar as medidas de força de preensão e força de braço de indivíduos. Os dados são pareados porque ambas as medições vêm de uma única pessoa, mas independentes porque diferentes músculos são usados. Os dados são plotados a partir de muitos indivíduos, mostrando uma correlação: as pessoas com maior força de preensão têm maior força do braço.
Análise multivariada
Análise multivariada analisa várias variáveis para ver se um ou mais deles são preditivos de um determinado resultado. As variáveis preditivas são consideradas variáveis independentes e o resultado é a variável dependente. As variáveis podem ser contínuas, o que significa que podem ter um intervalo de valores ou podem ser dicotômicas, o que significa que elas representam a resposta para uma pergunta sim ou não. A análise de regressão múltipla é o método mais comumente utilizado na análise multivariada para encontrar correlações entre os conjuntos de dados, mas muitos outros, como a regressão logística e análise de variância multivariada, também são utilizados.
Exemplo de Análise Multivariada < A análise multivariada foi usada por pesquisadores em um estudo de 2009 da Journal of Pediatrics para investigar se eventos negativos da vida, ambiente familiar, violência familiar, violência na mídia e depressão são preditores de agressão e assédio moral de jovens. Eventos negativos da vida, ambiente familiar, violência familiar, violência na mídia e depressão foram as variáveis preditoras independentes. Agressão e bullying foram as variáveis de resultado dependentes. Mais de 600 sujeitos, com idade média de 12 anos, receberam questionários que determinaram as variáveis preditoras para cada criança. Foi também feita uma pesquisa que determinou as variáveis de resultado para cada criança. Equações de regressão múltipla e modelagem de equações estruturais foram usadas para estudar o conjunto de dados. Eventos negativos da vida e depressão foram os mais fortes indicadores de agressão juvenil.