A regressão múltipla é usada para examinar a relação entre várias variáveis independentes e uma variável dependente. Embora os modelos de regressão múltipla permitam analisar as influências relativas dessas variáveis independentes ou preditoras na variável dependente ou critério, esses conjuntos de dados, muitas vezes complexos, podem levar a conclusões falsas, caso não sejam analisados adequadamente. h2> Exemplos de Regressão Múltipla
Um agente imobiliário pode usar regressão múltipla para analisar o valor das casas. Por exemplo, ela poderia usar como variáveis independentes o tamanho das casas, suas idades, o número de quartos, o preço médio das casas no bairro e a proximidade das escolas. Plotando estes em um modelo de regressão múltipla, ela poderia então usar esses fatores para ver sua relação com os preços das casas como a variável de critério.
Outro exemplo de usar um modelo de regressão múltipla poderia ser alguém em recursos humanos determinando o salário dos cargos de gestão - a variável critério. As variáveis preditoras podem ser a antiguidade de cada gerente, o número médio de horas trabalhadas, o número de pessoas gerenciadas e o orçamento departamental do gerente.
Vantagens da Regressão Múltipla |
Existem duas vantagens principais: análise de dados usando um modelo de regressão múltipla. A primeira é a capacidade de determinar a influência relativa de uma ou mais variáveis preditoras no valor do critério. O corretor de imóveis pode achar que o tamanho das casas e o número de quartos têm uma forte correlação com o preço de uma casa, enquanto a proximidade com as escolas não tem nenhuma correlação, ou mesmo uma correlação negativa se for basicamente uma aposentadoria. comunidade.
A segunda vantagem é a capacidade de identificar outliers ou anomalias. Por exemplo, ao revisar os dados relacionados aos salários dos gerentes, o gerente de recursos humanos poderia descobrir que o número de horas trabalhadas, o tamanho do departamento e seu orçamento tinham uma forte correlação com os salários, enquanto a antiguidade não. Alternativamente, poderia ser que todos os valores de predição listados estivessem correlacionados com cada um dos salários que estavam sendo examinados, exceto por um gerente que estava sendo pago em excesso em comparação com os outros.
Desvantagens da Regressão Múltipla | > Qualquer desvantagem de usar um modelo de regressão múltipla geralmente se resume aos dados que estão sendo usados. Dois exemplos disso estão usando dados incompletos e concluindo falsamente que uma correlação é uma causa.
Ao rever o preço das casas, por exemplo, suponha que o corretor de imóveis tenha olhado apenas 10 casas, sete das quais foram compradas. por pais jovens. Nesse caso, a relação entre a proximidade das escolas pode levá-la a acreditar que isso afetou o preço de venda de todas as casas vendidas na comunidade. Isso ilustra as armadilhas de dados incompletos. Se ela tivesse usado uma amostra maior, ela poderia descobrir que, das 100 casas vendidas, apenas 10% dos valores residenciais estavam relacionados à proximidade de uma escola. Se ela tivesse usado a idade dos compradores como um valor preditivo, ela poderia ter descoberto que os compradores mais jovens estavam dispostos a pagar mais pelas casas na comunidade do que os compradores mais velhos.
No exemplo dos salários gerenciais, suponha que houvesse um outlier que tinha um orçamento menor, menos antiguidade e com menos pessoal para gerenciar, mas estava ganhando mais do que qualquer outra pessoa. O gerente de RH pode analisar os dados e concluir que esse indivíduo está sendo pago em excesso. No entanto, essa conclusão seria errônea se ele não levasse em conta que esse gerente era responsável pelo site da empresa e tinha um conjunto de habilidades altamente cobiçado em segurança de rede.