Você pensaria agora que poderíamos dizer inequivocamente o que causa o quê. Mas a questão da causa, que tem assombrado a ciência e a filosofia desde seus primeiros dias, ainda persegue nossos calcanhares por várias razões. Os humanos são evolutivamente predispostos a ver padrões e psicologicamente inclinados a coletar informações que apóiem visões pré-existentes, um traço conhecido como viés de confirmação . Nós confundimos coincidência com correlação e correlação com causalidade.
Para A causar B, tendemos a dizer isso, no mínimo, A deve preceder B, os dois devem covar (variar juntos), e nenhuma explicação concorrente pode explicar melhor a covariância de A e B. Tomada isoladamente, Contudo, esses três requisitos não podem provar a causa; eles são, como dizem os filósofos, necessário, mas não suficiente. Em todo o caso, nem todos concordam com eles.
Falando de filósofos, David Hume argumentou que a causalidade não existe em nenhum sentido comprovável. Karl Popper e os Falsificacionistas sustentaram que não podemos provar um relacionamento, apenas refute isso, o que explica por que as análises estatísticas não tentam provar uma correlação; em vez de, eles apresentam um duplo negativo e refutam que os dados não estão correlacionados, um processo conhecido como rejeitando a hipótese nula .
Com essas considerações em mente, os cientistas devem projetar e controlar cuidadosamente seus experimentos para eliminar o preconceito, Raciocínio circular, profecias autorrealizáveis e variáveis ocultas. Devem respeitar os requisitos e limitações dos métodos utilizados, tirar amostras representativas, sempre que possível, e não exagerar seus resultados.
Pronto para ler cerca de 10 casos em que isso não foi tão fácil?
As pessoas são um saco para pesquisar. Eles reagem não apenas ao estímulo que você está estudando, mas também ao próprio experimento. Os pesquisadores hoje tentam projetar experimentos para controlar esses fatores, mas nem sempre foi assim.
Veja a Hawthorne Works em Cícero, Ill. Em uma série de experimentos de 1924-1932, pesquisadores estudaram os efeitos da produtividade do trabalhador associados à alteração do ambiente da fábrica de Illinois, incluindo a mudança dos níveis de luz, arrumando o local e movendo as estações de trabalho. Quando eles pensaram que estavam no caminho certo, eles notaram um problema:os aumentos de produtividade observados diminuíram quase assim que os pesquisadores deixaram as obras, indicando que o conhecimento dos trabalhadores sobre o experimento, não as mudanças dos pesquisadores, tinha alimentado o impulso. Os pesquisadores ainda chamam esse fenômeno de Efeito Hawthorne .
Um conceito relacionado, a Efeito John Henry , ocorre quando os membros de um grupo de controle tentam vencer o grupo experimental chutando seus esforços em overdrive. Eles não precisam saber sobre o experimento; eles precisam apenas ver um grupo receber novas ferramentas ou instruções adicionais. Como o lendário homem que dirige aço, eles querem provar suas capacidades e ganhar respeito [fontes:Saretsky; Vogt].
Os personagens titulares do filme de Tom Stoppard "Rosencrantz and Guildenstern Are Dead" começam o filme perplexos, confuso e finalmente assustado quando cada um dos 157 lançamentos consecutivos de uma moeda dá cara. As explicações de Guildenstern sobre esse fenômeno variam de loops de tempo a "uma comprovação espetacular do princípio de que cada moeda individual, girado individualmente, tem a mesma probabilidade de cair cara ou coroa ... "
A evolução conectou os humanos para ver padrões, e nossa capacidade de processar adequadamente esse desejo parece entrar em curto-circuito quanto mais tempo passamos no jogo. Podemos aceitar racionalmente que eventos independentes, como cara ou coroa, mantêm as mesmas chances, não importa quantas vezes você os execute. Mas também vemos esses eventos, menos racionalmente, como listras, fazer falsas correlações mentais entre eventos aleatórios. Vendo o passado como um prelúdio, continuamos pensando que o próximo lance deve ser coroa.
Estatísticos chamam isso de falácia do jogador , também conhecido como o Falácia de Monte Carlo , após um exemplo particularmente ilustrativo ocorrido naquela famosa cidade turística de Mônaco. Durante o verão de 1913, apostadores assistiram com espanto crescente quando a roda da roleta de um cassino pousou no preto 26 vezes consecutivas. Inflamado pela certeza de que o vermelho era "devido, "os apostadores continuaram apostando suas fichas. O cassino fez uma fortuna [fontes:Lehrer; Oppenheimer e Monin; Vogt].
Sem discussão de streaks, o pensamento mágico ou a falsa causação estariam completos sem uma folga nas páginas de esportes. Estelares temporadas de esportes surgem de uma interação tão misteriosa de fatores - habilidade natural, Treinamento, confiança, o fator X ocasional - que imaginamos padrões de desempenho, embora os estudos rejeitem repetidamente o tiro certeiro e as superstições "bem-sucedidas" como algo mais do que imaginário.
A crença em estrias ou quedas implica que o sucesso "causa" o sucesso e o fracasso "causa" o fracasso ou, talvez mais razoavelmente, aquela variação em algum fator comum, como confiança, causa ambos. Mas estudo após estudo falha em confirmar isso [fontes:Gilovich et al .; Tversky e Gilovich]. O mesmo vale para superstições, embora isso não tenha impedido Kevin Rhomberg do Cleveland Indians de se recusar a virar à direita enquanto estava em campo, ou impedir que o centro de Ottawa Senators, Bruce Gardiner, mergulhe seu taco de hóquei no banheiro para evitar uma queda ocasional [fonte:Trex].
A queda do segundo ano, também, normalmente surge de um primeiro ano muito bom. As oscilações de desempenho tendem a se equilibrar no longo prazo, um fenômeno que os estatísticos chamam regressão em direção à média . Em esportes, esta média é auxiliada pela oposição, que se ajusta para contrariar o conjunto de habilidades de sucesso do novo jogador.
Ensaios clínicos randomizados são o padrão ouro em estatísticas, mas às vezes - em epidemiologia, por exemplo - considerações éticas e práticas forçam os pesquisadores a analisar os casos disponíveis. Infelizmente, tal Estudos observacionais viés de risco, variáveis ocultas e, pior de todos, um grupo de estudo que pode não refletir a população como um todo. Estudar uma amostra representativa é vital; permite que os pesquisadores apliquem os resultados a pessoas fora do estudo, Como o resto de nós.
Um caso em questão:terapia de reposição hormonal (TRH). Além de tratar os sintomas associados à menopausa, já foi aclamado por reduzir potencialmente o risco de doença cardíaca coronária (CHD), graças a um estudo observacional de 1991 muito alardeado [fonte:Stampfer and Colditz]. Mas estudos controlados randomizados posteriores, incluindo a Iniciativa de Saúde da Mulher em grande escala, revelou uma relação negativa, ou estatisticamente insignificante, entre HRT e CHD [fontes:Lawlor et al .; New York Times].
Por que a diferença? Por uma coisa, mulheres que usam TRH tendem a vir de estratos socioeconômicos mais altos e recebem melhor qualidade de dieta e exercícios - uma relação explicativa oculta que o estudo observacional não conseguiu explicar totalmente [fonte:Lawlor et al.].
Em 1978, O repórter esportivo e colunista Leonard Koppett zombou da confusão de correlação causal ao sugerir ironicamente que os resultados do Super Bowl poderiam prever o mercado de ações. O tiro saiu pela culatra:não só as pessoas acreditaram nele, mas funcionou - com freqüência assustadora.
A proposta era a seguinte:Se um dos 16 times originais da National Football League - aqueles que existiam antes da fusão da NFL em 1966 com a American Football League - ganhasse o Super Bowl, o mercado de ações fecharia em alta no ano seguinte do que no dia 31 de dezembro anterior. Se uma ex-equipe da AFL ganhasse, iria cair [fontes:Koppett; Koppett; Koppett; Koppett; Zweig].
De 1967 a 1978, O sistema de Koppett passou de 12 para 12; até 1997, ele ostentava uma taxa de sucesso de 95%. Ele tropeçou em 1998 e 1999, quando ex-alunos da AFL, o Denver Broncos venceu e o mercado subiu [fontes:Koppett; Koppett; Koppett; Koppett].
Alguns argumentaram que o padrão existe, impulsionado pela crença; funciona, eles dizem, porque os investidores acreditam que sim, ou porque acreditam que outros investidores acreditam. Esta noção, embora inteligente de uma forma regressiva, dificilmente explica os 12 anos de correlações bem-sucedidas anteriores ao artigo de Koppett. Outros argumentam que um padrão mais relevante reside na tendência de alta em larga escala do mercado de ações, exceto algumas flutuações maiores e menores de curto prazo, e o fato de que um time original da NFL venceu todos os Super Bowl de 1984 a 1998 [fonte:Norris].
Big data - o processo de busca de padrões em conjuntos de dados tão grandes que eles resistem aos métodos tradicionais de análise - gera grande agitação na sala de reuniões atualmente [fonte:Arthur]. Mas maior é sempre melhor?
É uma regra incutida na maioria dos pesquisadores em sua primeira aula de estatísticas:ao encontrar um mar de dados, resistir ao impulso de ir em um expedição de pesca . Com dados suficientes, paciência e liberdade metodológica, correlações são quase inevitáveis, se antiético e amplamente inútil.
Afinal, a mera correlação entre duas variáveis não implica causalidade; nem faz, em muitos casos, apontam para muito de um relacionamento. Por uma coisa, os pesquisadores não podem usar medidas estatísticas de correlação à vontade; cada um contém certas suposições e limitações que as expedições de pesca muitas vezes ignoram, para não falar das variáveis ocultas, problemas de amostragem e falhas de interpretação que podem atrapalhar um estudo mal elaborado.
Garantido, big data tem seus usos. O controle de estoque prospera na descoberta de padrões de compra, por mais misteriosas que sejam suas causas subjacentes. Para dar um exemplo um tanto assustador, A Target usou padrões de compra para identificar clientes grávidas e enviar a elas cupons direcionados [fontes:Duhigg; Colina; Taylor]. Portanto, aproveite esse cartão de recompensas - e 10% de desconto em suas vitaminas pré-natais - mas não espere muito dos grandes dados no departamento de causalidade.
Qualquer questão relacionada com dinheiro está fadada a ser profundamente divisiva e altamente politizada, e os aumentos do salário mínimo não são exceção. Os argumentos são variados e complexos, mas essencialmente um lado afirma que um salário mínimo mais alto prejudica as empresas, que reduz a disponibilidade de trabalho, que fere os pobres. O outro lado responde que há poucas evidências para esta afirmação, e que os 3,6 milhões de americanos trabalhando com ou abaixo do salário mínimo, que alguns argumentam que não é um salário mínimo, beneficiariam de tal aumento. Eles argumentam que, ajustado pela inflação, o salário mínimo federal (US $ 7,25 por hora em dezembro de 2013) desceu vertiginosamente nos últimos 40 anos [fontes:Bureau of Labor Statistics; Irwin].
Como George Bernard Shaw supostamente brincou, "Se todos os economistas fossem colocados de ponta a ponta, eles nunca chegariam a uma conclusão, "e o debate sobre o salário mínimo parece confirmar isso [fonte:Ridgers. Para cada analista que diz que os aumentos do salário mínimo afastam os empregos, há outro que argumenta contra essa correlação [fontes:Baskaya e Rubinstein; Card e Krueger].
No fim, ambos os lados compartilham um problema fundamental, nomeadamente, a abundância de evidências anedóticas em que muitos de seus falantes dependem para obter apoio. Histórias de segunda mão e dados selecionados tornam o chá fraco em qualquer festa, mesmo quando apresentado em gráficos de barras bonitos.
Entre livros, drogas e cirurgias, a perda de peso nos Estados Unidos é uma indústria de US $ 20 bilhões por ano, com 108 milhões de americanos lutando contra a perda de peso a cada ano [fonte:ABC News]. Não surpreendentemente, estudos de perda de peso - bom, ruim ou feio - receba muita publicidade nos EUA
Pegue a ideia popular de que tomar café da manhã vence a obesidade, uma pepita com cobertura de açúcar derivada de dois estudos principais:Um, um estudo controlado randomizado da Universidade Vanderbilt de 1992, mostrou que revertendo os hábitos normais de café da manhã, seja comendo ou não comendo, correlacionado com a perda de peso; o outro, um estudo observacional de 2002 pelo National Weight Control Registry, correlacionou o consumo de café da manhã com os perdedores de peso bem-sucedidos - o que não é o mesmo que correlacioná-lo com a perda de peso [fontes:Brown et al .; O'Connor; Schlundt et al .; Wyatt et al.].
Infelizmente, o estudo NWCR falhou em controlar outros fatores - ou, na verdade, estabelecer qualquer conexão causal a partir de sua correlação. Por exemplo, uma pessoa que quer perder peso pode malhar mais, ou tomar o café da manhã, ou vá proteína de porco inteiro, mas sem um projeto experimental capaz de estabelecer ligações causais, tais comportamentos equivalem a nada mais do que características comumente co-ocorrentes [fontes:Brown et al .; O'Connor].
Um problema semelhante aflige os numerosos estudos que relacionam os jantares em família com uma diminuição do risco de dependência de drogas para os adolescentes. Embora atraente por ser simples, estratégia atraente, esses estudos frequentemente falham no controle de fatores relacionados, como fortes conexões familiares ou profundo envolvimento dos pais na vida de uma criança [fonte:Bialik].
Muitas vezes ouvimos falar que os homens, especialmente homens jovens, são mais propensos a cometer suicídio do que as mulheres. Em verdade, tais declarações participam de generalização empírica - o ato de fazer uma declaração ampla sobre um padrão comum sem tentar explicá-lo - e mascarar uma série de fatores de confusão conhecidos e potenciais.
Leva, por exemplo, o fato de as mulheres fazerem três vezes mais tentativas de suicídio do que os homens. Como então pode existir uma correlação mais alta entre o sexo oposto e o suicídio? A resposta está na taxa de sucesso, influenciada por diferenças na metodologia:as mulheres recorrem a pílulas, enquanto os homens tendem a preferir armas [fonte:O'Connell].
Mesmo se pudéssemos eliminar esses fatores de confusão, o fato continuaria sendo a masculinidade, per se, não é uma causa. Para explicar a tendência, precisamos, em vez disso, identificar fatores comuns aos homens, ou pelo menos suicidas. O mesmo ponto se aplica às taxas comparativamente altas de suicídio relatadas entre homens divorciados. O divórcio não leva os homens ao suicídio; se alguma coisa, a variável causal se esconde entre os fatores relacionados, como isolamento, depressão, uma sensação de impotência, estresse financeiro ou perda de custódia [fontes:Kposowa; Kposowa; Reuters].
Nenhuma lista de correlação / causa estaria completa sem discutir as preocupações dos pais sobre a segurança da vacinação, enraizado na ideia, popularizado por celebridades como Jenny McCarthy, aquele sarampo, As vacinações contra caxumba e rubéola (MMR) estão causalmente associadas aos transtornos do espectro do autismo. Apesar da comunidade médica desmascarar o artigo de Andrew Wakefield de 1998 que inspirou a ideia, e apesar dos estudos subsequentes não mostrarem nenhuma ligação causal, mesmo com múltiplas vacinações, alguns pais continuam temerosos de uma conexão com o autismo ou outros perigos relacionados à vacina [fontes:The Lancet; Parque; Sifferlin; Szabo].
Embora seja verdade que nenhuma vacina é 100 por cento inofensiva, a crença neste vínculo causal surge principalmente da preocupação natural dos pais, sobrecarregado de confusão, alimentado por evidências anedóticas e influenciado por viés de confirmação , ou "se eu não tivesse acreditado, não teria visto". Para aumentar ainda mais a confusão, está o fato de que pais e médicos tendem a reconhecer os sintomas de autismo mais tarde, em torno das idades em que as crianças recebem muitas vacinas. Na atualidade, O início do autismo é bastante complexo e segue mais de um padrão. De fato, estudos agora mostram que o início pode começar tão cedo quanto 6-12 meses [fontes:CDC; Johnson e Schultz; Mandell et al .; NIH; Ozonoff et al.].
Não é um mal-entendido inofensivo. Em 2011, A revista Time relatou que 13 por cento dos pais pularam, atrasou ou dividiu a vacinação de seus filhos; em algumas áreas rurais, esse número subiu para entre 20 e 50 por cento. Enquanto isso, 15 anos depois que esse pânico começou, centros médicos relataram surtos de tosse convulsa e sarampo. Se essa correspondência é coincidência, correlativo ou causal vale a pena considerar [fontes:O'Connor; Parque; Parque].
Publicado originalmente em:23 de dezembro de 2013
Por mais que eu aborreça o design experimental pobre, confiança cega em estatísticas e relatórios científicos sensacionalistas, vale a pena mencionar que fortes correlações, embora não seja o suficiente para provar a causa, frequentemente apontam para áreas que valem a pena investigar. Claramente, por "correlações" não quero dizer autocorrelações, variáveis de confusão ou outros artefatos de projeto ruim ou requisitos e restrições metodológicas mal compreendidos; no entanto, talvez a Internet possa dispensar um pouco o slogan "correlação não implica causalidade", ou pelo menos se tornar um pouco mais seletivo em sua aplicação.