A busca da ciência por “mecanismos causais” ou como explicar o mundo ao nosso redor

*escrito com Guilherme Magacho

Quem tem colesterol alto costuma ser mais gordo. Há uma correlação alta entre gordura e colesterol. Podemos dizer que gordura causa colesterol? Ou vice versa? Não. Sedentarismo por exemplo também tem uma correlação alta com gordura; então talvez o sedentarismo cause a gordura e também cause colesterol alto. Uma alimentação saudável tem correlação negativa com sedentarismo, gordura e colesterol alto. Então talvez possamos dizer que esta evita todos os outros. Poderíamos ainda dizer que hábitos saudáveis causam o bom funcionamento de todos os órgãos do corpo humano e isso causa baixo colesterol. Poderíamos até dizer que o colesterol antecede a gordura (em medidas de séries temporais), ou ainda que a gordura antecede o colesterol. Mas isso também não ajuda muito nossa vida. Gostaríamos mesmo é de saber o “mecanismo causal” (modelo) por trás de tudo isso! A busca na ciência é por mecanismos causais que nos explicam como o mundo funciona. As correlações e regressões ajudam, mas são apenas pistas na caça ao tesouro do “mecanismo que explica o funcionamento de um sistema real” (modelo). O problema da inferência causal na estatística é a dificuldade em estabelecer uma relação de causa e efeito entre variáveis em estudos observacionais. Nesses estudos, os pesquisadores não têm controle total sobre as condições experimentais, o que torna mais desafiador determinar se uma variável causa diretamente uma mudança em outra variável.

Um exemplo comum é o estudo que investiga a relação entre o consumo de café e a incidência de doenças cardíacas. Suponha que, ao analisar um grande conjunto de dados, os pesquisadores observem uma associação entre o consumo de café e um maior risco de doenças cardíacas. No entanto, estabelecer uma relação de causa e efeito entre essas duas variáveis é complexo.

Existem várias questões que podem afetar a inferência causal nesse caso:

  1. Confundimento: Outros fatores, como idade, tabagismo ou dieta, podem estar associados tanto ao consumo de café quanto ao risco de doenças cardíacas. Essas variáveis confundidoras podem distorcer a verdadeira relação causal. Por exemplo, se os bebedores de café também tendem a ser fumantes, é possível que o fumo seja a verdadeira causa do aumento do risco de doenças cardíacas, e não o café em si.

  2. Causalidade reversa: Pode haver uma relação inversa, onde o risco de doenças cardíacas leva as pessoas a consumir menos café. Nesse caso, a relação observada pode ser uma consequência da doença, em vez de uma causa.

  3. Viés de seleção: Se os participantes do estudo não forem selecionados de forma aleatória ou representativa, pode haver um viés de seleção que afeta a inferência causal. Por exemplo, se o estudo for realizado apenas em uma determinada faixa etária, pode não ser possível generalizar as conclusões para outras faixas etárias.

  4. Viés de informação: Erros na medição das variáveis, como subestimar o consumo de café ou falhas na identificação de casos de doenças cardíacas, podem introduzir um viés de informação. Isso pode levar a estimativas enviesadas do efeito causal.

Para lidar com esses desafios, os pesquisadores usam técnicas estatísticas avançadas, como ajustes para variáveis confundidoras, análise de sensibilidade, métodos de emparelhamento ou pontuação de propensão e análises de sensibilidade. Além disso, a replicação de estudos e a combinação de resultados de diferentes estudos podem ajudar a fortalecer a inferência causal.

Em resumo, o problema da inferência causal na estatística surge devido às limitações dos estudos observacionais e às dificuldades em estabelecer uma relação de causa e efeito. Os pesquisadores devem estar cientes de possíveis fontes de viés e confusão, considerar o contexto e utilizar técnicas adequadas para minimizar esses problemas e aumentar a validade das conclusões.

Estratégia de identificação é a maneira pela qual um pesquisador usa dados observacionais (isto é, dados não gerados por um estudo randomizado) para aproximar um experimento real. “Causation ≠ Association” O “problema de identificação” refere-se à dificuldade de separar a causalidade da associação (correlação). Como o problema fundamental da inferência causal é um problema de dados omitidos (não sabemos quem causou quem) precisamos fazer suposições para tentar entender o que ocorre nos dados! Embora duas variáveis possam estar correlacionadas, isso não significa necessariamente que a primeira cause a segunda ou vice-versa. Para se analisar se uma variável causa a outra, uma metodologia econométrica consagrada é a da utilização de variáveis instrumentais. Resumidamente, esse processo passa por encontrar alguma terceira variável que explique uma das variáveis que busca-se analisar e, com base nisso, se identifica apenas os efeitos decorrentes de mudanças nessa terceira variável. Arellano e Bond, em 1991, desenvolveram uma metodologia que foi estendida por Arellano e Bond, em 1995, para se identificar variáveis instrumentais em painéis dinâmicos. Os autores verificaram que as variáveis em diferenças poderiam ser utilizadas como instrumento para as variáveis defasadas e, se não houvesse um problema de não ortogonalidade, esses instrumentos poderiam ser utilizados para se verificar uma relação de causalidade entre duas variáveis. Essencialmente, esse método, que é muito útil para painéis em que a série de tempo é curta se comparada ao número de indivíduos, e que ficou conhecido como System-GMM, permite identificar qual variável causa a outra mesmo no caso de haver uma dupla causalidade, ou seja, mesmo no caso delas serem endógenas.

Aula Khan Academy:

https://pt.khanacademy.org/math/probability/scatterplots-a1/creating-interpreting-scatterplots/v/correlation-and-causality

Milton Friedman’s Stance: The Methodology of Causal Realism

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=902062

abductive arguments:

https://www.khanacademy.org/partner-content/wi-phi/wiphi-critical-thinking/wiphi-fundamentals/v/abductive-arguments

correlation x causation:

https://www.khanacademy.org/partner-content/wi-phi/wiphi-critical-thinking/wiphi-fundamentals/v/critical-thinking-fundamentals-correlation-and-causation

Apresentação_CLE_simplificado_MVR_EBF_220117_215919

Causal inference:

https://www.youtube.com/watch?v=Sqy_b5OSiXw

Granger causality:

https://www.youtube.com/watch?v=6dOnNNxRJuY

Instruments

https://www.youtube.com/watch?v=4xF_DMbL14w

GMM estimation:

https://www.youtube.com/watch?v=KYHQdKS11Gs

Ótimo debate:

https://youtu.be/NYVWSGU2D5c

Abdução e inferência causal

https://en.m.wikipedia.org/wiki/Causal_reasoning

‪Correlação e causa: basta dormir mais pra ficar mais rico!‬ SQN

Deixe uma resposta