A busca da ciência por “mecanismos causais” ou como explicar o mundo ao nosso redor

*escrito com Guilherme Magacho

Quem tem colesterol alto costuma ser mais gordo. Há uma correlação alta entre gordura e colesterol. Podemos dizer que gordura causa colesterol? Ou vice versa? Não. Sedentarismo por exemplo também tem uma correlação alta com gordura; então talvez o sedentarismo cause a gordura e também cause colesterol alto. Uma alimentação saudável tem correlação negativa com sedentarismo, gordura e colesterol alto. Então talvez possamos dizer que esta evita todos os outros. Poderíamos ainda dizer que hábitos saudáveis causam o bom funcionamento de todos os órgãos do corpo humano e isso causa baixo colesterol. Poderíamos até dizer que o colesterol antecede a gordura (em medidas de séries temporais), ou ainda que a gordura antecede o colesterol. Mas isso também não ajuda muito nossa vida. Gostaríamos mesmo é de saber o “mecanismo causal” (modelo) por trás de tudo isso! A busca na ciência é por mecanismos causais que nos explicam como o mundo funciona. As correlações e regressões ajudam, mas são apenas pistas na caça ao tesouro do “mecanismo que explica o funcionamento de um sistema real” (modelo).

Em econometria:

Estratégia de identificação é a maneira pela qual um pesquisador usa dados observacionais (isto é, dados não gerados por um estudo randomizado) para aproximar um experimento real. “Causation ≠ Association” O “problema de identificação” refere-se à dificuldade de separar a causalidade da associação (correlação). Como o problema fundamental da inferência causal é um problema de dados omitidos (não sabemos quem causou quem) precisamos fazer suposições para tentar entender o que ocorre nos dados!

Embora duas variáveis possam estar correlacionadas, isso não significa necessariamente que a primeira cause a segunda ou vice-versa. Para se analisar se uma variável causa a outra, uma metodologia econométrica consagrada é a da utilização de variáveis instrumentais. Resumidamente, esse processo passa por encontrar alguma terceira variável que explique uma das variáveis que busca-se analisar e, com base nisso, se identifica apenas os efeitos decorrentes de mudanças nessa terceira variável. Arellano e Bond, em 1991, desenvolveram uma metodologia que foi estendida por Arellano e Bond, em 1995, para se identificar variáveis instrumentais em painéis dinâmicos. Os autores verificaram que as variáveis em diferenças poderiam ser utilizadas como instrumento para as variáveis defasadas e, se não houvesse um problema de não ortogonalidade, esses instrumentos poderiam ser utilizados para se verificar uma relação de causalidade entre duas variáveis. Essencialmente, esse método, que é muito útil para painéis em que a série de tempo é curta se comparada ao número de indivíduos, e que ficou conhecido como System-GMM, permite identificar qual variável causa a outra mesmo no caso de haver uma dupla causalidade, ou seja, mesmo no caso delas serem endógenas.

Aula Khan Academy:

https://pt.khanacademy.org/math/probability/scatterplots-a1/creating-interpreting-scatterplots/v/correlation-and-causality

Milton Friedman’s Stance: The Methodology of Causal Realism

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=902062

abductive arguments:

https://www.khanacademy.org/partner-content/wi-phi/wiphi-critical-thinking/wiphi-fundamentals/v/abductive-arguments

correlation x causation:

https://www.khanacademy.org/partner-content/wi-phi/wiphi-critical-thinking/wiphi-fundamentals/v/critical-thinking-fundamentals-correlation-and-causation

Causal inference:

https://www.youtube.com/watch?v=Sqy_b5OSiXw

Granger causality:

https://www.youtube.com/watch?v=6dOnNNxRJuY

Instruments

https://www.youtube.com/watch?v=4xF_DMbL14w

GMM estimation:

https://www.youtube.com/watch?v=KYHQdKS11Gs

Ótimo debate:

https://youtu.be/NYVWSGU2D5c

Deixe uma resposta