解释变量和控制变量

如题所述

第1个回答  2022-07-09
在传统计量当中,控制变量和解释变量的地位通常不做特别区分。然而在因果研究的框架下,对二者的要求有显著的不同。

在研究当中,解释变量是我们所关注的“因”。对于这个因,必需确保其因果链足够单纯(因与果不是第三方的共同结果,同时,因果两项不是某控制变量的共同原因)。控制变量不能是因果链中的中介,因为控制了中介,因就无法有效地影响果,也不能是因果的共同结果,在共同结果的影响下,我们无法判断因果间的关系链条还是否是二者间的纯粹联系。

在OLS模型假定中要求无内生性,即要求所有解释变量均与扰动项不相关。这个假定太强,因为解释变量一般很多,要保证都是外生,比较困难。当解释变量可以区分为核心变量与控制变量两类时,可以弱化该条件。

通常,回归方程中有一个 “核心变量” 或 “感兴趣的变量”,我们特别希望得到对其系数的一致估计,并将其解释为核心变量对于被解释变量的因果效应。对于方程中的其他变量,我们可能对于这些变量本身并无太大兴趣,之所以把它们也放入回归方程,主要是为了 “控制住” 那些对被解释变量有影响的遗漏因素,以避免遗漏变量偏差,故称这些次要变量为 “控制变量” 。

对于控制变量本身并不感兴趣,或许就可以容忍对于控制变量系数的不一致估计,而只要核心变量的系数估计一致即可。此时,就可以不要求控制变量外生(即允许控制变量与扰动项相关),而只要在给定控制变量的条件下,核心变量与扰动项不相关即可。换言之,只要求核心变量与扰动项在某种意义上 “条件不相关” 即可。

此“条件不相关”一般以“条件均值独立”的形式给出,在相互独立和不相关中间,有个均值独立。

关于条件均值独立

“条件均值独立” 即 “均值独立” 的基础上加了一个条件。

条件均值的效果:

对于非线性的条件期望

参考资料:

1. 新派学者主张的初等计量经济学教学 | 五个重要知识点
2. 再论OLS:核心变量与控制变量的区别
相似回答