怎样用stata做毕业论文实证分析———stata内生性检验

1. 内生性的来源
内生性问题 (endogeneity issue) 是指模型中的一个或多个解释变量与误差项存在相关关系。换言之,如果 OLS 回归模型中出现 ,则模型存在内生性问题,以致于 OLS 估计量不再是一致估计。进一步,内生性问题主要由以下四种原因导致。
1.1 遗漏变量
在实证研究中,研究者通常无法控制所有能影响被解释变量的变量,因此遗漏解释变量 (omitted variables) 是很常见的事情。假设 OLS 模型中解释变量为 和 ,研究者遗漏的解释变量为 。
真实模型:
遗漏变量:
如果遗漏的变量 对另一个解释变量 有影响,就会产生内生性问题。
1.2 选择偏差
选择偏差包括两种形式,即样本选择偏差 (sample selection bias) 和自选择偏差 (self-selection bias)。
样本选择偏差是指因样本选择的非随机性导致结论存在偏差,本质上也是一种遗漏变量问题 (Heckman,1979)。如果是采用类似 “抽签” 的随机方式获得的样本,其估计参数能很好地反映总体的性质。如果所抽取的方法不是随机的,那么无论样本容量有多大,根据这些样本数据估计的参数都不能准确反映总体的性质。
Heckma (1979) 在研究样本选择偏差的时候也意识到了自选择问题。他观察到直接比较管理培训生的工资和非培训生的工资也可能导致处理效应的有偏估计。存在自选择问题的模型中,可能存在某些无法观测的变量同时影响了 和 。比如,在研究员工培训对工资的影响时,员工智力水平可能同时影响是否参加培训和员工工资。
相关参考文献:
- Heckman J J. Sample selection bias as a specification error[J]. Econometrica: Journal of the econometric society, 1979: 153-161. -PDF-
1.3 双向因果
经济变量通常是相互依赖的,或者说是互为因果。上述现象也会导致内生性问题。比如,在估计需求曲线时,价格 是需求模型中的内生解释变量。
1.4 测量误差
当模型使用数据和真实数据存在误差,且满足 CEV 假定时,则会影响估计量的一致性,产生内生性问题。当只有一个解释变量时,CEV 假定下的测量误差将导致 OLS 估计量产生向 0 的偏误,也称为衰减偏误。当模型存在多个解释变量时,其中一个解释变量的测量误差导致 OLS 估计量发生方向不确定的偏移。
2. 内生性的解决方法
如果需要论文指导,可联系网站客服!
学员评价

- 上一篇:手把手教你写论文1|引言怎么写?
- 下一篇:没有了