查看原文
其他

老姚专栏丨均值回复及其对实证研究的启示

姚耀军 数据Seminar 2021-06-03

全文共2462个字,细读大约需要7分钟




 一、高尔顿的发现 


弗朗西斯·高尔顿是达尔文的表弟,开创了优生学,认为“龙生龙、凤生凤”,人的智商由遗传决定。测定智商要用到因子分析法,但这一方法在那个时代还未出现。于是,高尔顿决定利用人类身高数据来为优生学提供经验证据。


 

高尔顿首先收集子女身高数据以及其父母平均身高数据,然后画了一个散点图(横坐标是父母平均身高,纵坐标是子女身高)。散点图显示,样本数据基本分布在一条直线上。与优生学的预期相一致,这条直线的斜率大于零,意味着高(矮)个父母一般都有高(矮)个子女。然而,与优生学的预期不一致的是,这条直线的斜率并非接近于1,而是明显小于1。这意味着,对于高(矮)个父母的子女,我们预测其身高将低(高)于父母的平均身高。


如果在期望意义上,高(矮)个父母将有低(高)于他们身高的子女,那么从动态的视角看,人类身高就会向一个均衡值趋近。这个均衡值到底是什么?考虑静态的横截面数据,如果人类身高服从正态分布,那么这个均衡值就是该分布的期望值。如果人类身高向这个期望值趋近,那么统计学认为其具有“均值回复(Mean reversion)”性质。
一个颇具启发性的问题是,从动态的视角看,如果子女身高在期望意义上等于父母的平均身高,那么会出现什么样的情况呢?在此我们不妨推演一下:对于高个父母,应该存在两类后代,其中一类后代的身高要高于父母的平均身高,另一类后代的身高要低于父母的平均身高。否则,子女身高在期望意义上就不会等于父母的平均身高。继续推演下去,则必定会出现个子超高的巨人。若针对矮个父母进行推演,则必定会出现一系列侏儒。然而,现实世界并没有出现上述现象。因此,基于反证法也可论证,高尔顿不会得到一条斜率近似为1的直线。



 二、运气的作用 


子女身高与父母平均身高正相关,但人类身高并非由遗传完全决定,那么还有其他哪些因素会影响人类身高呢?其实,高个子父母之所以那么高、低个子父母之所以那么矮,均含有运气成分。这里的运气是指不能被遗传的变异,用统计学术语讲,就是运气具有序列无关的性质,即无论好运或逆运,都会趋向于正常。从根源上看,正是由于运气的这种性质,人类身高才会出现“均值回复”现象。
运气在很多事件中都扮演着非常重要的角色,以致“均值回复”成为一个具有普遍性的法则。


天之道,损有余而补不足。

——《道德经》


这一法则早就被智慧的老子认识到了。不幸的是,在日常生活中,我们很容易低估运气的作用,忽视“均值回复”法则,从而犯下归因错误。

在此举一个常见且颇具启示意义的例子——


 

针对“成绩考得很好的孩子在受到表扬后多半会退步,而成绩考得很差的孩子在受到惩罚后多半会进步”这一现象,我们或许会得出结论:孩子经不起表扬,惩罚比表扬更能促进孩子的考试成绩。

但事实真是如此吗?其实,孩子偶尔一次考得很好或很差,都具有很大的“运气”成分。考得很好的孩子接下来出现退步、考得很差的孩子接下来出现进步的现象,都可能只是“均值回复”法则的体现,与孩子是否受到表扬或惩罚并没有多大关系。因此,惩罚教育的实际效果很容易被人们高估。

“均值回复”法则还可以解释“封面诅咒”现象——优秀的运动员一旦成为《时代》这些著名杂志的封面人物,接下来多半会走“下坡路”。其中的原因在于,一个人的巅峰期往往就是其运气出奇好的时期。不幸的是,正如经济学家罗伯特·弗兰克在著作《成功与运气》中所指出——


很多成功者都没有意识到,他们的成功也许只是源于运气好,结果对自己回归平凡进行错误归因。




 三、实证研究中的均值回复 


在实证研究中,如果研究者对“均值回复”法则不重视,那么也很容易受到这个法则的愚弄。例如,假设我们基于跨国数据,研究实行通货膨胀目标制政策是否有利于控制通货膨胀。我们首先考虑如下这个简单的实证模型:
在这里,代表通货膨胀率的差分;是一个虚拟变量,当实行通货膨胀目标制政策时取值为1,否则取值为0。
现在的问题是,若基于上述模型获得一个显著为负的,则是否意味着实行通货膨胀目标制政策能有效控制通货膨胀呢?答案是否定,这是因为:受到高通货膨胀困扰的国家更倾向于实行通货膨胀目标制政策,但若高通货膨胀因存在“运气”成分而具有“均值回复”性质,则我们会将均值回复的力量错误归功到通货膨胀目标制政策的实行。换言之,与真实参数相比,偏小(若用其绝对值代表政策效应,则政策效应偏大)。
如何设定一个正确的实证模型来控制通货膨胀的“均值回复”性质呢?答案很简单,那就是在模型(1)基础上再引入作为控制变量,具体模型如下:
对于模型(2),如果通货膨胀具有“均值回复”性质,那么我们预期。与模型(2)比较,模型(1)遗漏了变量。由于受到高通货膨胀困扰的国家更倾向于实行通货膨胀目标制政策,正相关。如果参数为负(“均值回复”法则的体现),则遗漏了变量将导致偏小点此复习遗漏变量偏差中的高估与低估》的相关内容
在实证研究中需要考虑“均值回复”法则的另外一个例子涉及到著名的索罗模型。假设我们基于跨国数据观察到,一个国家初始经济发展水平越高,其后经济增长率越低,亦即存在所谓的“绝对收敛”现象,那么这是否支持了索罗模型呢?是的,索罗模型确实能够解释“绝对收敛”现象,但“均值回复”法则同样能解释这种现象。此时,根据“奥卡姆剃刀原理”点此复习《漫谈科学三则》的相关内容,简单的“均值回复”法则其实才是胜出者。
然而,如果我们基于条件收敛方程发现,储蓄率等变量对经济增长的影响显著为正,那么这就是支持索罗模型的有力证据。原因在于:一方面,索罗模型预测,储蓄率更高的经济体的稳态水平更高,进而会导致更高的经济增长率。但作为一个竞争性假说,“均值回复”法则并没有作出此预测;另一方面,由于条件收敛方程已将“初始经济发展水平”作为解释变量纳入,“均值回复”法则对经济增长的作用也已得到控制。换言之,“排除其他解释的可能性”这一原则基本上被满足点此复习《漫谈科学三则》的相关内容这表明,要检验索罗模型,我们需基于条件收敛方程,考察储蓄率等关键变量的实证表现。






企研学术顾问 · 耀军

姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授、博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,浙江省“151人才工程”第三层次培养人员,杭州市“十三五”哲学社会科学应用经济学学科组评审专家,企研数据学术顾问。长期从事金融发展理论与实证研究,在《China & World Economy》《Frontiers of Economics in China》《金融研究》《数量经济技术经济研究》《财贸经济》《中国农村经济》等学术期刊上发表论文多篇,部分成果被《新华文摘》《中国法经济学研究》《中国经济的转型升级:新结构经济学方法与应用》《高等学校文科学术文摘》《人大复印资料》收录或者转载。主持教育部人文社科项目、浙江社会科学基金重点项目、浙江省自然科学基金项目等纵向课题多项。荣获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。





►一周热文

统计计量丨工具变量法(一): 2SLS

数据呈现丨R绘图:七种基础可视化图,您选对了吗?

软件应用丨经济学专业学习R,您需掌握的R语言包汇总

特别推荐丨老姚专栏:经验观察误导之伯克森悖论

数据呈现丨R绘图:物以类聚,图以群分——聚类分析及可视化

工具&方法丨划重点 !经济学专业学Python需要学哪些内容?——数据分析处理必知必会的知识点

工具&方法丨古老而神秘的因子分析(一)







数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:姚耀军推荐:杨奇明编辑:青酱







    欢迎扫描👇二维码添加关注    



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存