查看原文
其他

特别推荐丨老姚专栏:科学方法两则——证伪主义和溯因推理

姚耀军 数据Seminar 2021-06-03



推荐语:我认为,经济学本科教育最关键的不是让学生装入多少现成的理论知识、不是熟练培训多少软件操作,甚至不是讲解尽可能多的数理或计量模型,而是帮助学生培养符合科学方法论的思维方式。特别是,如果让我们的学生认为经济学的课程,只要“记记背背”就能得高分,那就是彻底的失败!遗憾的是我们经常发现学生,甚至我们自己(数年前我们也是学生)的思维和论述的方式其实并没有时时体现这种思维模式。姚老师这篇推文中所介绍的证伪主义和溯因推理是经济学实证研究方法论的基石。这不是老生常谈,而是警钟长鸣!值得年轻的朋友细细体会。 

  

——杨奇明 





 一、证伪与证实 


    按照20世纪最著名哲学家之一卡尔·波普尔的观点,


科学理论和人类所掌握的一切知识,都不过是推测和假说。科学理论不能够被证实,但可能被证伪。


例如,人们在观察到100只白天鹅后提出假说:所有的天鹅都是白色的。接下来无论找到多少只白天鹅,显然都不能证实这一假说,因为总是存在下一只天鹅为黑天鹅的可能性。然而,一旦一只黑天鹅被找到,这个假说就被证伪。

可证伪性是划分科学与非科学的标准。如果一个理论具有可证伪性,那么其预测必须是具体的。亦即,如果理论正确,那么它不仅要告诉我们,哪些事情应该发生,还应该告诉我们,哪些事情不会发生。一旦前者没发生或者后者发生了,我们就可以清楚地知道,这个理论在有些地方出错了。此时,我们就有必要对该理论进行修改,或者提出一个全新的理论来代替,而这两种做法都会使我们提出的(新)理论更接近真实。相反,如果一个理论的预测包括了所有可能观察到的结果而不可证伪,那么这个理论就是张五常先生所讽刺的“套套逻辑”,而非科学理论。例如,“明天可能下雨”就属于套套逻辑,因为无论明天是否下雨,都不能推翻这一说法。

必须强调的是,科学是操作主义导向的,力图将概念从个人化的感觉与直觉中分离出来,并且允许根据经验事实对概念进行检验。因此,经验事实具有可观测性是建立科学理论的前提。如果某一理论涉及到不可观测的经验事实,那么该理论也是缺乏可证伪性的。例如——


 

对于“只要人们诚心祈祷,事情一定会有好的结果”这一“论断”,我们固然可以直接观测到祈祷行为,但很难测量祈祷的诚意。如果诚意无法测量,那么事情结果不妙总可以归咎于人们未能诚心祈祷,进而使得这一“论断”沦为缺乏可证伪性的非科学断言。

科学研究是一个试错过程,通过证伪来排除错误,逼近真理。然而,人类的本能是证实而非证伪。一旦人们确立了某一信念,就倾向于在收集信息和分析信息的过程中,寻找支持这个信念的证据,忽略不支持这个信念的证据,或者将模棱两可的信息向着有利于自己立场的方向进行解释,甚至不惜花费时间和资源来贬低与自己立场相左的观点。上述这些行为偏差就是所谓的证实偏差

英国心理学家皮特·沃森曾进行了一个经典实验——


 

他在人们面前放置了四张卡片,这些卡片的一面是字母,另一面是数字。人们看到的卡片是:A、B、2、3。沃森首先提出假设:“若卡片的一面是元音字母,则另一面一定是偶数”,然后要求被试回答,为了检验这个假设的真伪,需要翻看哪一张或哪几张卡。结果约有50%的人回答应该翻看卡片A和2,约有35%的人回答只需翻看卡片A。

正确答案是什么呢?让我们一一分析之。翻看卡片A,若看到一个偶数,则与假设一致;若看到一个奇数,则证伪了假设。翻看卡片B,看到的无论是偶数还是奇数,均属于与假设无关的证据。翻看卡片2,若看到一个元音,则与假设一致;若看到一个辅音,则属于与假设无关的证据。翻看卡片3,根据反证法,若看到一个元音,则证伪假设;若看到一个辅音,则与假设一致。

上述分析表明,正确的答案是翻看卡片A和3,因为只有这两张卡片提供了证伪假设的机会。然而,只有10%左右的人回答正确。那些回答应该翻看卡片A和2或者只需翻看卡片A的人,极力搜索支持假设的证据,较少尝试寻找证据去证伪假设。

证实偏差在日常生活中普遍存在,古今中外皆如此。《吕氏春秋》中有一则“疑邻盗斧”的故事——


 

当失斧者怀疑邻居之子偷了斧子时,其一举一动无一不像偷斧子的人;当失斧者最终找到斧子时,邻居之子的言行举止没有一处像是偷斧子的人。

要避免证实偏差,首先不能过度自信于自己的科学素养,须认识到证实偏差属于人类的本能反应;其次,要善待对你的观点提出反驳的人。如果你崇尚科学,那么你应该将他们视为真正的朋友。




 二、溯因推理 


美国哲学家汉森在《发现的模式》中指出——


科学家所致力的工作是“从被解释项到解释项的追溯”


所谓被解释项就是科学家们认为需要加以解释的现象,解释项则是能够因果地推出被解释项的某个命题。因此,科学发现的过程就是寻找解释项的过程,亦是“由果溯因”的过程,而这就是最早由美国哲学家皮尔士引入至现代逻辑中的溯因推理

溯因推理过程可简述为:(1)某一现象E被观察到;(2)提出假说H来解释E;(3)基于H提出推论C;(4)若C被证伪,则H为假;(5)若C被验证为真,则H可能为真。以H为前提一般可以演绎出C1、C2、C3 ……等一系列推论。如果这些推论都被证实,那么H就获得了更大程度的支持,从而H为真的可能性更高。一个假说的众多推论可能不会全部被证实,也不会全部被证伪。此时,人们需要不断地对假说进行修正,或者提出新的假说,从而一步步地向真理逼近。

在此举一个具体的例子——


 

我们在清晨观察到马路边的草坪是湿的,于是合理猜测,这一现象发生的原因是晚上下过雨。如果晚上下过雨,那么我们会得到一个推论:马路是湿的。我们观察到马路确实是湿的,因此晚上下过雨的可能性比较大。同时,我们还会有第二个推论:屋顶是湿的。如果我们观察到屋顶确实是湿的,因此晚上下过雨的可能性就更大了。

然而,如果所有的屋顶是干的呢?那么第二个推论就被证伪,而晚上下过雨就是对“草坪为何会湿”的一个错误解释。我们不妨再提出新的假说:草坪湿了是因为晚上有洒水车经过。新提出的假说必须具有这样的特征:既可以解释错误假说能够解释的现象,也可以解释错误假设不能够解释的现象。在本例中,洒水车经过既可以解释草坪和马路为什么是湿的,也可以解释屋顶为什么是干的。为了增加新假说的可信度,我们还应该基于新假说提出新的推论。例如,如果晚上有洒水车经过,因为洒水车通常伴放音乐,从而会引起路边小区中居民的注意或者狗发出叫声。当这一推论被证实后,新假说为真的可能性就更大了。

总结而言,溯因推理具有五大特征:第一,溯因推理最重要的阶段是提出可以解释现象的假说,而这往往需要很强的直觉与广博的知识;第二,假说是对现象发生原因的试探性推测,具有或然性,需要被进一步实证检验;第三,当假说无法被直接观测从而不具有可证伪性时,必须由假设形成具有可证伪性的推论,从而为实证检验创造条件;第四,溯因推理是在众多可溯之因中寻求最佳解释的推理过程,而最佳解释必须与最大范围的经验事实相一致;第五,溯因推理包含了演绎推理与归纳推理——由假说形成推论就是演绎推理,而对推论的实证检验就是归纳推理。

科学研究往往从令人惊奇的事实观察开始,然后通过溯因推理建立新的知识。皮尔士在一个多世纪前指出——


溯因推理是一个形成解释性假说的过程。它是唯一一种能够引入新观念的逻辑操作。


溯因推理不但在科学哲学中具有重要的理论地位,而且在人工智能等领域有着广泛的应用——在某种意义上,人工智能就是让机器学会溯因推理。

 

 



企研学术顾问 · 耀军

姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授、博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,浙江省“151人才工程”第三层次培养人员,杭州市“十三五”哲学社会科学应用经济学学科组评审专家,企研数据学术顾问。长期从事金融发展理论与实证研究,在《China & World Economy》《Frontiers of Economics in China》《金融研究》《数量经济技术经济研究》《财贸经济》《中国农村经济》等学术期刊上发表论文多篇,部分成果被《新华文摘》《中国法经济学研究》《中国经济的转型升级:新结构经济学方法与应用》《高等学校文科学术文摘》《人大复印资料》收录或者转载。主持教育部人文社科项目、浙江社会科学基金重点项目、浙江省自然科学基金项目等纵向课题多项。荣获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。



►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

工具技巧丨如何解决机器学习中数据不平衡问题

特别推荐丨老姚专栏:宏观数据VS微观问题:谨防生态学谬误

工具&技巧丨能够融合Stata、Python和R的神器——Jupyter Notebook

数据呈现丨22个!史上最全Python数据可视化库大合集

工具&技巧 | 经济学圈特供 小刘帮你画专业社会网络图(二)





数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:姚耀军推荐:杨奇明编辑:青酱





    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存