这条音频要跟你说说,大数据怎么能帮我们从另一个视角,看懂历史。

我们往往觉得,数据是跟科学或者经济有关,而跟读历史好像没什么关系。但是,著名经济学家、耶鲁大学终身教授陈志武,对此有不同看法。近几年,陈志武一直在推动用量化方法来研究历史。最近,他在经济观察报上发布了一篇文章,专门谈了量化史学研究的价值,里面有很多颠覆我们习惯认知的观点,我来给你转述一下。

陈志武教授认为,原先的历史研究,主要是“细读个案”的方法,这种方法很好,但当面对超大规模的资料时,这种方法就行不通了。就拿中国的近代史来说,光是清朝有关刑事案件的奏疏,就有将近60万本,加在一起就是1800万页,这么多资料,很难逐个细读。而且,面对这么多资料,无论研究者持哪种假设,往往都能从里面找到合适的论据,这就使得同一段历史被解读出不同的结论,甚至有“历史被任意化妆”的嫌疑。要想改变这种“偏重树木而忽视森林”的局面,就必须引入大样本,用大数据的方法研究历史。

那么,大数据量化方法为什么能帮我们看懂历史呢?陈志武主要谈了三个方面的价值:

第一,文化是很难量化的,但引入大数据方法,就可以让文化这个似乎看不见摸不着的东西,也变得可以量化。比如我们都说儒家文化过去两千多年对中国社会影响巨大,但是用什么来证明呢?这时大数据就发挥作用了。

有学者统计了清朝1644年到1910年间,山东107个县的农民暴动情况,他们发现,山东各县发生农民暴动的频次,和当地孔庙的数量成反比,也就是说,孔庙数量越多,暴动次数就越少。在排除了收入水平、教育水平、社会流动性等因素后,基本可以推测,受儒家文化影响越深的地区,家族宗族的网络越坚固,在面对灾荒冲击时,宗族内部互通互助的程度就越高,这就降低了人们走投无路、诉诸暴力的几率。这样,就从一个角度,证明了儒家文化对社会的影响力。

量化研究的第二个价值,是帮助我们检验一些历史假说,这些假说往往都是我们根深蒂固的观念。比如关于传统中国社会的高利贷,我们的观念中,放贷的往往占据优势地位,欠债的如果还不上钱,很可能会被债主逼得家破人亡。那么,到底真实情况到底是什么样的呢?陈志武就曾经连同几位学者一起,用量化的方法做了研究,他们选取了1732年到1895年间,官方记载的5000条因借贷纠纷引发的命案,结果发现,如果贷款没有利息,那么被打死的一方更可能是借钱的一方,而如果贷款利率越高,那么贷方被打死的几率就越大,也就是说,放高利贷的反倒面临更高的生命危险。陈志武分析,这恰恰说明高利贷的成因之一,就是民间借贷背后包含了不小的生命风险,这些高生命风险迫使借贷利率必须高,否则没有人愿意把钱放贷出去。

量化研究的第三个价值,是能够带来新的认知,引出新的研究话题和视角。比如,陈志武曾参与统计了中国从秦朝开始的658个皇帝的死因,结果发现,有38%左右的皇帝死于非命,比普通人死于非命的概率高1000多倍。同时,陈志武还统计了公元600年到1800年间欧洲的1513个国王,死于非命的比例是22%,大概是中国的一半多。

我们可以推测,中国皇帝因为权力更大,所以引发的争夺也越激烈,杀死皇帝带来的好处实在太有诱惑力了,所以才让皇帝成了“高危职业”。而欧洲在上层制度建设方面,很早就走上了改良的发展轨道,权力制衡做得更好,权力交接的制度更完善,或者说皇帝的权力没那么大,所以皇帝死于非命的比例会低很多。

以上就是陈志武关于量化历史研究的一些看法,供你参考。


本文源自:经济观察报网站(为什么我们需要量化历史研究)
音频稿:再见理想
讲述:于浩

社科陈志武大数据历史