公司新闻

周涛|浅析计算社会经济学的理念和方法论

本文整理自“WGDC2020 青年科学家论坛”演讲内容

演讲者:数之联创始人 周涛





主要内容:
1. 计算社会经济学理念
   · 在社会经济学中发展自然科学方法的困难
   · 推动计算社会经济学的三大趋势
   · 计算社会经济学定义
2. 特征方法论与应用
    · 分析自然数据
    · 实施大规模互联网实验
    · 融合大数据方法与社会调查
    · 用预测效果佐证理论假设




01 社会经济学定量化研究的困难

在社会经济学领域,我们想要发展出类似于自然科学一样定量化的方法,它具有独特的困难。


首先是社会经济学研究的主体——人,就非常复杂,很难真正的定量化。在某些特定情况下,比如在处理交通、人流拥塞等问题上,可以把人看成一个原子,让它获得了一些成功;其他一些场景,比如在经济学中,我们把人看成一个完全理性的主体,也能解释部分现象,但是目前我们认为大部分现象都解释不了。如果面向社会问题,人就非常复杂,人与人之间有很大的多样性——背景不一样、思考问题的方式不一样、反馈不一样、他在空间时间轨迹上也表现出了统计上的异质性等等。


其二是社会经济学的问题是很难真正被证伪的。所以很多研究人员认为社会经济学或者社会学、经济学不会成为科学;虽然叫社会科学,用科学的方法论去研究社会问题,但是从自然科学的角度来讲,如果以波普尔的观点来看,社会科学就谈不上科学。因为无法证伪,即没有办法设计完全相同的实验环境,选择不同的方法去验证哪一个方法、哪一个理论最终能得到更好的结果。社会经济学中有大量复杂的因素,这些因素有些可能有因果关系,有些可能还有多阶的因果关系,也很难进行验证。


所以在社会经济学中要发展类同于自然科学的方法论是很困难的,但大量的研究人员正在往这个方向不停地努力。


  02 推动计算社会经济学的三大趋势

为什么大家往这个方向走呢?因为有三大趋势:


第一,从整体上来说,社会学、经济学、社会经济学以及管理学等相关学科,都在经历一个大的发展趋势,就是从定性研究向定量研究发展,我们需要得到的结果、需要提出的理论越来越定量化,现在纯粹定性的理论已经很难得到大家的认可。


第二,这也是今天的介绍重点,以前我们在研究社会经济问题的时候,经常苦于没有数据,因为没有数据,所以我们很难进行真正的定量化研究。但是现在我们面对的是一个“一切都被数据化,一切都被记录”的大数据时代,截止到2020年底,全球数据存储量会超过40ZB,我们的很多行为都被记录下来,这是第二个大趋势。


第三,越来越强的学科交叉融合趋势。比如说50多年前做人工智能、计算机科学的人,视野scope是比较窄的,但是现在大家发现方法论上的前进只是很小的一部分,更多时候必须要在生命科学,甚至在物理学、化学、管理学、社会科学、经济学中发挥作用,才能被认可。这种力量的另外一面就是做社会科学、经济学的人在寻求新的工具,所以两方面有很强的趋势,要形成更深度的学科交叉。



03 计算社会经济学定义

我们认为计算社会经济学是基于大规模的真实数据,用定量化的手段研究社会经济发展中的各种现象,特别关注与社会过程有关的经济发展问题和与经济发展有关的社会问题。


04 特征方法论

我从4个方面简单给大家介绍一下,我们所认为的“计算社会经济学”的几个特征方法论。


1、分析自然数据(Nature data)

什么叫自然数据?以社会学为例,以前分析的绝大部分数据都是来源于统计数据、问卷数据、调查数据等等,很多时候你参加一个实验,在这个实验中,比如说行为经济学的实验,你表现出的一些数据,或者你填写问卷,从Questionnaire surveys中得到你的数据。这里的问题在于我们获得数据的时候,你知道自己是一个被试或被采访对象,这就导致会和你真实的社会经济行为有差异,所以不一定能够反映真实。

这里就涉及一种现象,叫社会偏好偏差,就是一个人表现出来的是社会希望的样子,比如在填表的时候。现在因为有了越来越多的数据,又有了更好的计算手段,所以我们很多时候可以用自然的数据来进行分析,就是在你行为过程中自动形成的数据,不再是填表得到数据,被试者是不知道自己是被试者的;但是做这个研究是有一些伦理学要求的,就是不能够到微观,不能给出微观数据,只能给出统计结果。


我举一个非常典型的例子,也是我们去年一个简单的工作,就是分析宗教和宗教之间隔离的强度。

宗教问题实际上是一个很有意思的问题,因为宗教可以让我们更好地相处,也可以让我们有更好的心态。如果用的好的话,可以让我们懂得善良、懂得宽容,是促进人类合作和提升幸福感的一个很好的手段;如果用的不好,宗教就是重大的社会冲突来源、甚至引发战争,比如大家耳熟能详的“十字军东征”,实际上这还是宗教之间的斗争。

我们想了解宗教和宗教之间到底有多强的隔离,隔离的强度有多大?它相比人类社会中其他的一些有明显隔离的网络,比如说种族的、不同政党的,是变得更强还是更弱?到底是什么因素有可能会促使宗教人员更好的沟通,这些是我们关注的问题。但是这类问题要通过问卷去调查非常的困难,因

为一方面是问题的敏感性,对于某些宗教人士来说这是一种冒犯;另一方面,在填写问卷的时候,你可能会美化自己的一些想法。

所以我们实际上是用了推特和微博的数据,通过自然语言处理加上一些宗教关键词,我们先筛选出大量的疑似宗教用户,然后通过人工办法打标签,标出哪些是真的宗教人士,再把它送入机器学习,慢慢筛选出越来越多的宗教人士。



图1 微博中宗教人士之间的网络


这样我们就获得了微博中宗教人士之间的网络(如图1),实际上就是粉丝的关系,比如说a指向b就表示a是b的粉丝,图1是我们中国在线人数中表现出来的宗教网,最大的两个群团是基督教和佛教,稍微小一点的红色是道教、绿色是伊斯兰教。我们通过计算它的匹配系数(实际上是看隔离程度),有多大倾向和自己宗教相连。我们发现和本宗教相连的倾向度比种族、政党都高,是人类社会目前社交网络中、有报道的网络中隔离程度最高的。

了解这个之后,我们又发现跨宗教的连边对于保持整个网络的连通性起到了关键性的作用,比其他很多重要的度量量度(比如说技术、桥接系数等等)更重要。知道这些跨宗教连接的连边如此重要之后,通过自然语言处理,我们还能分析为什么会有这些跨宗教连边,我们发现其中有46.7%的跨宗教的连边,以及跨宗教的话题,都是和“慈善”有关。

这也是一件很有意思的事,如果我们希望让宗教之间形成互动(这个希不希望,我也不是宗教人士不太了解),如果我们有这个希望,那么“慈善”会是一个很好的切入点,它是可以把不同的宗教连接起来的方式之一。

当然这篇文章还有很多其他的一些分析,包括哪个宗教最从容,哪个宗教亲和力、包容力最强,我不展开讲了。从这个例子可以看出结论是蛮有意思的,但是我想说明的是这个方法,我们不再是用调查问卷的方法去分析这种典型的社会问题,而是采用了一些新的思路,就是分析他自身在生活过程中留下的一些数据痕迹。


2、实施大规模互联网实验

现在利用互联网的手段,我们终于有机会可以在百万、千万甚至更大规模的人群中做实验——以前这是不可想象的。以前一个社会学的实验,即便是像米尔格伦“六度分离”理论这么有名的、我们号称大规模的社会学实验,也就是几百几千人,他真正收到邮件反馈也就几百人,但前面它发的人数会更多一点,其中很多都miss掉,这就算很大规模了。



图2 社交对政治动员的影响


比如图2所示工作,它面向的是6100万人,以前是很难想象去做这样一件事的。图2所示事件是指在美国国会大选前,希望公民去投票。他们当时和Facebook合作,就在Facebook上把18周岁以上的成年人分成了三类:
一类是什么都看不到,和以前一样。
一类人它会出现一个叫 Informational message——就是给你一个信息,告诉你今天是投票日,在Facebook上面有多少人已经投了票,如果点击帮助栏,它就会告诉你周围最近的投票站在哪里,可以去投票;然后它还鼓励你投了票之后点 “I Voted”——你不仅投票,还愿意和人分享你是投过票的。
第三类人叫Social message,这类人我不仅告诉你刚才Information message的信息,如果你有超过6个朋友投了票,那我就随机展示这投过票的6个朋友的头像,如果你没有6个朋友投票,那就把投过票的都展示出来。这个实验覆盖了6100万人,最终我们发现:社交关系出现以后,你会大幅度地提高你自己的投票意愿度,并愿意去告诉大家“I Voted”——这个“分享”不单会提高你的投票率,同时更重要的是会大幅度提高你分享的概率。

这个实际上是蛮有意思的事,因为我们知道,投票中提高两、三个百分点都是很厉害的事,很多时候差别是很小的——这是第一次通过大规模的互联网实验,说明我们的社交关系,哪怕实际上只是多一个message,告诉你有哪些朋友做什么事,这都有很强的动员能力。但是不同于我们以前得到这个结论是通过几十、几百人问卷得来,而是通过6100多万人的大规模实验,这是我想给大家讲的第二个特色方法论。


3、融合大数据方法与社会调查

第三个特征方法就是将上述讲的大数据方法和传统的社会调查结合起来。好多人听到我讲前两个方案就觉得这个“社会调查”是不是就没有用了——它的规模很小,其实不是的,它依然很有价值。

因为社会调查能得到特别高价值的数据,这个数据量非常小,一会儿你们就会明白我为什么这样讲,这是高价值小规模的数据。但是通过大数据的方法,比如说我们用遥感卫星、社交媒体、智能手机——现在用来进行大规模分析最常用的三个方式,利用这些数据我们能得到超大规模的数据,但是它的总体价值分到每个人手上价值就很小。



图3 卢旺达国家财富分析调查


举个例子,这是非常有名的一篇文章,就是面向卢旺达地区做的调查(如图3所示)。卢旺达是一个比较穷的地方,没有办法做经济普查。像中国算条件很好的,老百姓也很配合,但做人口经济普查也是动辄10年、20年为一个周期,这个时候就使得我们要切实去了解这些比较穷的国家的财富分布变得尤其困难。
怎么办?研究人员先做了856户人,实际上是856个智能手机,但是他同时去给这些人做问卷调查,这个问卷非常的复杂,不仅包括你的职业、收入,还有奖金、资产,甚至你有没有电冰箱、电视机、机动汽车、摩托车、自行车等等。
那么每个人平均就回答了几十、上百个的问题,这样的话我们就对你整个国家的家庭财富有了非常清晰的认识。这是一套联合国可持续发展的准确量表,那么大家根据你前面填的信息(你前面填的不一样,你最终回答问题总数不一样,所以有一个波动),他就能得到社会经济状态的一个指数,还有包括各分项的财富指数,但只有800多人对于整个卢旺达来说,也是杯水车薪。
怎么办呢?他们就用这800多人去建立了一个模型,因为它有整个卢旺达所有智能手机的数据,智能手机很普及,即便在卢旺达也是70%成年人都有智能手机。他们有150多万个智能手机,这些数据包括你什么时候打了电话、打了多长时间、你打给了谁,等于是有你的通讯网络了,有了你的Mobility pattern。
他用这个大数据——所谓的Population scale,就像人口尺度那么大的数据——做一件什么样的事呢?它用大规模的手机数据来做一个预测模型,来预测你的家庭财富的这些指数,这个模型表现得非常好,关联非常强。
这样就可以比较低的成本,比如说通过社交媒体或者手机,拿到全国人口规模的数据,然后以特别高的成本拿到一个800多人的小规模高价值的数据。对于这个问题来说,它就是要研究家庭财富,这就是最高价值的数据了。然后它通过建立这856个手机用户的手机数据去预测它家庭财富数据的模型,最终用到这150万个人,从而它可以预测150万个类似家庭的财富情况。这样的话它就描绘出了整个卢旺达的财富地图。

这是我给大家讲的第三个特征方法论,它强调的就是用低价值、大规模的数据去预测高价值、小规模的数据,从而使得我们几乎等同于得到了大规模、高价值的数据,这是一个非常重要的方法。


 4、用预测效果佐证理论假设
从逻辑上来讲,我们永远都不可能从数据中获得因果。尽管有很多方法,比如Judea pearl的因子图方法、difference-in-difference、格兰杰因果分析、Causality熵(因果熵)、贝叶斯网络等等,它们都能得到一些因果,但都是大体上很可能有因果,实际上是有可能没有因果的——任何两个完全互相决定的参数都有可能有一个第三参数影响。
比如说我们发现y永远等于2x,那很有可能是因为y和x都是受z控制,即y=f(z),x=g(z),但是f=2g,如果f、g函数变了,很多东西就会跟着变了,所以说我们得到的实际上是关联。但是我们通过越来越多的办法,让它变得越来越可能是因果。
在这种情况下社会科学又没有办法证伪,所以我们也希望能够用方法去做预测,这些方法都是让我们觉得它越来越可信,注意是越来越可信,并不是真正可信。但你越来越可信,我们就觉得你几乎就可信,所以用预测佐证理论,特别是佐证理论中发现了因果关系,实际上是目前比较能让人信服的一种方法。

图4 基于全球交易数据、ECI和国家竞争力等预测未来经济发展


我举个特别简单的一个有意思的例子(如图4)。MIT原来César Hidalgo 的小组和意大利Tacchella的小组都在做一些计算国家竞争力的工作,但是它是通过全球交易网络——产品生产的进出口,César小组就认为一个国家能够生产更多且更多样的产品,它可能竞争力就更强,它基于提了一个Economic complexity index(ECI)。
Tacchella是用了一个迭代寻优的思路,认为一个产品的质量取决于生产这个产品的国家竞争力,一个国家的竞争力又取决于它能生产的这些东西的质量,这就变成了一个类似于Kleinberg的HITs模型。两个向量,一个是产品的质量向量A,一个是生产国家的竞争力向量B。产品质量向量A将决定国家竞争力向量B,国家竞争力向量B决定产品质量向量A,实际上是被一个马尔科夫矩阵及其转置来回乘,这样的话每乘两次,再做一次归一化,就可以证明它是收敛的,收敛起来很快,不做归一化不一定收敛,这样Tacchella小组也能得到一个国家的竞争力。
这两个组互相之间争论很多,Tacchella最后放了一大招,如图4(右),实际上这个图的思路很简单,把一个国家放在一个二维的象平面中,横坐标是国家的竞争力,纵坐标是它现在的人均GDP,他认为右下角是一个存留区,你的竞争力如果足够的强,但是你的人均GDP很低,就说明你还在发展。这个就是中国,你看多恐怖,中国10-20年的发展,它就是竞争力很强,中国的产品竞争力在全球已经前几了,但是它的GDP很低,它认为中国什么都能生产,所以它能发展。
有了这个象图之后,他在2018年一篇Nature Physics文章中做了一件很有意思的事,他去预测GDP——这些年大家都不做这个事,因为大家都觉得很容易被打脸,但是他做的非常好,因为他前几年就公布了这个结果,所以2018年这篇文章就发了出来。他的思路非常简单,就在二维象平面里,比如说我要预测7年以后的GDP,我就看7年以前,谁和我在二维象平面隔得最近,然后他就用一个Kn的方法,就相当于我k个最近邻加权,然后把这k个最近邻发展到今年,就是他们发展7年之后的位置,加权之后就认为是我7年以后发展的位置。
如此简单,除了GDP本身以外只有“国家竞争力”这一个量,就这么简单一个方法。在2018年得到证明,它比世界银行用几百个参数算出来的GDP预测精度要高20%,所以这很了不起。当然,我们其实对他的理论都还存有各种各样的争论和疑惑。
但是这种预测就是强心针,这是第4个方法,就是当我们面对一些可量化的社会经济问题的时候,我们更多是要做预测,这种预测不是我告诉你这个方法就可以预测2019年的东西,不是!我都要提前预测2022年、2023年会发生什么,然后在网站上公布,最后让时间来检验。这是非常典型的一个特征方法。


参考文献:

[1]J. Hu, Q.-M. Zhang, T. Zhou, Segregation in religion networks, EPJ DataScience 8 (2019) 6.

[2]R. M. Bond, et al., A 61-million-person experiment in social influenceand political mobilization, Nature 489 (2012) 295-298.

[3]J. Blumenstock, G. Cadamuro, R. On, Predicting poverty and wealth frommobile phone metadata, Science 350 (2015) 1073-1076.

[4]C.A. Hidalgo, et al. PNAS 106 (2009) 10570.

[5]M. Cristelli, et al. PLoS ONE 10 (2015) e0117174.

[6]A. Tacchella, et al. Nature Physics 14 (2018) 861-865

028-86661321