主页(http://www.cnwulian.net):美国公共领域智能决策的新技术
【财新网】(专栏作家 张小彦)数据科学应用的一个重要方面是以数据为驱动的公共政策决策(Data-Driven Public Policies, DDPP)。大数据技术是一个决策支持的新武器,它能在智能决策过程中参考多类海量数据并实现实时性(real time)和互动性(interactive)。但是,目前大部分大数据项目属于描述性(轮廓画像、展示发生了什么、现状如何等)或探索性(在海量数据中寻找多维变量的相关性和某一现象的发展趋势)分析。尽管大数据技术正在影响着各行各业,但描述性和探索性分析在公共政策的决策支持上仍存在着很大局限性。
由于数据处理和分析技术能力的限制,应用数学模型进行社会行为仿真模拟在过去很难实现。近年来大数据、数据科学的高速发展,包括计算社会学(Computational Sociology)、主体模型(Agent based Modeling)、统计合成人口(Synthetic Populations)、互动可视化分析(Interactive Visual Analytics),使实时互动的社会行为仿真模拟成为可能。
通过以上仿真模拟结果(红点是感染,蓝点是康复)我们可以及时地知道,80%免疫率产生的防御墙在疫发152天后出现了失控,而95%免疫率有效地控制了传染病扩散。FRED系统可以对多种传染病进行仿真模拟,这种实时互动的信息无疑对传染病防治和监控有直接指导意义。
社会行为的仿真模拟需要在人口群体中进行。在真人群体中进行试验不但费用太高,而且在很多情况下违反人道主义。过去十几年中迅速发展起来的统计合成人口(synthetic population)技术和方法为解决这个问题提供了新的途径。而制作统计合成人口数据的关键是要让它在结构(structure)和互动(dynamics)关键指标上与真实人口达到(或接近)一致。
描述性和探索性分析所用的是当前和历史性数据,因此只能根据过去预测未来。其基本假设是“如果目前的趋势继续下去,我们预测未来将是这样”。这类预测对判断是否应该继续现行政策有一定价值,但对新政策的效果预测则意义有限。新政策往往会影响到广大群众的生活,如能科学地对人们的社会行为进行仿真模拟,那将有重大意义。近年来在美国发展起来的数据科学新技术,应用统计合成人口数据模型对社会行为进行仿真模拟,代表了智能决策在公共政策领域里应用的新前沿。
在美国,社会行为仿真模拟已经被成功地应用到传染病监控和交通管理等领域。由美国卫生研究院(National Institute of Health)资助、美国匹茨堡大学公共卫生学院开发的FRED(A Framework for Reconstructing Epidemiological Dynamics)传染病扩散仿真模拟系统就是一例。
数据互动可视化分析(Interactive Visual Analytics, IVA)是近几年大数据技术发展的新亮点。在它出现以前,数据分析的结果很难通过简明易懂的方式为决策者展示。当决策者看了分析结果、想进一步探索深层次问题时,常常要等数据分析员的下一轮分析出来才能实现。互动可视化分析能使决策者通过实时互动的方法对数据和信息进行多方位的探索,这使社会行为仿真模拟成为决策支持中及时和有效的工具。
二战以后,美国社会学理论家帕森思(Talcott Parsons)创立了一种解释复杂社会的通用理论,叫“结构功能主义”(Structural Functionalism)。该理论认为,社会是一个由结构(骨骼,bones)和功能(器官,organs)组成的复杂系统。生活在其中的个人是具有主观能动性的行动者,他们时时与生活环境和周围的人互动。每人都面临多种行为选择,而这些选择会受到不同的物理和社会因素的制约。在这个理论的影响下,应用现代数据处理和分析技术(大数据、数据科学)对社会现象进行量化分析,计算社会学在21世纪初迅速发展起来。这个社会学新分支通过复杂的统计模型和社会网络分析方法对人(主体,agent),人们之间的互动,这些互动的效果,以及最终导致的社会变迁进行系统研究。虽然保有人文科学的特征,计算社会学的兴起受到自然科学(如物理学、计算机科学、和人工智能等)的重大影响。
起源于20世纪70年代的主体模型(agent-based model, ABM)在21世纪初趋于成熟。主体模型的核心理念是被模拟的人(主体而不是客体)能根据不同信息在特定环境中主动采取行动而不是被动地听取指令。社会中的人不但能对变化作出反应,而且能逐渐适应新环境。与传统统计变量模型(结构方程模型、回归模型等)相比,主体模型更接近社会现实,因此更适合社会行为仿真模拟。这一点对公共政策的智能决策有现实和深远的意义。
作者为社会学博士,现任一家软件公司董事长兼资深科学顾问
作为智能决策方面的新技术,社会行为仿真模拟还存在很多局限,很多人对应用数学和统计模型模拟复杂社会行为的准确性和实用性存在质疑。社会行为仿真模拟还有很长一段的路要走。但我们应该看到,在计算社会学、主体模型、统计合成人口、互动可视化分析等基础上发展出来的社会行为仿真模拟的确为公共政策,特别是新政策制定的智能决策提供了新的思路和手段。它引领了一个新的方向,值得引起我们的关注。