政务信息化的长期开展为大数据应用积累了大量的经验和素材,对政务数据的价值发掘和利用也在意识上得到接受,因此大数据在政务领域内的应用和拓展具有较好的基础。但是从政府公众服务的用户的角度,普通公众仍未能感受到太多政务数据所带来的服务变化。这其中非常重要的问题在于政务数据的整合开放、形成应用尚不足。
近年来,我国各级政府通过行政手段和公共管理过程,依法获取了海量数据。绝大多数中央部委、省级政府部门的核心业务都有数据库支撑,如公安人口数据库、国家工商总局的企业法人数据库,以及金融、医疗、税务、质检、社保、教育各自企事业单位的信息库等。能够达成共识的是,政府数据资源蕴含着巨大的经济和社会价值,但如何合理开发数据、满足公众对政府开放数据的需求,仍然是政府部门面临的难题。下面通过美国政府数据开放平台Data.gov应用实力,来分析数据在可管控的情况下,如何实现更大规模、更深层次的共享,以及更为广泛的应用。
解析美国政府数据开放平台
美国政府数据开放平台Data.gov主要目标是开放美国联邦政府的数据,通过鼓励创新,让数据走出政府,得到更多的创新运用。一般情况下,政府、社会与企业可以从Data.gov免费下载数据,还可以利用Data.gov提供的API实现丰富的第三方应用的开发。
Data.gov上有成千上百的政府数据库,提供来自美国联邦政府各个机构的全面原始数据,包括农业数据、经济数据、医疗数据等。Data.gov提供了来自政府不同部门、机构的原始数据,大量的数据处理工具和基于数据基础之上开发的各种应用。这些开放的数据力求完整、一手和及时,并无需授权、向所有公众无差别开放。Data.gov的实现有如下一些特征。
第一,基于长时间的政府数据开放思考及相关的政策,是一种在相对成熟的规则体系下的产物。上世纪90年代,软件自由运动让民众意识到知识的共享意味着自由、平等、协作、责任和乐趣。开源在信息行业领域内得到了长足发展。由此形成各类信息自由、信息开放规则和法令随之出现。数据应该开放哪些、开放到什么程度,公众可以以怎样的方式使用这些数据(避免数据滥用),这些问题都通过立法的形式得到确认,这为政府部门开放数据明确了规则,这一点非常重要。反观我国,关于政府信息公开的相关法规有《中华人民共和国政府信息公开条例》,各地各级政府在向社会开放政府数据资源方面也有过一些尝试和经验。但国家层面的政策法规目前尚未明确要求政府部门无差别地向公众开放原始、一手、全面、及时、可被计算机自动处理的数据。因此,相关的政策法规实现工作保障和支撑是政务数据开放的一个重要前提。
第二,通过合理的数据分类框架设计,使得数据条理分明,为未来数据平台的发展打下较好的基础。为便于公众查找,Data.gov从用户需求出发,通过建立“数据群”(community)来创新数据开放形式。“数据群”是指将从不同机构获得的相关信息整合到一个大主题下,如“健康”、“教育”、“商务”等。Data.gov主要提供了9种分类方式,其中比较重要的是主题(Topic 主要是按照数据集的内容进行分类)、主题分类( Topic Categories 对数据主题更精确细致的分类)、数据集类型( Data Type 包括地理数据和非地理数据两种类型)。Data.gov所做的分类框架,将各类信息进行分类与整合,构建了一个重要的信息组织管理基础。
第三,用户的参与利用是Data.gov的核心精神之一。其目的是希望通过公众的专业素养与知识协助政府解决公共事务,期许公众能通过对开放数据的再利用创造出新的经济价值,激活社会创新。Data.org上线后,美国交通部开放了全美航班到达、起飞、延误的数据,第三方利用这些航班数据,开发了航班延误时间的分析系统。该应用比航空公司的正式通知提前6个小时,准确率非常高,并向全社会免费开放。任何人都可以通过该系统实时查询美国国内各次航班的延误率及等候时间。政府通过数据开放引入了这样的力量,提升了社会的整体效率。
第四,该平台提供了数据、数据处理工具、数据能力平台开发、数据应用产品等不同层面的资源,同时数据格式也非常丰富,公众能够根据自身需求获取到合适的信息。
借助第三方力量进行数据开发
另外,Data.org鼓励第三方通过利用数据进行应用开发,希望借助第三方的力量为公众提供丰富的应用而非仅局限于“裸数据”。基于Data.gov美国政府还建设了Apps.gov,这个网站由美国总务管理局(GSA)负责运营,面向全国所有政府部门,提供政府公用云服务,并整合了一系列的应用程序,实际上类似于一个政府的应用程序商店。通过Apps.gov数据集中整合的效应得到了放大。App.gov作为“一站式云计算服务来源”,可以实现集中购买政府各种云服务;同时通过标准化产品规范与整合了政府各部门业务流程,降低各部门之间的交易成本;此外为企业提供了大量政务服务应用商业机会,带动了整体信息化发展水平。
当然,应用平台是否能够取得成功这也同样取决于数据开放的范围和深度。我们仍以航空数据为例,观察“北京政务数据资源网”中有关于“飞机”分类的数据,仅能够看到“机场班车站点”、“机场班车路线”两个数据项。显然大量航空旅客所需要的应用并没有相应的数据支撑,服务旅客也仅能够局限于“乘坐机场班车”的旅客了。从这个比较我们再次看到在政府数据开放平台上,数据的广度和深度是数据开放的基础,大量开放具有较高价值的数据是平台能够成功的前提,离开了政务数据的开放就有可能沦为空谈——而这常常又是最为困难的。
从数据开放的经验看,数据开放部门的配合意愿问题也是不容忽视的影响因素。政府机构由于自身定位和责任机制,缺乏开放公共数据的动力,尤其是一些涉及到关键业务的数据,更是被作为保护的重点。具有应用开发意愿和市场开发能力的企业很难获得政府部门对原始数据开放的许可;另一方面,如果政府提供的数据是经过加工的,那么这些数据就具有知识产权——这时的数据里面增加了人的智力、劳动成本,想要获取这些数据还需要付出成本,成本的协商也会成为一个不易跨越的壁垒。
一些政府部门还会担心数据的透明带来履职受束缚的问题。原来不透明的部门行为被公开后,可能招致舆论批评甚至诉讼,因而没有意愿主动开放数据。有不少意识到数据价值的政府,则希望通过构建一个政府控制力很强的大数据运营机构,实现对数据在较好控制情况下的运营增值。
尽管如此,政务大数据的开放和应用仍然呈现出乐观的态势,各地政府的开放性不断增强。2016年济南市委市政府下文要求济南市16个委办局数据公开,这些开放的数据将用于便民服务。而这些数据被明码标价,可以进行公开交易。可以想见,像Data.gov那样政务数据公开,提升公众服务,形成电信信息行业新的发展机会,是可以预见的。要解决政策、地方利益割据、从数据到应用的配合、数据安全和可用性等一系列的问题,还有不少困难需要克服。