7月4日,国务院发布《国务院关于积极推进“互联网+”行动的指导意见》,提出相关支持措施推动互联网与各行业深度融合,要求推动数据资源开放,搭建“互联网+”开放共享平台,开展政务等公共数据开放利用试点,促进大众创业、万众创新。目前,我国北上广等先行地区公共数据开放已经起步,稳步推进全国公共数据开放势在必行。如何确定开放范围是推进公共数据开放的首要问题,国内外先行探索的经验值得我们关注和借鉴。
国外普遍优先开放高价值数据
国外先行国家自2009年以来陆续开展数据开放行动,形成了一系列确定和拓展公共数据开放范围的典型做法:
——明确不开放范围兜底,其余均可开放
世界主要国家纷纷通过立法或行政文件,明确不予开放的数据资源,为公共数据开放从源头上划定底线,形成了安全保障的最后兜底条款,主要包括直接或间接涉及国家安全、个人隐私和商业秘密的数据。在一些国家,经过开放部门脱密处理后的个人、商业数据不再具有识别出个体的属性,经评估后可以开放出来。美国法律规定国防或外交秘密、内部人事规章和工作制度、法定不得公开的信息、第三方商业机密、单位或组织内部文件、个人数据、执法记录信息、金融管理信息、油田地质信息和地球物理信息等九类数据资源不予开放,其余应无保留面向社会开放。
——优先开放高价值数据,逐步开放其他数据
国际上将与生产生活联系更为紧密的数据作为高价值数据,要求优先开放。《G8开放数据宪章》中提出了14类高价值数据,分别是企业类数据、司法类数据、地球观测类数据、教育类数据、能源环境类数据、金融和合约类数据、地理空间类数据、全球发展类数据、政府责任和民主类数据、医疗卫生类数据、科研类数据、统计类数据、社会流动性和福利类数据、交通和基础设施类数据。法国根据《G8开放数据宪章》制订了《G8开放数据宪章行动计划》,随着公共数据开放走向深入,目前法国开放的数据集1。4万多个,覆盖了43个部门。
——开放部门各自制订计划,并照计划开放数据
为了明确开放的具体范围,国际上一种做法是由公共数据开放部门根据其职责和业务,自行制订发布年度计划并照此执行。每季度或年度,开放部门报告开放情况,主管部门进行检查和督促,并以白皮书或工作报告形式发布全国及各部门的公共数据开放执行情况。英国首相连续多年公开致信各政府部门,要求制订公共数据开放的年度计划,进一步扩展公共数据开放的范围;各部门在发布计划基础上每季度公布数据开放执行情况;英国数据开放网站上也每日更新中央政府的开放情况。
——跨部门及公众协商基础上,发布公共数据开放清单
与第三点相对的另一种做法是,由主管部门确定具有共性的开放范围,组织跨部门协商和公众意见征集,补充具有个性的、去掉具有争议的开放范围,形成开放清单并以中央政府名义发布,由各个部门分别执行。这种做法可能具有更强的约束力和针对性,但范围确定的时间也更长。韩国2014年年底组织了公共数据开放需求调查,公布了民众选出的36个领域,宣布自2015年起先开放不动产等10个领域的数据,最迟于2017年年底前全面开放剩余的26个领域的数据。
——持续了解用户需求,滚动开放具备条件的数据
为了使公众的数据再利用需求尽可能得到满足,大多数国家都建立了公众互动渠道,在公共数据开放后持续了解用户数据需求,并积极开放已经具备条件的数据。以加拿大为例,在《开放数据宪章——加拿大行动计划》的指导下,该国通过不同渠道向公众征询了公共数据开放需求和意见,加速了相关数据集开放。
我国公共数据开放范围不断扩大
我国目前自发通过互联网开放公共数据的地区包括北京、上海、武汉、无锡、湛江等地,积极制订计划或规划推动公共数据开放的地区仍在不断增加。各地普遍在明确兜底条款,划定开放底线基础上,积极推动其他数据向社会开放,形成了以下典型做法:
一是以政府数据作为开放范围。将沉睡数据唤醒,发挥资源价值。同时,从国际经验来看,我国公共企事业单位保存的大量公共数据将可能成为下一步的开放重点。
二是或由公共数据开放部门自行确定,或由经信委组织目录编制确定具体开放范围。北京等地目前由开放部门确定具体开放范围,在保护国家秘密、个人信息和商业秘密的基础上,率先开放了一批没有争议、开放难度不大、益民效果明显的公共数据。上海等地目前由经信委牵头,在梳理信息资源目录基础上,组织编制了可开放的数据资源清单,开放了一批数据资源。
三是成熟一批开放一批,滚动拓展开放范围。上海、青岛等地逐批公布开放清单,比照清单开放,并接受社会监督。两地分别在《2014年度上海市政府数据资源向社会开放工作计划》、《青岛市公共信息资源开放清单(一期)》中公布了190个和373个数据集作为当期开放范围。
对确定公共数据开放范围的建议
界定开放范围是公共数据开放政策研究和制度设计的关键问题之一,一方面关系到如何从源头做好设计,保护国家秘密和商业秘密,维护个人隐私和社会伦理;另一方面也关系到如何尽可能开放社会迫切需要的公共数据,促进应用创新。结合国内外经验和做法,笔者认为确定公共数据开放的范围应包括以下几个环节:
第一,区分数据来源,开放政府部门和公共机构所保存的数据。目前,社会上呼吁开放的数据是具有公共性、公益性和基础性的数据资源,政府部门和公共机构所保存的数据资源全部或部分依靠财政资金而产生,依靠公共权力而采集或保存,开放这些数据具有合理性,也具有重要的经济和社会价值。
第二,制定兜底条款,不开放涉及国家秘密、个人信息和商业秘密的数据。确定具有兜底条款的开放范围,从源头上尽量避免疏漏。值得重视的是,兜底条款不宜将内容说得过细,要为发展过程中出现的例外事项留出回旋余地。
第三,做出一般性规定,鼓励开放服务生产生活的各领域数据。鼓励国家、省、市、县各级政务部门和公共机构开放能够便捷公众生活、服务企业生产、助力社会创新的数据资源。对国内外普遍开放、没有争议的数据,应予以开放。
第四,确立核心机制,评估及制订公共数据开放计划或清单并照此开放。在做好开放评估和开放策略制定工作的基础上,由地区的主管部门统一组织或各个开放部门按照自身的职能、业务范围自行制订公共数据开放计划或清单,公布开放计划或清单,照此进行开放。开放部门进行自查和总结,结合开放执行情况和信息资源建设与管理进展定期、不定期更新开放计划或清单,主管部门进行督促和检查,平稳推进公共数据开放。
第五,形成滚动推进做法,了解公众需求并开放已具备条件的数据。公共数据开放是一项新事物,随着公共数据开放的发展,还会有新机遇和新问题产生,需要事前、事中、事后一体化管理方。应建立了解公众公共数据开放需求的渠道,开放已具备条件的数据,与社会公众形成良性互动,不断拓展开放范围。
第六,明确保留事项,对特定数据取消开放及撤回发布。大量数据在交叉比对中会产生新的分析结果,例如单独都不足以识别出个人的数据,可能在综合使用过程中识别出个人信息。需要将“回溯自查”和“公众举报”手段结合起来,针对有潜在威胁的数据,发现一例,撤回一例,并比照进行排查。
在确定公共数据开放范围的过程中,还应结合各地经验,不断丰富和完善确定、拓展公共数据开放范围的方法,分期分批逐步推进开放,不断扩大开放内容,服务社会创新创业。