您当前的位置:首页 > 智慧政务 > 国外经验

国内外政府数据开放平台调查与分析

时间:2017-12-28 09:31:56  来源:《现代情报》  作者:促进网
        摘要:政府数据开放对于提高政府信息化效益、确保社会公众知情权、推动国家经济增长具有重要意义;而政府数据开放平台建设则是其中的关键环节。国内外学者针对政府数据开放及开放平台构建开展了较为广泛的研究,文章对目前研究现状(以图书情报领域刊文为例)予以简介并评析。接着选取国内外政府数据开放较为先进、完善的国家(美、英、澳、日)和城市(上海、北京、深圳)为研究对象,对其政府数据开放平台进行了调查,并对调查结果加以对比分析,找出相同和差异之处。结论认为,我国政府数据开放与国外相比尚存在一定的差距,应该进一步加强政府数据开放及开放平台的理论研究和实践探索。
    1 引言暨目前国内研究现状简介———基于2017年图书情报领域刊文的分析   
    政府是大量信息资源和数据的拥有者;而要挖掘和实现这些原始数据集的价值则需要政府向社会公众开放数据资源,推动整个国家资源的优化配置。政府数据开放在政治上可以提高政府的透明度和满意度,增强民众对政府的公信力;在经济上可以促进社会创新和新兴产业发展,实现产业升级,推动经济增长。因而,政府数据开放关系到国计民生,对于确保社会公众的知情权、助推国家经济的腾飞具有重要意义。
    国际上(以美、英为代表)积极开展政府数据开放的相关理论研究和开放平台的实践探讨,并取得了较大成就。国外政府数据开放的相关研究侧重点在于解决具体的实际问题,研究主题主要集中在:开放政府数据的功能与利用、评价;政府数据开放的基础设施建设;政府数据开放项目的实践等。我国的政府数据开放行动也是势在必行。从实践上来看,2015年“数据开放共享”被确立为我国大数据战略的核心,我国也将于2018年底建立国家级政府数据开放平台;如何更好地建设数据开放平台成为我国政府数据开放的关键环节。令人感到欣慰的是,贵阳市采取措施推动政府数据的开放、共享和利用,确保政府数据优先向社会公众开放;制订的《贵阳市政府数据共享开放条例》也已于今年5月1日起施行。河北省政府提出,要推进政府数据的开放共享,到2018年底前建设政府统一数据开放平台。从理论上来看,我国学者围绕“政府数据开放”这一主题积极开展相关研究,取得了较为丰硕的研究成果。图书情报界也不例外,笔者特选取2017年图情刊物发表的最新文献加以描述。首先值得一提的是,我国图书馆学核心期刊、CSSCI来源刊(核心版)《图书与情报》2017年第1期开辟专题“国外政府数据开放的政策保障与启示”,分别介绍了美国、英国、澳大利亚、巴西、丹麦这5个国家政府数据开放的有关政策和法规保障,并从多个方面分析其对我国的有益启示;接着又在第2期载文探讨政府数据开放的评估指标特征及其模式。笔者对其他非专题发表的文献进行初步归类,其主要内容涉及:政府数据开放平台模型和框架构建;国内外开放政府数据平台元数据标准研究;政府数据开放保障和运行机制;政府数据开放与个人隐私权保护及网络舆情监督;国外政府数据开放相关政策及对我国的启示;其他问题,如政府数据开放的障碍、对策、检索方法及变革等。
    由上可以看出,我国图书情报界积极开展“政府数据开放”的理论研究和实践探索,取得了一定的研究成果;这些研究对于推进我国的政府数据开放、探讨数据开放平台的实现具有较大的理论参考价值和现实指导意义。笔者并不盲目跟随,而是运用比较研究方法,从“国内外政府数据开放平台的调查”入手,并对结果加以分析(目前研究文献暂无该方面的直接报道)。研究的目的在于抛砖引玉,引发更多学者对“政府数据开放”问题的关注,为我国的政府数据开放平台建设提供参考借鉴;同时,增强图书情报界与政府之间的关联度,扩大图书馆的影响力,提升其社会价值。
    2 国内外政府数据开放平台调查
    2.1 调查要素
    数据开放平台作为政府数据开放的重要内容,对其调查分析是研究各国政府数据开放现状不可缺少的部分。本文对于国外平台的调查以美国、英国、澳大利亚、日本这4个处于数据开放先进水平的国家政府数据网为例,国内则以上海、北京、深圳这3个国内较为完善的数据开放平台为例。
    政府数据开放平台的调查基于以下几个基本要素而进行:1)数据对象与组织:包括开放数据的数量、类型、来源、下载格式。2)开放平台的网站结构与分布:包括数据检索、网站模块分布、数据分享互动与用户反馈、网站数据更新频率、数据使用授权信息。3)是否提供API接口:API做为网站应用程序编程接口,它的开放使应用程序与开发人员无需访问源码或理解网站内部工作机制,就可以调用和开发网站的数据资源。因此开放API的站点能为第三方的开发者提供良好的社区支持,吸引更多的技术开发人员参与到数据开发与再利用之中。4)是否支持RSS订阅:RSS可以作为数据开放平台与其他站点之间共享数据信息的一种简易方式。同时作为简易信息聚合技术,RSS订阅会收集和组织平台用户定制的数据信息,按照用户希望的格式、地点、时间和方式,直接传送到用户的计算机上。这将大大促进数据开发者的工作效率,保证用户对数据更新的关注,提高用户获取数据信息的时效性和准确性。
    2.2 国外政府数据开放平台调查
    2.2.1 美国政府数据开放网
    从美国的政府数据开放平台(www.data.gov)网站搜集相关信息得知(注:为了节省文章篇幅,网站主页图省略,以下同):该平台截至2017年5月开放数据集195206个,数据基本上都来源于政府公共部门,提供的数据下载格式为CSV、HTML、XML、RDF等可机读格式。
    在网站布局上:“数据搜索”框下方提供了农业、气候、消费者、生态系统、教育等14项数据主题分类,总体包含了数据、分类、影响、应用软件展示、扩展、互动6个主要类目。在扩展类目下提供使用开放数据的应用程序的展示区,公众可以通过IOS平台或Andriod平台下载这些应用程序,了解政府数据开放所能提供的服务和相应的功能,推动对政府开放数据创新应用的开发。该网站基本每日保持着开放数据的更新。并有官方的博客和Twitter,其中官方Twitter拥有2.51万的关注量;在互动类目下提供用户提问与twitter互动,保持与数据用户的互动联系。
    网站下方About类目下提供4项授权信息声明:①政府网站原始数据日志不能用于其他目的,并按照国家档案和记录管理指南进行定期销毁。②严格禁止未经授权的上传信息或更改本政府网站服务信息,如果违反将可能受到惩罚。③通过www.data.gov提供的美国联邦数据是免费且无限制的。政府雇员在其雇用范围内创造的数据和内容不受美国的国内版权保护。④通过www.data.gov访问的数据没有、也不应该包含对其最终用途的控制。一旦数据从机构的网站下载,政府就不能保证其质量和及时性。此外,美国政府不能对www.data.gov通过检索的数据进行任何分析。数据检索方式以关键词检索、基于地图位置的检索为主;数据检索内容以相关性、名称的升序或降序、最后修改日期等进行检索排序,检索结果以主题、主题分类、数据集类型、标签等进行分类分面。
    在API的开放上,网站目录由CKAN(强大的开源数据平台之一)提供支持,CKANAPI包含有关数据集的元数据。通过CKAN的支持为用户提供所有数据的API接口,允许所用用户通过API对调取的数据进行开发利用。同时Data.gov为API利用提供了GitHub托管平台的支持,该平台拥有超过900万的开发用户,可以随时为www.data.gov用户在API的使用上提供帮助。RSS订阅上,美国的政府数据开放平台支持RSS技术以及数据信息的订阅,并提供相应的网站代码以供不同种类RSS阅读器的使用。
    2.2.2 英国政府数据开放网
    从英国的政府数据开放平台(data.gov.uk)网站搜集相关信息得知:该平台截至2017年5月提供开放数据集43021个,提供下载格式包括CSV、RDF、XLSM、XML、NII等可机读格式。数据来源于公共部门、私企和部分高等教育机构。
    网站布局和结构上,主页提供了包括商业和经济、环境、地图等12个数据主题,网站包括数据、APP应用、互动、登录4项主要类目;APP应用下提供了412个关于政府数据APP的应用。在互动上设置了官方博客,同时在博客互动、网站论坛和评论等功能上采用Drupal系统运行,从而为用户提供完善的站点分析工具和协同共享平台,实现用户与网站之间的双向互动。该平台数据每周进行更新。
    在网站FAQ附录下提供了两项明确数据授权声明:①网站上的信息是开放的且可再利用,允许私人和其他第三方网站向平台提供数据信息。②通过data.gov.uk提供的数据和信息的授权可以在单个数据集记录(元数据)的“许可”或“约束”字段中描述的条件下获得,除非另有说明;在data.gov.uk上发布的所有数据集记录(元数据)都是根据开放式政府许可进行许可的。
    数据检索上,data.gov.uk采用短语检索和字段检索,采取以名称升降为标准的排序方式,以NII数据集、API、执照、主题、资源格式等这些项目进行结果分类分面。da⁃ta.gov.uk也是基于CKAN数据管理系统进行搭建的,网站API开放只面向注册用户,API的开放还属于试用期,只提供健康与交通两项主题的开放数据。提供GitHub平台的服务功能。同时该网站支持RSS订阅。
    2.2.3 澳大利亚政府开放数据网
    从澳大利亚的政府数据开放平台(www.data.gov.au)
    网站搜集相关信息得知:截至2017年5月提供开放数据集49904个,提供下载格式包括SHP、SLD、WMS、WFS、GeoJSON等可机读格式,数据来源都是本国政府部门。
    网站结构上,主页未提供数据主题分类,在数据类目下只提供了商业、经济、环境、科学等8项数据分类,总体上包括数据集、组织、网站统计等8个主要类目,在应用类目下提供了42个关于开放数据的运用软件。其中工具包类目中为用户提供了相应的技术与法律政策上的应用支持,以协助用户对开放数据的开发使用;www.data.gov.au还通过统计模块向用户开放了网站整体运行情况。
    但www.data.gov.au没有社交媒体的选项设置,仅提供了用户反馈调查和用户提问的网站模块,在数据的互动共享上略显欠缺。平台数据保持每周更新,该平台准许用户在浏览器上禁用cookie。使用授权上,www.data.gov.au的About类目下提供了两点声明:①对于其所提供的第三方链接数据没有相应的下载授权。②尊重和保护用户的隐私,网站上的所有开放数据依照开放许可协定授予所用用户下载和使用的权力。
    www.data.gov.au同样是基于CKAN数据管理系统进行网站搭建,对用户开放所有数据的API,无其他API支持服务;但提供RSS订阅服务。
    2.2.4 日本政府开放数据网
    从日本政府数据开放平台(www.data.go.jp)网站搜集相关信息得知:截至2017年5月提供开放数据集18717个,数据来源除政府部门外还包括科研机构和大型企业,提供XLMS、CSV、PDF、HTML等可机读下载格式,网站还同时提供日语和英语两种语言服务。
    网站结构分布上,首页未对数据种类进行主题分类,在数据类目下将数据分为商业、安全、运输教育等9项主题。网站总体划分为注意事项、数据、数据库列表等6个主要类目。数据检索data.go.jp采用关键词检索和基于地图位置的检索,按照数据的相关性和搜索量进行排序,按照数据集、组织、格式、主题分类进行搜索结果分面。互动上提供了用户数据报告以收集数据用户的相应反馈,并提供了用户数据信息上传通道,允许用户向网站提供数据信息。但没有社交媒体的互动,官方开设的twitter账户没有实时的更新动态,并处于休停状态。
    数据使用授权上,在网站的注意事项类目下提供的授权信息声明上显示:data.go.jp根据日本“行政机关保护个人信息法”,网站对部分收集的数据不予授权。其他不在信息法保护内的数据以开放协定为标准,任何用户都可基于data.go.jp的授权进行自由下载和使用。data.go.jp以CKAN数据管理系统搭建,并提供多种类型API,例如组织、数据重置、资源和标签API。使用API以JSON、RDF格式获取元数据,提供所有开放数据的API接口。支持RSS订阅服务。
    2.3 国内政府数据开放平台调查
    2.3.1 北京政务数据资源网
    北京市政务数据资源网www.bjdata.gov为北京市政府在2012年搭建的数据开放平台,提供北京市政务部门可开放的各类数据的下载与服务,是我国较早开放的地方政府数据开放平台。
    www.bjdata.gov.cn截至2017年5月提供了559个数据集,数据来源主要是北京市政府下辖的44个政府机构。大多数数据只提供单一的CSV下载格式。只允许注册用户对数据进行下载和API接口接入。
    该网站首页提供了数据、接口、定向数据、应用、工具、互动交流等8个一级类目,在数据类目下对数据主题进行了详细的分类,包括经济建设、交通服务、旅游住宿、宗教信仰、医疗健康等18项数据主题分类。并有基于网站开放数据开发的APP应用展示和下载模块,其中提供APP应用共16个。在互动交流上设有问卷调查、建议、提交APP应用等几项设置,但互动应用较少,大多数反馈与建议都是2014-2015年的。
    www.bjdata.gov的网站信息模块中提出了如下几项授权信息:①用户有权免费获取本网站所提供的所有政务数据资源,享有数据资源的非排他使用权。但不得转让在本网站中获取的各种数据资源。②本网站所有内容的所有权归北京市人民政府所有。数据检索采用关键词和短句子进行检索,以日期、大小、相关度进行数据排列。网站数据更新频率虽然保持着每日更新。但只提供静态文件类API接口,同时需要API唯一标识码在调用政府网站的API接口时进行身份认证。该网站没有RSS订阅服务以及相关的API支持应用。但在工具类目下提供了数据搜索、分析和可视化工具,以方便用户对开放数据的开发利用。
    2.3.2 上海市政府数据服务网
    上海市政府数据服务网datashanghai.gov为我国第一个地方政府数据开放平台。截至2017年5月提供了数据集919个,数据全部来源于上海市政府下辖的各个政府机构。提供了CSV、XLS、XLSX3种可机读下载格式。网站在数据的评价上采取五星评分,允许用户对使用的数据进行质量评分。
    网站布局上,在主页提供了经济建设、交通安全、社会发展等12项数据主题分类,同时还包括了数据、应用、接口、移动应用、地理信息、互动交流6个主要类目,在应用类目提供了60个基于开放数据利用的APP应用。更新频率上保证了每日的实时更新,数据大多为2017年的最新数据。在互动交流上包含了需求调查和调查问卷两项,但用户交流反馈较少,大多为2015年的网站互动信息。
    datashanghai.gov的使用条款下包含使用授权信息有如下几项:①通过DataShanghai成功注册并完成认证的用户,对现有已开放数据享有免费访问、获取、传播和增值利用的权利,依申请类开放数据依特定条件享有免费访问、获取和增值利用的权利。②DataShanghai保留对部分数据加工产品收费访问及收费获取的权利。③DataShanghai可能会链接到其他网站,当您在访问和下载这些数据的时候,请以该网站收费政策的告知内容为准。datashanghai.gov.cn提供了所有数据的API接口,但在数据下载和API接口使用上只面向注册用户。在API使用上还需要对不同公开程度的数据进行相应的公开申请。不提供RSS订阅服务以及API的支持应用。
    2.3.3 深圳市政府数据开放平台
    深圳市政府数据开放平台opendata.sz.gov.cn建成于2016年,网站各项数据服务较为完善。截至2017年5月,提供了数据集441个,仅提供CSV下载格式,数据来源于市政府各机构以及下辖各区政府部门。
    网站布局上,opendata.sz.gov首页提供了道路交通、文化娱乐、就业服务等15项数据主题分类,同时还包括了数据下载、数据接口、移动应用、交流互动以及新增的2017年城市数据创新大赛的大赛入口共5个主要类目。在移动应用类目下提供了20个使用网站开放数据的APP应用。
    在互动交流上提供了数据需求、咨询建议、问卷调查3个互动类目,但没发现任何用户响应和反馈信息。open⁃data.sz.gov没有对数据授权信息进行相应的声明或阐述,在API接口使用上所有数据都需要进行申请调用API。数据下载只面向注册用户,但对未注册用户提供了数据预览功能。该网站也没有RSS订阅服务。
    3 调查结果对比分析
    3.1 国内外政府数据开放平台之相同点
    根据调查结果分析,得出以下相同点:①国内外政府数据开放平台的数据来源大多以政府机关数据为主,开放数据涉及的领域大多相似,以民生经济、公共服务、科技教育为主要内容。②在数据开放网站上的布局和结构上大多相似,网站主页以数据检索功能为主要部分,主要类目都包含了数据主题、相关应用展示、交流互动以及开放接口这几项。③国内外数据开放平台基本都提供了APP应用以及API接口向用户开放网站的架构,以增加用户的粘性,加快数据的再利用。④国内外数据开放平台在网站附加模块上基本都有对数据授权的声明和阐述。⑤国内外数据开放平台的开放数据大多提供了用户注册,并通过Cookies对数据使用者进行身份辨别和信息监控。
    3.2 国内外政府数据开放平台之不同点
    首先,我国尚未有国家级的政府数据开放平台,这一点是与美、英等数据开放水平较高国家的最大不同,也是存在的差距。其次,在地方政府数据开放平台方面,与国外的相比也存在以下不同:
    1)数据检索上,由于我国地方政府数据开放平台缺乏数据组织标准,导致数据组织格式多样化。同时数据缺乏必要的语义关联,极大地影响数据检索的准确度和效率。而国外政府数据开放平台绝大部分有统一的数据检索标准,且格式规范,方便检索。
    2)在用户互动上,国外平台大多有官方社交媒体,通过社交媒体与用户进行实时互动,同时还支持用户向网站按规定提供数据资源,实现双向互动。而我国地方政府平台在互动交流上仅停留于表面,只有问卷调查和用户咨询提问两项交流类目。这两种方式滞后性极强,对用户的反馈回应缓慢,甚至长达1~2年没有更新过互动交流类目,数据质量也无法得到保障。
    3)国内平台大多需要注册才能下载数据资源和调用API,不利于公民广泛地参与到开放数据的利用。国外平台大多数只有在用户上传数据信息时才需要进行注册。
    4)国内平台基本没有RSS订阅服务,RSS订阅功能的缺失,将直接影响到用户体验。缺乏面向用户的数据信息简易聚合,对于了解用户需求以及扩大数据利用群体是十分不利的,在这个层面来讲订阅功能显得愈发重要。另外,我国自媒体时代的到来也为订阅共享提供了一定的技术支持和保障,因此,借鉴国外平台的先进经验,实现该服务是可行的。
    5)国内平台都缺乏开放性的授权协定,大多数数据授权对用户有各种使用权限制。国外平台在数据授权上大多有数据开放许可协议的支持,从而保证了用户在数据开放和利用上的自由性和创造性。
    6)国内平台提供数据下载格式单一,与国外多样化的下载格式相比差距较大。
    4 策略建议与研究展望
    大数据和“互联网+”环境下,迈向政府数据开放是更好地实现政府信息公开、提高政府办事效率的必然信息化发展进程。而政府数据开放平台的建设则是数据开放中的关键所在。通过调查分析发现:无论是对于“我国政府数据开放”的理论研究还是开放平台之实践探索都与美、英等国外较发达国家相比存在一定的差距。笔者对我国政府数据开放平台的建设提出一些对策建议:
    ①创新观念,寻求大数据和“互联网+”环境下的积极思维方式,政府各部门应做好数据开放工作,统筹协调,着力构建政府数据开放平台;并建立统一的数据调控中心。以便实现数据开放与共享。
    ②我国的政府数据开放可以借鉴发达国家的有益经验,但应突出自己的特色。可由地方政府在数据开放上率先试点,推进体制改革和搭建政府数据开放平台,然后逐步由地方向中央加以推进政府数据开放。
    ③制定和健全与我国政府数据开放相关的法律,如政府信息公开相关法律、政府数据安全保护、个人隐私权保护相关法律等,确保社会公众的知情权和隐私权不受侵犯;提高安全防范意识。可以借鉴美国的数据安全分级制度,对政府数据实施有针对性的保护。
    我国学者应该更进一步开展政府数据开放的研究;特别是政府数据开放平台的框架构建和持续建设将成为未来的研究重点和热点。
栏目更新
栏目热门

关于我们 | 联系我们 | 版权声明 | 广告服务