几年前,大数据似乎还是科学家才会关心的事,但如今,它已触手可及。
例如,著名职场社交网站LinkedIn公布的2014年最受雇主喜欢、最炙手可热的25项技能中,统计分析与数据挖掘位列榜首。而研究机构Gartner预测,2015年,全球将新增440万个与大数据相关的工作岗位,25%的组织将设立首席数据官一职。
政府机构同样正经历深刻的变化。今年5月,曾在LinkedIn、eBay、Skype等硅谷公司任职的帕蒂尔(DJ Patil)被奥巴马任命为白宫首位首席数据官和制定数据策略的副首席技术官。这一史上最荣耀的IT职位旋即吸引无数关注。
与之相对,最近两年,国内不少地方政府也赶起了“时髦”,开始建立全新的政府职能机关—大数据管理局。如果用更接地气的称呼,这些局长也就是当地的首席数据官。
据了解,这些新生机构目前大多承担着组织制定数据收集、管理、开放、交易、应用等标准规范、推动政府数据开放、推进大数据产业发展等方面的职责,但目前还没有很多落地的动作。
而9月初,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。《纲要》指出,2018年底前,要建成国家政府数据统一开放平台,率先在信用、交通、医疗等重要领域实现公共数据资源合理适度向社会开放。
有业内人士接受时代周报记者采访时认为,各地建立大数据管理局,其实正是对国务院要求发展大数据的提前响应。既然如此,这些新生机构准备如何推动中国的大数据产业发展呢?
由政府牵头推动大数据产业
9月1日,成都市经济与信息化委员会的网站上挂出一则《关于成立“成都市大数据管理局”筹备组的通知》。这份公告显示,成都市委编委2015年第2次会议决定,批准在该市经信委下设立大数据管理局。
大数据管理局的名字听上去颇为新鲜,但这已不是国内首家。此前,广东、辽宁等省均有地方政府率先试水。
据了解,大数据管理局的提法最早出现在2014年1月的中共广州市委十届五次全会上,成立这个“局”的目的是为统筹推进政府部门的信息采集、整理、共享和应用,消除信息孤岛,建立公共数据开放机制。
这一构想很快得到立法支持。1个月后,广东省政府印发《广东省经济与信息化委员会主要职责内设机构和人员编制规定》,其中明确提及成立广东省大数据管理局。
此后,当年5月,广东佛山南海区挂牌成立数据统筹局;没过多久,广东清远在其经济与信息化局的“三定方案”(定机构、定职权、定人员)中要求设置大数据管理科。
而到今年5月,广州市政府公布工信委、商务委、国资委3个部门的“三定方案”。根据方案,广州市工信委设立直属行政单位广州市大数据管理局,主要负责研究拟订并组织实施大数据战略、规划和政策措施,引导和推动大数据研究和应用工作;组织制定大数据收集、管理、开放、应用等标准规范等9项职责。
按照规定,这个正处级单位内设3个科室,分别为规划标准科、数据资源科(视频资源管理科)与信息系统建设科,同时,配备行政编制15名,包括局长(副局级)1名,副局长(副处级)2名。
几天后,辽宁沈阳亦快马加鞭地建立了大数据管理局,级别为正局级,同样下设3个部门—大数据产业处、标准与应用处和数据资源处。而之所以说“快马加鞭”,该单位从组建到挂牌,前后只用了短短两个多月。
不止如此,公开报道显示,上海市政府也有建立大数据局的构想,但目前尚在研究阶段。
而在今年6月习近平总书记曾前往考察大数据产业发展情况的贵州省,有知情人士对时代周报记者披露,“贵州也有建设大数据管理局的模块,但当地的考虑是,希望大数据产业发展成熟后再规划大数据局进行统筹、管理,而在大数据发展期,这个产业需要省委省政府从大局上进行推动”。
几乎一夜之间,全国多地的政府组织架构中都出现大数据管理局。“目前,各地都逐步意识到政府数据公开的社会价值与商业价值,于是纷纷成立大数据管理局,由之牵头,推动当地的大数据产业发展。”贵阳大数据交易所执行副总裁王亚川告诉时代周报记者。
而易观智库分析师认为,各地成立大数据管理局是为响应国务院对发展大数据的要求。而《纲要》出台后,各级政府肯定会作出更多回应,“成都此次应该是提前布局了”。
“其实,不管是广东省委书记胡春华,还是贵阳市委书记陈刚,这几个率先尝试成立大数据局的地区,他们的领导有一个共同点—都从北京出来,而且,到地方之前都已经有发展大数据产业的成熟想法。”上述知情人士表示。
开放数据将带动创新产业
对于顺应潮流而生长的大数据管理局,很多人非常好奇,这个机构究竟要做些什么?它与已有的统计局又有何不同呢?
按照王亚川的观察,各地政府目前拥有的数据可以分为两类:政务数据和政府数据。统计局偏向收集政务数据,通常都是数字,比如经济指标;而大数据管理局的主要对象是政府数据—政府在行政审批、非政府审批、服务事项等方面留存的数据,其中包括一些非标准化的文字数据。
而亚信数据副总裁邹明达告诉时代周报记者,统计局与大数据管理局的目标与定位有着天然的差别。首先,前者通过各级政府统计、申报、汇总获得结构化数据,后者则通过城市的政务信息化、社会信息化、产业信息化的全面推进,提取结构多样的海量业务数据、过程数据、行为数据并进行汇总、加工、分析、挖掘;而且,拿到数据后,前者运用于决策或指数发布,而后者要做的是最大程度地发挥数据的社会服务或商业价值;此外,从数据量级来看,后者处理的才是真正的大数据。
“大数据管理局目前急需行使的主要职能包括,其一,消除数据孤岛,将散落在各个委、办、局的政府数据汇集起来,形成全省或全市的数据中心;其二,通过政府立法等制度建设,对各行各业如何安全使用数据进行有效监管。”邹明达说。
事实上,消除数据孤岛只是第一步,大数据管理局更大的“野心”在于推动政府数据公开—时代周报记者梳理发现,广州、沈阳、成都三地对大数据管理局的职能设定中都有一句类似的表述:组织制定大数据收集、管理、开放、应用等标准规范。
而在《纲要》中,国务院重点部署三项主要任务。其中,首要任务便是,加快政府数据开放共享,推动资源整合,提升治理能力。
据了解,政府及相关部门如果能在收集、管理数据的基础上开放数据,例如开放医疗数据、病例数据,这些数据的分析结果一旦服务于医药研究公司,那么释放的将不仅是商业价值,还有巨大的社会价值。
目前,在政府数据开放上走得最前的贵州省已将医疗数据列入数据公开目录。不过,贵州的政府数据计划分三期开放,医疗数据不在首批之列。
“现在的企业大多只基于自己长期积累的数据做一些大数据业务,阿里巴巴设立的蚂蚁金服就是一个典型案例。它利用天猫、淘宝的数据扶持自己的业务,但要想服务全国市场,仅仅依靠淘宝、天猫的数据是远远不够的。所以,政府数据以及一些行业数据公开后,对于阿里巴巴来说,相当于打通了数据来源的壁垒,他们的业务将得到更好的支持。”王亚川说。
在他看来,开放政府数据对于产业发展的意义还在于,一些学者、学子以及初创型企业会在数据应用上创造出全新的商业模式,从而实现“大众创业、万众创新”。
其实,政府通过开放数据带动商业发展在国外有过不少案例。比如,1983年,美国将卫星定位系统从军用转为向公众开放,结果带动了一批创新企业的发展,创造就业岗位约300万个。
而在贵州,该省此前通过第一届大数据商业模式大赛,成功吸引一批创业者和创业项目入黔。这个比赛最与众不同之处就在于主办方承诺,在初赛阶段向参赛者开放部分政府数据目录;复赛和决赛阶段则进一步开放经过“脱敏”处理的数据资源,帮助项目设计者开发、完善参赛方案。
谁来制定标准?
虽然开放政府数据可能带来诸多益处,但这并不是一件“说开放就能开放”的易事,因为,政府首先要制定数据开放的规范和标准。
据了解,目前,多数地方停留于“消除数据孤岛”的阶段,在真正公开政府数据之前还要完成数据公开目录设计以及数据清洗、脱敏等工作。而如何设计数据公开目录;哪些数据先公开,哪些后公开,设定这些规则是一个难题。
比如,贵州是全国第一个尝试公开海量政府数据的省份。此前,贵州省经信委信息产业发展处处长魏巍在接受采访时表示,该省省一级政府机构的业务系统自去年6月始分批迁入“云上贵州”系统平台。迁云前,各个迁云单位首先要按照涉密、非密敏感、开放三个类目梳理已有数据。迁云后,涉密数据不开放,开放数据必须开放,非密敏感数据视情况而定。
当时一位参与迁云工作的某单位人士觉得工作难度很大,因为,“省大数据办要求我们开放数据,但开放到何种程度由业务部门自己把握。可我们一开始没有经验,不知道某些数据能否开放,也无法预估开放之后会否引发问题”。
不过,在一些业内人士看来,贵州先行先试后,其他地区可以借鉴经验。“政府数据主要有政府审批、非政府审批以及服务事项三个来源,其中,行政审批数据目录在各个地方的可复制度很高,而其余两项数据目录,各地也有50%-60%的重合度。”王亚川说。
“如果只是整理数据目录,这并不困难,关键是如何在开放过程中保证数据安全与公民隐私。比如地理信息数据,原则上是可以开放的。但如果这些数据精确到某种程度,那可能会危害国家安全。所以,我们要把国家在安全和保密方面的规定整合进来,对数据开放行为进行制度层面的约束。从这个角度来说,那些设立大数据管理局的地方就可以通过这个职能部门完成这些工作。”邹明达说。
不过,任伟魏却并不看好由大数据管理局承担组织制定大数据收集、管理、开放、应用等标准规范方面的职能。
“各地大数据管理局制定标准后,除了用于政府数据,也会使本地企业向这些标准靠拢,但问题在于,与大数据行业本身高速运转的现状相比,政府的工作节奏慢,存在滞后性,恐怕无法在短期里解决行业需要改善的问题。”
“而且,各行各业的大数据应用水平差距明显,金融、零售、电信等大数据应用成熟的行业早已过了制定标准规范的阶段,现在更多关注运营,以及客户资源挖掘中的风险。而例如旅游这些当前大数据应用相对缓慢的行业,反而需要尽快完成标准制定的工作。”任伟魏说。
在他看来,如果各个大数据管理局都自立标准,那么,各地的标准之间还存在能否统一、兼容等问题,否则,这就是画地为牢。“而且,各地的大数据管理局还可能争抢全国性标准规范制定中的主导权,从而出现掣肘。”
数据交易雏形
事实上,完成制定大数据收集、管理、开放、应用的标准规范后,大数据管理局或将进入更深层的领域—数据交易。至少,沈阳大数据管理局的职责中就包括制定大数据交易的标准规范。
据了解,目前,贵阳、武汉、陕西西咸新区等地都成立了大数据交易所,探索大数据交易机制,而广州、哈尔滨等城市正有这方面的计划。今年5月,国务院副总理马凯还曾到贵阳大数据交易所考察。
但国内的大数据交易如今尚在初期。王亚川告诉记者:“我们认为,底层数据是不可交易的,但通过清洗、脱敏、建模及可视化技术形成的分析结果可以交易,而且,可以反复交易。例如,车管所的一些数据既可以服务保险公司,也可以被其他行业所用。”
而参与发起长江大数据交易所的亚信数据副总裁邹明达认为,数据交易要经历三个发展阶段,首先是数据的信息化,也可以理解为采集数据;其次是数据的资产化,即,把数据变成类似商品实物的资产;最后才是数据的资本化。到了这个阶段,数据可以被定价,可以像金融商品一样交易。“目前的数据交易处于数据信息化和数据资产化的阶段,尚未达到数据资本化的高度。”
邹明达表示,他们做的大数据交易只是数据使用权的交易,或是通过数据加工得到的有价值的结果的交易,而非真正意义的产权交易。
而在定价方面,运营中的大数据交易所普遍采用撮合定价的方式:交易所拥有价格的建议权,数据卖方拥有决定权,而影响价格的主要因素包括数据的量级、样本的覆盖度、数据颗粒的大小、质量、更新频率等。
据介绍,从今年4月中旬运营至今,贵阳大数据交易所总共完成了2000多万的交易额,目前的交易主体主要是行业内的大型企业。比如,首批数据的交易卖方为腾讯和广东省数字广东研究院,买方为京东云平台及中金数据。通常,在交易中,贵阳大数据交易所获得交易金额的四成,数据卖家获得六成。
而据王亚川透露,预计今年年底,贵州省将有第一批政府数据推送到贵阳大数据交易所进行变现。
王亚川认为,政府数据分为三类,一类是惠民信息,无偿公开;一类是国家保密条例限制的数据,不予公开;还有一类则是政府可以公开但没有义务公开的数据。“过去,政府没有动力开放这部分数据,但在国务院发布《纲要》后,政府的开放动力增强,他们会借助大数据交易所的平台来开放数据,同时实现变现。”王亚川说。
业内也有一种观点认为,政府数据的实际拥有者是民众,政府能否通过售卖这些数据获得收益还有待探讨。
对此,邹明达则认为,政府在开放数据之前需要进行数据收集、清洗、脱敏,甚至还要按照需求加工,这些都要花费成本,所以,数据开放不能完全依靠财政支出,可以有一些收入。
事实上,除了各地带有政府或国资背景的大数据交易所正在积极探索数据交易之路,阿里巴巴旗下的阿里云也在尝试设计数据交换机制。
“在交易机制这块,包括政府、阿里这样的互联网企业,以及IBM、Oracle等ICT企业,各方都想成为主导者。”任伟魏认为,在数据交易这件事上,大企业的想法是成为业内标准的制定者,而中小企业自己产生的数据不多,寄望相应的机制能够保证其充分利用各类数据源。
不过,大数据交易距离标准规范最终落定还有很长一段路,毕竟目前,各地的大数据管理局才刚刚成立,他们的工作正从顶层设计向多个维度逐渐展开。