9月27日,中国国际大数据大会在京召开,中国信息化百人会顾问、国家信息化专家咨询委员会常务副主任周宏仁在会上发表精彩演讲。周宏仁表示,数据产业是最具有潜力的新兴产业之一,要承认数据是资产,要有数据产权和价格。
以下内容根据周宏仁演讲摘要编辑:
国家的发展靠的是经济的发展,经济的发展靠的是产业的发展,产业的发展靠的是企业的发展,企业的发展靠的是产品的发展。如果我们要推动大数据产业的发展,它的核心问题实际上是要谋划大数据产业的发展。
数据产业是最具有潜力的新兴产业之一,因为它绿色、高效、门槛相对也比较低。
产业发展的可以非常简单,也可以非常复杂。非常值得政府和企业界,甚至我们想创业的年轻人重视,这是我们找到产业发展的切入点。
如果我们谈到数据企业,它实际上有三个问题:
第一就是数据,那么数据从哪里来。
第二是市场,不管提供的是数据产品或者数据服务,你要知道你的市场在哪里,来自于哪一块。
第三是数据企业,就是它采用什么样的商业模式,采用什么样的核心技术。怎么做营销和管理。
这样的话,推动数据产业的发展,我们就需要从这三个方面来进行考虑,下面主要讲关于数据的问题。
数据是发展数据企业的前提,我们应该看到数据是信息化的产出,信息化的过程就是信息资源开发的过程,因为信息系统的构建,它开启了数据时代。以前我们用报纸、杂志、广播电视来开放信息资源,现在基本上是各种各样不同形态的一些数据。
数据的特点
数据资源有一个最大的特点就是可以再生。刚刚说的构建了一个信息系统以后,它会不断的产生新的信息。
另外,数据还可以自生,就是现在有了数据可以采取不同的分析方法,可以得出很多新的数据,而且数据资源是可以共享的业务,它不像汽车,你开了我就不能开,同样一个信息资源可以给全社会使用,看谁有本事从里面挖出东西来。
所以,数据经济已经成为我们信息时代的内涵之一,而且是通过传统经济发展的一个最重要的途径。
数据的发展
在过去60几年来,我们看到信息系统的发展,经过了从简单系统到系统再到超级系统的发展过程。
上个世纪的50、60年代,政府和企业就开始发展自己的信息系统,首先是在一个点,即单位中进行。有了互联网以后,它就开始向线的方向发展;在全球任何一个地方都可以接入到系统,就是向面发展。由点向面的发展,使得信息系统从简单系统走向系统的系统。
正是因为大系统的发展带来了大数据,像我们现在就有很多不足的大系统带来的大数据,从这张图上可以看出来,有人说2002年是数字时代的元年,到了2007年,很快就5年时间了,数据的数字化已经占到了全球的4%,而模拟数据占6%,从趋势来看,决定未来的是数字化的数据。
另外一方面,我们也看到计算对象本身也在向前发展,比如说最近刚发明的是科学计算,后来我们开始开发各种各样的管理信息系统,企业的也好,还是政府的还是事业单位的,这样就走向业务技术。
到了90年代,互联网向全球普及,计算就开始走向社会计算,这为个各样社会网络的构造奠定了一个基础,比如说QQ、微信、还有Facebook,现在正在掀起热潮的就是走向产品,就是把计算放到各种各样的产品当中去,提高产品和智能化的水平。
现在我们已经看到,产品资源的发展非常迅速,当然,产品计算最早最成功的例子,就是追溯到智能手机的发展,因为苹果的智能手机实际上是手机的计算机化,我们每个人口袋里的手机已经远远超过了打电话的功能。
在智能手机这样一股潮流的带动下,现在像智能手表、智能汽车、智能电视还有各种各样的智能的穿戴用品,还有智能的日用、家电用品等等发展的非常迅速。
有一家咨询公司故事,到2019年也就是三年以后,我们个人电脑可能会达到20到25亿台,那么智能手机有可能达到40亿部,但是比这个发展的更快的是物联网上的各种产品,各种物品,到2019年有可能这个有可能达到240亿件,所以远远超过智能手机和微机。
在这样一种情况之下,全球物联网的概念就开始提出来,工业互联网和工业4.0的提出,使全球物联网发展非常迅速,在工业互联网和工业4.0里面有一个基本的前提,就是数据要能够自动感知,这些数据里比较重要的就是企业进来的原材料,还有它出去的产品在全球的数据,要拿到这两个数据就只有靠物联网。
最近这几年对于全球物联网的关注热度是大大的升高,英特尔公司有一个估计,到2020年全球的物联网需要提供500亿物品物联。有公司估计这个数量有可能增加到2000亿。这样一个物联网比我们现在应用的互联网规模要大10倍甚至更多,这样互联网本身的发展就面临一个巨大的挑战。
可能大家也注意到,前不久Google的执行董事长埃里克讲到,全球物联网的发展可能会替代现在的互联网,他说互联网即将消失,一个高度个性化、互动化的有趣世界物联网即将诞生。
对全球物联网有两种描述方式,一个就是把原来用的互联网大写,因为前面加一个词,另外一个就叫做The internet of everthing。
从现在的规划来看,全球物联网将覆盖所有重要领域,如果全球的企业所需要的原材料和产品都要联网的话,自然就构成了一个全球的物联网,所以就包括我们各行各业,包括政府、企业还有职业单位的业务,包括人员、消费、家用,包括健康与生命,IT与网络等等,也包括各种各样的具体的要求,在这张图里面有所表示。
这样的结果是就会铸造一个人机物智能互联的世界。
我们知道,现在的互联网实际上基本上是把人联起来了,另外也把计算机联起来了,但是没有把物联起来,如果将来能构造一个全球的物联网系统,就有可能是一个人机物智能互联的世界,现在看起来比较重要的就是大家比较关注的像医疗、产业、工业、汽车、零售等等。
照这样的趋势发展下去,全球的数据总量会急剧增加,有一家咨询公司给出了这样一个图,就是在2005年的时候,全球的数据总量大概只有130EB,到2020年有可能会发展到4万EB。
现在看起来,全球物联网的发展可能会使得这个数据总量远远超过这个估值,那就取决于产品计算机化发展的速度有多快。
非常值得重视的就是在4亿EB的数据总量中中国会占到45%,估计有1.8万个数据的EB总量在中国,所以中国毫无疑问会成为全世界数据资源最丰富的国家,这是因为我们的网民多,就凭我们每个人口袋里手机的数据量就有可能是美国的4倍。
数据的来源
有这么多的数据量,难道我们的数据企业就拿不到数据吗?按理说应该不是问题,但是实际上还是有问题。现在企业遇到的第一个问题就是怎么拿到数据,现有的数据怎么能够提供给数据企业用,现在数据在哪里呢?我想有四个来源:
第一,就是自有的数据。比如说一个单位、一个企业甚至一个个体,本单位本系统信息系统有的有很多的数据。
第二,来源于政府和事业单位。比如说地方政府、中央政府、医院、学校、交通运输部门等等。
第三,来源于企业。企业里面就互联网企业,电信运营商还有银行,这些都是数据。
第四,来源于公共平台。比如说百度、Google或者是其他的可以开放给公众作用的。
根据我们专家委的调研,现在我们国家的数据大概有50%是在银行和运营商手上,他们各占25%左右。另外一大块很重要的数据是在政府手上,政府大概占到20%。
如何拿到数据
从这四个源头我们可以看出来,要具备数据资源最基本的还是要推动我们信息化的建设,就是要开发各种各样的信息系统,特别是一些比较落后的,比较后进的地区要发展大数据产业的话。
首先碰到的问题还是要发展自己的信息化,否则的话,就只有依赖于外地的数据资源。推动本地的信息化建设是一个一石二鸟的策略,有信息化数据又拿到了数据。
第二个办法就是引进外地的或者国外的互联网企业。
第三个就是利用他方的信息资源。
第四个就是可利用互联网上的全球数据资源。
大家都知道,现在扒手的技术已经相当普及了,谁都可以到互联网上去找你需要的数据。
数据的所有权
但是,在我们所有的数据当中,有一个很大的问题,就是数据的所有权问题,现在在全球庞大的数据当中,应该来讲存在着四类数据所有权。
第一个就是个人或者家庭所有。
第二个是属于公共部门所有。
第三个就是工商企业所有。比如说像淘宝、腾讯、银行等一些运营商。但是,在公共部门所有的数据里头和工商企业所有的数据里头。
第四块,有一块数据它的所有权是有争议的,就是涉隐私权数据。
如果说有四类数据所有权,怎么鉴别它的产权、优越权、使用权和利益分配,这是一个相当复杂的问题。
如果我们能够解决这些问题,才能够促使有数据的部门愿意把数据拿到数据市场上来。
坦率的讲,我们专家委曾经邀请过一些著名的互联网企业来讨论,怎么样把互联网企业的数据能够释放给社会,当然,这个释放是有条件的释放。
但是,最终没有一个企业愿意这样做,大家都认为数据是我们企业的核心资产,不可能公开的。
当然,属于企业的核心资产一定不可以公开,但是一定有一部分可以公开的,它的动力就是要确认这部分数据的产权,让它作为一种资产拿出来交易,这部分资源就有可能会释放给全社会,谁有本事谁来开发,就像刚才前面讲到的,你可以把它变成钻石。
所以,在过去几十年我们一直在讲数据资源共享,但是始终做不下去,问题在什么地方呢,我想就是数据它是一种资产。在经济学的意义和法律上,我们必须研究和承认数据在一定的情况下是一种资产,这是数据资产。
为什么可以有知识产权就不能有数据产权呢,因为数字化数据的产生是通过信息系统的建设来实现的,这就需要创新还需要大量的投入,包括资金、技术、设备和劳动力的投入,而且这种投入长常常是相当可观的。
我知道全世界的银行无一例外,他们信息化的成本大概要占到所有银行成本的20%,甚至于更多。所以他们这么大的投入,所积累的数据不是资产吗?这是讲不过去的。
所以,不管是政府的,或者是企业的,只要它经过了投入,所积累的数据我觉得应该承认是资产。
既然是资产就一定有产权,所以必须要承认和保护数据产权,原则上来讲谁投入信息建设,使数据建成了资产,谁就应该拥有资产的所有权,我想个人对于在自己的智能终端,还有计算机里数据,也可以申请数据产权。
从宏观上来讲,数据产权对于保护国家的数据资产和信息安全是非常重要的,而且我刚才讲了,中国的数据总量会占到全球数据总量的45%。
换句话讲,如果我们把全球的数据都变成资产的话,中国就占了全球数据资产的45%,所以这个对中国来讲是一个非常重要的问题,而且数据没有成为资产,数据资源就不可能真正共享。
另外一个问题就是政府数据开放的问题,公共数据的开放,大家知道公共数据是靠纳税人交钱来开放建设的,原则上公共数据应该是可以向全社会开放的。
当然,政府数据的开放也不可能是全部开放,因为在政府数据里面有牵扯到国家机密的事情,有牵扯到公民隐私的数据,政府的数据经过处理以后应该是可以尽可能的为大家开放。
当然,政府数据的开放也不完全免费的,政府的数据建立起来也需要大量的金钱维护,如果有一部分数据能够有偿的提供给商业企业服务的话,应该可以收一定的费用,这样可以用来支持政府信息系统的运行和发展。
反过来,就牵扯到纳税人的钱。政府在全社会是拥有最大量的公共数据,这个不管是发达国家还是发展中国家无一例外,政府在数据开放里应该起到带头作用,最近这几年全世界一直在推动政府数据开放运动,中国在这方面应该来讲是非常落后的。
所以政府一方面非常重视大数据的发展,但是,对数据开放重视的不够,我想这个是一个非常重要的问题。
数据作为资产就一定要定价,这个定价应该根据它的种类和性质的不同,价格会差异很大。我想这个可以由市场的供求关系定价,当然我们的物价部门可以给予一定的指导。从推动数据产业的发展上给一定的指导。
一旦数据资产有了价格,数据资产作为一种社会财富它的地位就确立了,这样的话,对全社会而言意义是非常重大的。我想中国GDP的发展肯定不能靠房地产,但是可以靠数据产生的。
还有跟大数据发展有关系的,我想就是我们应该看到大数据是科学和技术的前沿,所以发展数据科学,培养一大批的数据科学家是非常紧迫的任务。