大数据真正的财富蕴含在产业链条而非消费链条之中,因此,大数据与产业融合将成为落地的根本
互联网上的每一个“你”是否意识到,在网络浏览新闻、收发邮件,在电商下单购物,在社交网站与朋友互动,甚至用手机APP上传自拍照片……你的每一个网络“足迹”都会以“数据”形式被记录并存储下来,而这些以几何数量级增长的数据正在逐步重构互联网世界,也在重构我们的生活。
过去的一年内,大数据无疑已经成为年度最火IT词汇。EMC、IBM、Oracle等跨国IT巨头纷纷发布大数据战略和产品,美国实施大数据计划,联合国发布大数据报告,我国不少城市和园区宣布发展大数据产业。然而争议总是伴随着热点,对于大数据,反对者认为这不过是企业又一次概念的炮制和兜售、又一场跑马圈地热潮。
“由于数据量缺失、大数据清洗和分析能力不足以及数据可视化瓶颈等问题,几年间大数据在国内迟迟未能落地”,在接受《中国投资》专访时,天云大数据CEO雷涛告诉记者,目前随着基础设施布局的逐渐完善,大数据的发展已经走到一个新的临界点。
当前,多媒体、社交媒体、物联网的广泛应用都将极大地增加企业所能获取的信息量。加工机械内置的传感器正在收集运营数据,营销人员扫描社交媒体或利用智能手机的定位数据了解顾客的消费习惯,数据交换可能正在与供应链合作方联网,员工则可以在企业内部网上交流最佳做法。据IDC预测,到2020年全球将总共拥有35ZB(10万亿亿字节)的数据量。
在雷涛看来,虽然目前我国大数据产业还处于发展初期,市场规模仍然比较小,但国内厂商正快速跟进,整体产业生态环境正在建立之中。他告诉记者:“天云大数据就是希望在拥有大量数据资源的金融、电信、安全等行业发力,将大数据的概念落实在垂直领域内,将产业企业积累的数据价值给予体现”。
首要投资:分布式计算
此前全球著名信息技术研究和咨询公司高德纳公司曾发布报告预测,2016年,大数据对全球IT开支的直接或间接推动将达到2320亿美元。赛迪顾问研究表示,2013年中国大数据IT应用市场规模达到34.3亿元,未来3年大数据应用市场将呈现爆发式增长,以近90%的年均复合增长率增长,到2015年,大数据应用市场规模预计将达到144.96亿元。
在雷涛看来,大数据真正的财富蕴含在产业链条而非消费链条之中。“产业互联网的出现使得更多的数据被产生出来,各式各样的移动设备以及产业链条中生产线上的传感器所采集到的数据全都进入产业结构中,对于产业的升级和变化都是一个巨大的商机”,雷涛告诉记者,相较消费数据,生产数据所蕴含的“金矿”规模更为庞大。
每一次产业革命出现的时候,首当其冲的投资机会都出现在工具类。挖一个金矿,卖铁锹的先挣钱。这样的趋势已经在北美出现,而天云大数据则是国内较早发力在工具平台领域,帮助别人挖金子的企业。我们与北美同步先就绪一些大规模的分布式系统,这些系统替换传统结构里的数据库存储、小型机等小型架构,用大规模云计算的底层基础设施首先帮助需要挖金子的人具备这种能力。
依靠分布式系统的架构,电信运营商由之前只能处理每个人几千条的电话记录,现在可以处理每人几百万条的上网浏览记录,从中提取有价值的数据;国家电网不仅可以管理静态物资、ERP电子资源信息,还可以管理到消费者的反馈,看出来谁在使用电,哪里在使用电,从而实现更为精确的发电、送电以及进行差异化定价。这些数据的规模都是几万倍的增长,靠传统的系统架构是不现实的。因此,大数据第一类的投资机会都出现在能够率先就绪大数据工具,将原有数据结构处理不了的信息平台构建起来的厂商之中。
数据与业务融合
“第二类投资机会将会出现在科研领域,而这部分目前国内关注较少”,雷涛告诉记者,在北美地区,大数据厂商最为耀眼的明星集中在进行分布式计算和数据科学的厂商之中,他们关注的是怎么去更聪明地使用数据。例如应用大数据技术设施平台对自然语言进行规模化处理,对视觉进行处理。而这一类投资的产生与数据基础设施的建设是密不可分的,只有构建并使用了大型的数据基础设施,才能将这类创新投资与产业更为紧密地结合起来。
而第三波投资机会将会出现在如何将数据价值化的过程中。数据开始投身到某个垂直领域,而不再以云基础设施的面貌出现。雷涛表示:“越来越多的大数据工具厂商开始将工具投入到具体的产业领域内,直接产生价值。这里面就催生了很多投资机会,比如在医疗、教育这些之前很难用传统信息化结构去汇总和支撑的领域内,开始发生颠覆产业的变化。而对于那些拥有大数据资源的金融、电信行业来说,如何通过大数据的方式进行改良,进行破坏性的创新,则成为行业企业与大数据平台类企业联手的核心价值所在”。
为何使用大数据?
严格意义上的大数据运用,对于许多中国企业是不期而遇。
重庆移动现有1000多万移动用户,随着移动互联网的快速发展,手机上网用户呈爆炸式增长。但随之而来的是,由于现无法存储海量的用户上网数据,越来越多的手机用户为每月“不透明”的手机上网话费产生了强烈质疑,客服投诉压力日渐增大,也在很大程度上消耗着公司的资源和成本。
为解决这个问题,重庆移动拟新建“GPRS上网日志查询系统”,解决上网话单的存储和查询问题。然而在数据爆炸的时代,这些数据的体量日益膨胀。根据其现有业务量,每日新增的上网数据量约1TB,初期规划存储60天,总共60TB的存储量。而以手机上网日志的信息量为例,更是远远超过传统话单数据量,达到每天超过1TB的级别,且在不断增长。
“事实上除了上网行为、流量信息等老百姓看得见的方面,运营商还可通过基站上的信令数据掌握手机用户的位置信息。假如把这些大数据全都累积在一起,运营商一个省级公司一天信息量最高甚至可达1万TB”。采访中雷涛向记者表示,为提高查询效率,移动公司提出更高的计算时间和查询次数要求,在对系统的数据安全和信息安全予以设计考虑的同时,要求尽量节省总体投资造价。
以过往运营商较多采用的IBM、微软等传统关系型数据库为例,想要达到上述目的非常困难同时成本较高。雷涛告诉记者,以传统方式存储1TB的数据,成本在3万-9万元区间,而采用云计算新架构,则可将成本降低到每TB5000-1.5万元之间。在重庆移动,天云大数据采用业界领先的Hadoop分布式文件系统技术框架,节省了总体投资的60%-70%,对运营商的吸引力显而易见。当前运营商向擅长数据存储、分析的公司寻求合作,积极掌握新技术已经成为行业明显的投资趋势。
雷涛告诉记者,与其合作的国内运营商当前大数据应用普遍还是为自身业务发展服务,侧重于流量经营与精准化营销方向。流量经营方面可分析海量用户的流量使用情况,以便设计出更具针对性的流量套餐。精准化营销则通过捕捉用户的上网浏览信息等,将来可向用户投放精准广告。“至于将数据向第三方分享等商业模式,其实各方都很想做,也有过一些试验性质探讨,但隐私问题是横亘在眼前的不确定因素”。
在雷涛看来,技术层面破坏性创新正使过去的垄断者失去地位:“我们正与IBM、Oracle、SAP、VMware、EMC等国际IT巨头竞争”。
基金+基地
一些嗅觉敏锐的风险投资商早已着手挖掘和扶持本土与大数据产业相关的创业企业。随着大数据时代的到来,中国本土创业企业正日益露出光芒。雷涛认为:“大数据会孕育更多新的公司类型,这也是大数据最有投资潜力的原因。‘数据矿’就在那里,分析平台也已经成熟,现阶段是要用解决问题的视角,寻找数据分析师和懂得商业操作的人才,把数据分析产品化”。
但是庞大而开放的数据挖掘、应用体系的形成并非易事。在本土化的大数据产业发展中,“基金+基地”创新的模式,无疑是一条可借鉴之路。
由北京云基地创立的“基金+基地”模式,是以自身的云天使基金,带动海银资本等资本力量,加上顶尖技术人群的入驻和加盟,形成资本、产业和创新力量直接对话。在北京亦庄开发区内,以硬件制造为主,北京云基地中的各企业业务都围绕云计算展开,从云服务器到云箱再到云计算软件系统平台,分布在云产业链上的各个环节。
2014年,大数据基地将在北京投入建设,“基金+基地”的模式将得到复制和应用。雷涛告诉记者,之所以采用这一模式,是因为每个大数据应用的创业公司实际上都需要平台、资本和客户。提供办公基地、引入资金,就能够缓解大数据领域第三方公司的初期投资难题。