关于大数据:① 这是啥?

大数据(Big Data)是个我很不喜欢的词,因为常让我不知所措。这个词很简洁,每个人第一次看到时都能生出某种联想,概念直观有力;这个词也很简陋,每个人产生的联想又都不同,想和他人聊聊想法,得先讨论半天概念内涵,结果是讨论地精疲力尽,却还在确认对方的理解。

抛开英文表述,单看中文,“大数据”便有两种不同的理解。一种是将“大”理解为规模描述,即数量很多的数据;另一种是将“大”理解为价值描述,即重要性高的数据。两种含义有不同,也有重叠。

数据规模大是计算机背景的专业人士最常谈及的大数据,也是第一个需要考虑的含义。信息膨胀带来的存取问题先催生了 NoSQL、Hadoop 等新技术,接下来要考虑的便是拿这些耗费诸多人力物力保存下来的数据做什么。这一大堆数据是啥?

最初保存数据的目的是将古老的纸面工作腾挪到电脑系统上,即可提高工作效率,又可节约文具成本。这项工作还没完成时,管理者就发现存在系统里的数据存取方便,从而分析的效率也大大提高,而且还避免了转录过程中的二次错误,人们自然想到利用数据改进产品和业务,商业智能(Business Intelligence)概念便开始出现。一开始伴随着人们对人工智能想象的无限放大,专家系统(Expert System)曾经热闹了一阵,但终因人们对分析的理解局限,逐渐淡出了潮流。但这种“智慧XX”理念一直在默默耕耘,越来越多利用数据设计出来的自适应机制让生活日益快捷便利。用户虽然意识不到数据对自身的影响已经或可能达到何种地步,但也已本能地将操作繁琐、不能自适应的产品看作“烂”产品。因此从规模角度来看,数据就是规模很大的业务工作副产品,用于支持和改进业务。

商家和创业者对数据的价值看得很清楚,于是有了对大数据的第二种理解。但对数据的价值无限放大的结果是有些人谈及信息都冠以”大数据”。比如个人信息有商业价值,于是贩卖联系电话也变成是在经营大数据业务。那么从价值角度理解的大数据是啥?

数据本身是块死肉,不经过分析的烹饪很难吃。数据如果理解成信息,其价值早就为人所知,是“比钱更值钱的东西”。但这是情报学的范畴,不是大数据的重点。大数据的价值在于能从数据中寻找到规律和模式,从而发现甚至创造商机。这也是创业理论研究将“创业机会”作为研究焦点的原因之一。但很遗憾,创业机会研究只是在翻来覆去地唠叨机会类型、决策过程、机会捕捉,等诸多概念,商机还得靠直觉、分析和试错来把握。大数据能帮助实干家进行用户需求精确定位、流程损耗关键分析、行业趋势前瞻判断,等等。利用自有的、贩售的、抓取的数据捕捉机会和改进竞争是大数据的商业价值所在。因此提升分析的作用,降低直觉的错误,减少试错的成本,这些才是数据的价值内涵。

大数据的内涵常常是越讨论越宽泛。其实我身边的人已经开始避免直接说“大数据”了,偶尔提及,也会略带自嘲地笑一下:“抱歉,实在想不出更方便的词”。

留言

留言由 Disqus 服务支持。