关于大数据:⑨ 注意啥?

经过多年经管科班训练和学术研究后,我对商业理念和经济思想的态度从崇敬变为到跟随,再到现在的慎重。学术领域内的竞争产生了很多含义相似却名称不同的概念,这些理论概念从范式、逻辑、视角上来看似乎确有差异,但其目的和实效却有颇多值得玩味之处。我不敢说理论没有意义,毕竟哈耶克、凯恩斯、马克思的理论都对人类社会产生了深远的影响,但我始终想不明白现今学术文献中摆置的各种繁复的概念框和连线到底有何意义,变量间零点零几的相关到底能说明什么问题?一边是学术研究花着国帑自娱自乐,一边是经管实践摸着石头自给自足。相信做过学术研究的人都曾经有为了熟悉某个概念连续阅读数月相关文献的经历。我在这种大强度阅读中收获的叹息和愤怒远多于喜悦和激动:那些概念和逻辑上的细微差异,在现实面前其实真的无关紧要。能影响生活和现实的在宏观层面是思想所启迪的群体方向,在微观层面是研究过程中摸索出来的实施指导和操作细节。

我罗嗦这些与大数据无关的话,目的只是想在吐槽之余说一句“分析变革”并不是一种理论,而是一种现实。“现实”的意思是许多企业已在做了,现阶段的基本做法也就是前文所述“大数据”实施的三步走战略,只不过是简版:收集数据→建立模型→挂钩业务。

在数据收集中,企业要首先着力考虑的是如何收集多源数据,包括企业内外部。企业收集的数据需要具有创造性,比如业务数据、网络数据、调查数据、定性研究、实验设计,等等。数据来源不应该是一成不变,而应该是在不断尝试中逐渐增加。其次需要费力的是调整 IT 架构让不同来源的数据能整合在一起。早期企业信息化的时候,最常碰到但又最容易被忽视的问题就是企业不同业务单元,甚至不同人员手中的数据定义不同,数据难以整合。这个问题并非小问题,它甚至能严重到催生 XML 技术。对于更高、更快、更多的大数据的而言,不同类型数据的整合难度只会比以往更大。

构建模型最有效的方式是先发现商机,再决定模型如何提升绩效。单纯的数据挖掘用途有限,只会是无止境的数据搜索。大量数据的确方便跑统计检验和识别数据中包含的模式,但对一线管理者而言,一堆相关系数无助于提升绩效。问题驱动或目标导向的数据分析不但更有效果和效率,而且一线人员也更容易理解和使用分析结果。太复杂的模型不实用,因此在构建模型时需要注意的问题是模型是否以提升绩效为目标,以及模型的复杂性和易用性是否平衡。

挂钩业务时需要注意的关键是让决策者相信模型结果,理解结果怎么来的。前文描述的管理者与矿工其乐融融的分析变革高级阶段需要很长时间才能实现,初级阶段的协作模式仍需向一线管理者倾斜,因此现阶段分析挂钩业务的方向是开发可直接投入使用的分析,然后将分析嵌入简单易用的一线工具中。收集海量数据和构建精细模型本质上都是必要的,但是要把分析模型和工具包装,只向业务部门展现最简单、直接的结果。当一线管理者尝到甜头后,再慢慢升级业务流程并培养能让分析工具起效的能力。

现阶段,实施分析变革的主要矛盾不是获得大数据本身,而是如何让分析与业绩相协调。分析聚焦组织绩效且对一线工作有用且易用才是最重要的。

留言

留言由 Disqus 服务支持。