大数据:并非包治百病

    |     2016年3月21日   |   会议会展   |     评论已关闭   |    741

围绕大数据及其相关主题的“喧嚣与骚动”已经到了难以忽视的地步。“大数据”一词是指各种各样的电子设备每秒产生的信息洪流。这些设备时刻记录信息的同时,也从某种程度上影响着普罗大众的私人和职业生活方式。每天产生的数据量极其庞大,完全无法精确量化。目前只知道该数量非常“ 巨大”,由计算机生成并为其他计算机组所用的信息链持续以前所未有、超乎想象的速度增长。真正的挑战并不在于数据的可得性,而是如何从中获取有用的知识。

“他们不知道我们知道他们知道我们知道了。”幽默之余,这句话也凸显了这样一个事实,即有时候我们只不过是一知半解。我们需要更深入地分析,才能发现并获取所谓唯一版本和来源的有价值的信息。海量信息的可得性已经引发了某些可争议的,不切实际期望的项目。虽然高效地利用大数据的力量有望带来巨大的收益,这一点毋庸置疑,但在踏上大数据之旅前夕,各组织机构应将众多风险因素纳入考虑范畴。

“后此谬误” 谬论的受害者

后此谬误”(Post hoc ergo propter hoc) 是一种逻辑谬误,它基于这样一种因果推理:完全根据事件的先后顺序来推断结论,而不考虑所有的相关因素。以下事例是此谬误的典型实例:甲广播台增加了 20% 的广告预算,结果发现收入得以大幅增长。为了摆脱收入持续下降的困境,乙广播台也决定投入增加广告支出。在这个简单的例子中,两个关联事件(增加广告支出和收入增长)之间的因果关系发生了混淆,例如事件一(增加广告支出)引发了事件二(收入增长)。

谈及大数据的考虑事项时,“后此谬误”这一概念似乎使各类机构的决策者如堕云雾。同行/竞争对手采取的措施、咨询师提供的市场营销技巧,或仅仅是对大数据效益的普遍看好,这一切似乎让各组织都急于竞相追逐大数据浪潮,而往往忽略了对明确清晰的目标设定,发起和维护项目所需各种投入的缜密分析以及其他变量等的正确考量。

大?数据?掌握忽略的艺术

一个首要的反思是如何确定大数据的关键点,到底是 “大”还是“数据”?两者皆有?还是二者皆非?正解是,二者皆非。

仅仅通过现代数据捕获技术单纯收集大量数据意义甚微。如何利用数据以及如何将其用于决策过程才是关键所在。大数据相关的文献中频繁出现各种不同的表达(如数据过载、数据疲劳、大海捞针、百里挑一、沧海一粟等)。这些都指向一个简单的事实,那就是现今所捕获的大部分数据很可能可以忽略。

不可否认的是, 如今产生和捕获的数据量正以前所未有的速度飙升,有效利用数据取得的成功已得到初步证实。同时也必须承认,未经合理规划和目标设定,踏上大数据之旅的组织只能无的放矢,却不切实际地奢望正中靶心。

逐一分析大数据的属性
十多年前,有人就引入了大数据本身具备的 3V 属性,即数量 (volume)、速度 (velocity) 和多样化 (variety)2,只是那时很少用来定义大数据。表 1 列出了针对各项属性所需考虑面临的主要挑战。

表 1

将项目管理的原则应用于实施大数据项目的决策过程

大数据仅仅是看待数据的另一种方式,并且仅应当如此对待。 虽急于执行大数据项目,但不应有悖于起初启动项目的合理性。 应全面考虑并对当前的业务问题/改进, 通过大数据技术解决问题的适当性与实用性,以及预期投资回报率(ROI)等进行明确的计算、讨论和审批。 最起码应当如实回答以下问题:

该大数据项目的问题/目标是什么?
为何有人认为可以利用大数据来解决?
何时才能实现预期的投资回报?
团队成员都有谁?大数据项目的参与人员应当符合能够适应变化、乐于接受新兴技术和热衷于数据操作等特征。
不同的组织部门(如,IT 部、业务部和研发部)如何就该项目进行协作,一个部门如何得知其部门已达到目标?
所有必要的项目管理原则,包括项目启动、规划、执行、监控和收尾,都必须应用到大数据相关的项目中。表 2 显示了典型的软件开发生命周期 (SDLC) 项目的各个阶段以及相应阶段的重要考虑因素。

表 2

在考虑前述关键控制因素的同时,还需牢记:

该列表仅包括主要的注意事项,只是一般而言,并不详尽。所有组织均应按照其执行的项目管理方法对各阶段的交付物进行评估。
假定各阶段均考虑到信息安全问题,且相关交付物已获得批准。
结论
通过利用大数据,各组织可以显著改进业务流程,并积极应对风险。但是,如果缺乏对大数据项目的规划,各组织注定无法取得预期的结果。

审计人员应当谨慎进行评估,并确保所有的大数据项目都根据已确定的项目管理方法来开展。此外,还应当定期向管理层提交进度报告,以确保项目进行中所采取措施的可行性。

转载请注明来源:大数据:并非包治百病

相关文章

噢!评论已关闭。