为什么大数据项目总失败?你没问对这四个问题
admin
2021-01-06 17:02:32
0

当今时代,数据已经成为我们经营业务的核心手段。事实上,据全球市场情报公司IDC预计,到2020年,全球花费在数据分析项目上的支出将达到2743亿美元。然而,其中的大部分钱并没有得到合理地利用。据高德纳咨询公司(Gartner)的分析师尼克•赫尔德克的估算,高达85%的大数据项目是失败的。

问题的重点在于,出现在电脑屏幕上的数字具有一种特殊的权威感。一旦数据通过大量的数据库被提取出来,并通过复杂的分析软件进行分析,我们就几乎不再会去关心这些数据究竟来自哪里,它们究竟是如何被修正的,更不会去关心它是否真正适用于我们的研究目标了。

为什么大数据项目总失败?你没问对这四个问题

因此,实际上,要想从数据中得到有用的答案,我们便不能只看到它表面的数据值。我们需要学会如何提出更加深层的问题。我们尤其需要知道这些数据是如何得出的,我们用了什么样的模型来分析它们,以及在这一分析过程中究竟遗漏了什么。最重要的是,我们需要超越仅仅使用数据来优化操作程序的做法,并学会利用数据来构思新的生产可能性。

我们要问的第一个问题是:

一、数据是如何得出的?

据说,数据一词是“奇闻轶事”的复数形式。英语中有一句俚语,叫“很多奇闻轶事聚在一起就成了数据”。的确,真实世界的各种事件,如交易记录、诊断结果和其他诸多相关信息,都被一一记录下来,并存储在大型服务器之中,这就是数据。但几乎没人会关注这些数据究竟来自哪里,因此,非常不幸的是,我们收集到的数据的质量和处理方式可能会有很大差别。事实的确如此,高德纳咨询公司最近的一项研究揭示出,由于收集到的数据质量太差,每个公司平均损失竟然高达1500万美元。

一般来说,数据的准确性会受到人为错误的影响,例如当低工资和动力不足的零售职员检查库存时,他们收集到的数据就往往并不准确。然而,即使数据收集过程是自动化的,也仍然会有很多的错误来源,比如手机信号塔的间歇性停电就会造成错误;在金融交易清算过程中运用自动化的信息收集方式同样可能产生错误。

相关内容