《大数据时代》读后感

王明刚老师

《大数据时代》读后感

  这两年,大数据这个词突然变得很火,不仅出现在互联网公司的战略规划中,同时在中国国务院和其他国家的政府报告中也多次提及,无疑成为当今互联网世界中的新宠儿。笔者对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据时代》才有了粗略的认识。

  《大数据时代》从思维、商业、管理三个方面阐述了在大数据时代下的变革。这些变革涉及人们生活的方方面面,其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点:第一,不是随机样本,而是所有数据,这里要求数据有很多。第二,不是精确性,而是混杂性,这里要求数据更杂。第三,不是因果关系,而是相关关系,这里要求数据要更好。第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为这本书的精髓部分是第一部分。第一部分的三个观点涉及面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。

  笔者侧重于从第一部分中的这三个观点谈谈自己的看法。这三个观点其实就是哲学上讲的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。

  首先,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,人们可以获得海量的数据,抽样自然就失去它的意义了。

  其次,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据,一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的.结果就越靠近正确答案。大数据时代要求人们重新审视精确性的优劣,书中还说到大数据不仅让人们不再期待精确性,也让人们无法实现精确性。

  最后,不是因果性,而是相关性,这是这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究天们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分地利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于策略的帮助作用。

  作者在书中把大数据说得很厉害,在最后一部分分析大数据带来无数好处的同时,也带来了不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致人们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,人们将被禁锢在大数据的可能性之中。书中提出了两种解决方法,一种是使用数据时征询数据所有个人的知晓和授权,另一种是技术途径匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。

  大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,人们只有顺应这种潮流,在思想上和技能上做好准备,才能成为时代的弄潮儿。对于一家公司或一个国家,要从根本上改变思维和观念,尽早适应这种潮流。