篇一
本书《大数据时代》出自维克托·迈尔-舍恩伯格,是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。舍恩伯格教授在《大数据时代》中提出:“大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。”阐述大数据是一个比较的概念,它是在人类过去运用小数据库随机抽样获得分析结果比较而来,它的关键是在“大”,数据存储量越大,价值越显著。大数据的核心作用在于“预测”,引申出“规划”与“解决方案”,也就是我们说的“算法”。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。
在现今的社会,大数据的应用越来越彰显他的优势,它占领的领域也越来越大,电子商务、O2O、物流配送等,各种利用大数据进行发展的领域正在协助企业不断地发展新业务,创新运营模式。有了大数据这个概念,对于消费者行为的判断,产品销售量的预测,精确的营销范围以及存货的补给已经得到全面的改善与优化。就我个人体会。大数据产生最直观的价值:一是时间,二是金钱。要知道“时间就是金钱,效率就是生命。”
大数据带给我们的三个颠覆性观念转变:采样数据向全部数据转变;精确制导向方向引领转变;因果关系向相关关系转变。
1.不再局限随机样本,而是全体数据:在大数据时代,我们有更多的数据可以分析,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样,这也是通过大数据打通的传统壁垒。
2.不再局限精确性数据,而是混杂性数据:以前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着数据的积累,数据库的完善,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力。
3.不再局限因果关系数据,而是相关关系数据:在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,相关关系虽然不能准确地告诉我们事件发生的原因,但是它会提醒我们事件的发生。
思考:大数据在农业领域建设。近年来,我国数字农业发展方兴未艾,从北大荒千里沃野的无人驾驶农机作业,到浙江乌镇的刷脸入住农家乐、西安阿里的智慧大脑,数字农业正在悄然地助推传统农业发展。从理想状态来说,我认为数字农业就是有一块地,你种什么,种多少,施什么肥,打什么药,卖给谁,都用数据来表达,以大数据来支撑决策,通过信息化、数字化提供全程社会化服务。具体讲,数字农业是指以数据为关键要素,以数字技术与农业融合发展为重点,以数字产业化、产业数字化为路径,实现农业生产过程及全产业链数字化表达、数字化设计、数字化管理的新兴农业形态。
当前,我国已进入加快发展数字农业的新时期,发展数字农业有条件、有需求,恰逢其时,势在必行。人类社会经历了农业革命、工业革命,如今正在经历信息革命。现代信息技术日新月异,全球数据爆发增长、海量集聚,数字经济高歌猛进。互联网、物联网、大数据、云计算等数字技术加速向农业全方位渗透,让传统农业插上数字化的翅膀,培育了经济新增长点和发展新引擎,数据对农业发展的放大、叠加、倍增作用正在快速释放。这将为农业发展带来深刻的变革,创造千载难逢的历史机遇。(张洋)
篇二
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
篇三
去年的云计算炒得热火朝天的,今年的大数据又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起大数据来了。于是乎,各企业的CIO也将热度纷纷转向关注大数据来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI最大的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。看完此书,我心中的一些问题:
1.什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity--这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2.大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过
专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,5,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3.大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响最大的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
篇四
世界的本质就是数据,当你掌握了数据,你便掌控了世界—你可以轻而易举地通过数据中的相关关系预测事物的发展,将一切不利因素扼杀于摇篮之中—这远胜于"防患于未然"。
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。全书介绍了 "大数据"时代三种大的变革:思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古中国固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
"我们不再热衷于寻找因果关系,而应该寻找事物间的相关关系",我想这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这种观念以惊人的力量给现知识状况带来了巨大的冲击,通过对海量数据的分析,获得巨大价值的产品和服务,或深刻的洞见。比如谷歌公司,2009年H1N1流行之时,通过检测检索词条,处理34。5亿个不同的数据模型,通过预测并与2007、2008年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为预测流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于预测,当敌人通过这种手段预测我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
篇五
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
江西高考排名130690左右排位文科可以上哪些大学,具体能上什么大学
福建高考排名115000左右排位物理可以上哪些大学,具体能上什么大学
山东高考排名496370左右排位综合可以上哪些大学,具体能上什么大学
滁州城市职业学院的中医康复技术专业排名怎么样 附历年录戎数线
安徽高考排名66900左右排位文科可以上哪些大学,具体能上什么大学
保定学院的知识产权专业排名怎么样 附历年录戎数线
回忆伤感爱情唯美句子
牛年新春贺词80条
团员学习共青团心得体会
语文课文生命生命读后感600字五篇
语文课文生命生命读后感600字五篇
乌鸦反哺的故事
初二朝花夕拾读后感1500字五篇
红色电影闪闪的红星观后感范文
海底两万里最新读后感800字【五篇】
骆驼祥子一至三章读书笔记800字五篇
广东高考排名242300左右排位历史可以上哪些大学,具体能上什么大学
湖北高考排名104130左右排位历史可以上哪些大学,具体能上什么大学
贵州建设职业技术学院的给排水工程技术专业排名怎么样 附历年录戎数线
河北高考排名28460左右排位物理可以上哪些大学,具体能上什么大学
内蒙古高考排名67180左右排位理科可以上哪些大学,具体能上什么大学
新疆师范大学的小学教育专业排名怎么样 附历年录戎数线
华南农业大学在天津高考历年录戎数线(2024届参考)
江苏高考排名16600左右排位历史可以上哪些大学,具体能上什么大学
烟台科技学院和上海电机学院哪个好 附对比和区别排名
河南高考排名318030左右排位理科可以上哪些大学,具体能上什么大学
福建高考排名133810左右排位物理可以上哪些大学,具体能上什么大学
苏州高博软件技术职业学院和云南理工职业学院哪个好 附对比和区别排名
贵州高考排名32850左右排位文科可以上哪些大学,具体能上什么大学
江西高考排名116110左右排位文科可以上哪些大学,具体能上什么大学
无锡科技职业学院和海南经贸职业技术学院哪个好 附对比和区别排名
广东东软学院和浙江工商大学杭州商学院哪个好 附对比和区别排名
黑龙江高考排名10690左右排位文科可以上哪些大学,具体能上什么大学
云南高考排名60240左右排位理科可以上哪些大学,具体能上什么大学
豫章师范学院和盐城工学院哪个好 附对比和区别排名
考四川建筑职业技术学院要多少分浙江考生 附2024录取名次和最低分
活法的读后感个人范文wp1
八年级下册教学工作总结范文五篇
小说哈利波特读书笔记个人感悟五篇
海底两万里第三十七章读书笔记五篇
道德经读书笔记心得领悟五篇
关于疫情下脱贫攻坚工作总结心得1000字最新精选五篇
开学第一课直播观后感1000字最新
中秋佳节的主题作文五篇
西游记每章读书笔记400字左右五篇
平凡的世界读后感作文800字五篇
悲惨世界的读后感800字范文五篇
雷雨话剧读书笔记大学生范文五篇
暑假家访个人心得体会五篇
骆驼祥子十三回读后感500字五篇
西游记30回读后感心得五篇