大数据时代
作者: [美] 维克托•迈尔•舍恩伯格(Viktor Mayer-Sch鰊berger)著出版社: 浙江人民出版社
副标题: 生活、工作与思维的大变革
原作名: Big Data:A Revolution That Will Transform How We Live, Work, and Think
译者: 周涛 译
出版年: 2012-12
页数: 261
定价: 49.90元
装帧: 平装
ISBN: 9787213052545
http://pan.baidu.com/share/link?shareid=375742&uk=2469386347
http://pan.baidu.com/share/link?shareid=478536&uk=3104835179
http://bbs.weiphone.com/read-htm-tid-6534737.html
据说最近与IT有关的热门话题之一就是大数据。查看了一下亚马逊中国图书销售情况,大数据时代 最具人气。咱泥腿子也来跟着时髦一把,紧跟形势翻阅学习一下,顺便摘录一些段落。
目录
推荐序一 拥抱“大数据时代”
推荐序二 实实在在大数据
译者序 在路上·晃晃悠悠
引言 一场生活、工作与思维的大变革
大数据,变革公共卫生
大数据,变革商业
大数据,变革思维
大数据,开启重大的时代转型
预测,大数据的核心
大数据,大挑战
第一部分 大数据时代的思维变革
01 更多:不是随机样本,而是全体数据
让数据“发声”
小数据时代的随机采样,最少的数据获得最多的信息
全数据模式,样本=总体
02 更杂:不是精确性,而是混杂性
允许不精确
大数据的简单算法比小数据的复杂算法更有效
纷繁的数据越多越好
混杂性,不是竭力避免,而是标准途径
新的数据库设计的诞生
03 更好:不是因果关系,而是相关关系
关联物,预测的关键
“是什么”,而不是“为什么”
改变,从操作方式开始
大数据,改变人类探索世界的方法
第二部分 大数据时代的商业变革
04 数据化:一切皆可“量化”
数据,从最不可能的地方提取出来
数据化,不是数字化
量化一切,数据化的核心
当文字变成数据
当方位变成数据
当沟通变成数据
世间万物的数据化
05 价值:“取之不尽,用之不竭”的数据创新
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
给数据估值
06 角色定位:数据、技术与思维的三足鼎立
大数据价值链的3大构成
大数据掌控公司
大数据技术公司
大数据思维公司和个人
全新的数据中间商
专家的消亡与数据科学家的崛起
大数据,决定企业竞争力
第三部分 大数据时代的管理变革
07 风险:让数据主宰一切的隐忧
无处不在的“第三只眼”
我们的隐私被二次利用了
预测与惩罚,不是因为“所做”,而是因为“将做”
数据独裁
挣脱大数据的困境
08 掌控:责任与自由并举的信息管理
管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
管理变革2:个人动因VS预测分析
管理变革3:击碎黑盒子,大数据算法师的崛起
管理变革4:反数据垄断大亨
结语 正在发生的未来
参考文献 谢谢分享 推荐序一 拥抱 “大数据时代 ” 推荐序二 实实在在大数据
中国互联网发展的重要参与者,知名IT评论人 谢文
此书的一大贡献就是在大数据方兴未艾、众说纷纭的时刻,进一步阐述和厘清了大数据的 基本概念和特点,这对许多以为大数据就是“数据大”的人来说很有帮助。
大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非 常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过 去不可能获取的知识,得到过去无法企及的商机。
大数据将逐渐成为现代社会基础设施的一部分,不会因为人们 的使用而折旧和贬值。
大数据时代的经济学、政治 学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体 系、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论将会转变为实证科学中 的具体问题。可知性是绝对的,无事无物不可知;不可知性是相对的,是尚未知道的意思。
对于不从事网络业、IT业以及数据分析和使用的读者,本书的一大好处就是通俗易懂,通 过具体实例说明问题,有助于人们的理解和联想。
没有市场经济制度和法治体系作为 基础支撑,大数据很可能成为发达国家在下一轮全球化竞争中的利器,而发展中国家依然处于 被动依附的状态之中。整个世界可能被割裂为大数据时代、小数据时代和无数据时代。
如今适逢世界走向数据化,迈入大数据时代的时刻,无论对个人、企业还是对社会和国家,都有 认真理解、严肃决策的必要性和紧迫性。哪怕仅从这一点考虑,读一读这本书也是很值得的。 译者序
在路上 ·晃晃悠悠
电子科技大学教授,互联网科学中心主任 周涛
接下翻译这本《大数据时代》的任务时,我的目标是做到110%的好。很遗憾,我们最终只做到了90%。如果再给我一个月的时间,就可以达 到我预想的110%甚至120%。
为什么现在把这个版本呈现给诸位呢?一是因为我们的努力使得本书中译本的出版和英文 原版完全同步,单从获取知识的角度讲,我们一点儿不比美国的读者慢!二是我相信作者在书 中的一个重要观点,就是大数据时代,要允许一点点的错误和不完美,因为效率可能更加重 要!留下一些可供提高的地方,也使得我们的每一次印刷,都能够与以前有所不同。亲,这不 是建议你等到某个更好的版本才去购买,而是说,其实你应该每个版本都买一本。
《大数据时代》这本书是200%的好,因此90%的译本也绝对值得一读。首先,作者抛出了 大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要 因果;接着,从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在 材质和智力方面向前滚动的最根本动力;最后,作者冷静描绘了大数据帝国前夜的脆弱和不 安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
这本书好在三个地方:
一是观点掷地有声
二是观念高屋建瓴
三是例子丰富翔实
三点近乎完美地结合起来,所以说,这本书绝对不是一堆枯燥的纲要,更不是一本巨 厚的杂志。
我在这里拼命叫好,是为了这本书卖得更多。
希望《大数据时代》给予各位的是一些实实在在的知识和思考,并且唤起各位安静思索相 关问题的心境。大数据是一个很重要的概念,代表了很重要的趋势。 引言 一场生活、工作与思维的大变革
大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……
大数据,变革公共卫生
2009年出现了一种新的流感病毒。这种甲型H1N1流感结合了导致禽流感和猪流感的病毒的 特点,在短短几周之内迅速传播开来。全球的公共卫生机构都担心一场致命的流行病即将来 袭。
在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师们在《自然》杂志上发表了 一篇引人注目的论文。它令公共卫生官员们和计算机科学家们感到震惊。文中解释了谷歌为什 么能够预测冬季流感的传播:不仅是全美范围的传播,而且可以具体到特定的地区和州。谷歌 通过观察人们在网上的搜索记录来完成这个预测,而这种方法以前一直是被忽略的。
他们设立的这个系统唯一关注的就是 特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检 索词条,总共处理了4.5亿个不同的数学模型。在将得出的预测与2007年、2008年美国疾控中心 记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45条检索词条的组合,将 它们用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%。和疾控中心一 样,他们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在 流感爆发一两周之后才可以做到。
所以,2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个 更有效、更及时的指示标。它是建立在大数据的基础之上的。这是 当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得 有巨大价值的产品和服务,或深刻的洞见。 基于这样的技术理念和数据储备,下一次流感来 袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。
大数据,变革商业
第一部分 大数据时代的思维变革
01 更多:不是随机样本,而是全体数据
让数据“发声”
“大数据”全在于发现和理解信息内容及信息与信息之间的关系,IBM的资深“大数据”专家杰夫·乔纳斯(Jeff Jonas)提出要让数据“说话”。
大数据与三个重大的思维转变有关,这三个转变是相互联系和相互作用的。
●首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。
●其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。
●最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。
统计学的一个目的就是用尽可能少的数据来证实尽可能重大的发现。
小数据时代的随机采样,最少的数据获得最多的信息。
采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。
随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨。但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。
当人们想了解更深层次的细分领域的情况时,随机采样的方法就不可取了。在宏观领域起作用的方法在微观领域失去了作用。随机采样就像是模拟照片打印,远看很不错,但是一旦聚焦某个点,就会变得模糊不清。
随机采样也需要严密的安排和执行。人们只能从采样数据中得出事先设计好的问题的结果——千万不要奢求采样的数据还能回答你突然意识到的问题。所以虽说随机采样是一条捷径,但它也只是一条捷径。随机采样方法并不适用于一切情况,因为这种调查结果缺乏延展性,即调查得出的数据不可以重新分析以实现计划之外的目的。
全数据模式,样本=总体
在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机采样应运而生,它也可以被视为那个时代的产物。
采样的目的就是用最少的数据得到最多的信息。当我们可以获得海量数据的时候,它就没有什么意义了。
采样一直有一个被我们广泛承认却又总有意避开的缺陷,现在这个缺陷越来越难以忽视了。采样忽视了细节考察。虽然我们别无选择,只能利用采样分析法来进行考察,但是在很多领域,从收集部分数据到收集尽可能多的数据的转变已经发生了。如果可能的话,我们会收集所有的数据,即“样本=总体”。
“样本=总体”是指我们能对数据进行深度探讨,而采样几乎无法达到这样的效果。
生活中真正有趣的事情经常藏匿在细节之中,而采样分析法却无法捕捉到这些细节。
所以,我们现在经常会放弃样本分析这条捷径,选择收集全面而完整的数据。我们需要足够的数据处理和存储能力,也需要最先进的分析技术。同时,简单廉价的数据收集方法也很重要。过去,这些问题中的任何一个都很棘手。在一个资源有限的时代,要解决这些问题需要付出很高的代价。但是现在,解决这些难题已经变得简单容易得多。曾经只有大公司才能做到的事情,现在绝大部分的公司都可以做到了。
通过使用所有的数据,我们可以发现如若不然则将会在大量数据中淹没掉的情况
使用所有的数据并不代表这是一项艰巨的任务。大数据中的“大”不是绝对意义上的大,虽然在大多数情况下是这个意思。大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。
很长一段时间内,随机采样都是一条好的捷径,它使得数字时代之前的大量数据分析变得可能。
同理,因为大数据是建立在掌握所有数据,至少是尽可能多的数据的基础上的,所以我们就可以正确地考察细节并进行新的分析。在任何细微的层面,我们都可以用大数据去论证新的假设。
社会科学是被“样本=总体”撼动得最厉害的学科。随着大数据分析取代了样本分析,社会科学不再单纯依赖于分析实证数据。
在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。慢慢地,我们会完全抛弃样本分析。 这本书值得研究 我买了这本书 顺便看下自己的资料 很多资料表明,你不说,并不等于别人不知道,你以为隐秘的事情,也许被人早就看破了。 最近很火的一本书,谢谢分享 非常感兴趣,等着下完了马上看,呵呵 谢谢分享,下载看看,最近对这也比较感兴趣
不过大数据这些概念说来说去,有与BI类似的感觉。 一直不是很怎么理解“大数据”的含义,不过最近一直在热议,好好学学看看。 感谢分享,学习学习…… 一直不是很怎么理解“大数据”的含义,现在有这书可以参考学习下 谢谢分享 谢谢长篇分享!与时俱进看看新事物。 谢谢分享 这书不错,准备买纸式的看看。。。
页:
[1]
2