大数据时代 | 量变引起质变

《大数据时代》是浙江人民出版社于2013年1月出版的,作者是ViktorMayer-SchÖnberger(维克托·迈尔-舍恩伯格)和Kenneth Cukier(肯尼斯·库克耶),译者为盛阳燕和周涛。

别的不说,整本书和之前看的《在线》相比,虽然出版早了好几年,但是整体逻辑和框架体系都清晰不少,而且用例很多,重复率也低,编排上类似国外的教科书,观点阐释、用例、重点小结都用不同的排版分辨出来。

书的重点是大数据后带来的三大方面的变革,包括思维变革、商业变革、管理变革。在思维变革方面,强调了大数据会使随机取样不是必需,不再强求精确度,以及更加重视相关关系而不是因果关系。在商业变革方面,主要是讲述大数据带来的商业价值,首先是量化一切,在此基础上通过再利用、重组、拓展、利用原有的数据废气、开放共享等方式挖掘数据价值,同时也试图对数据价值和折旧进行评估,最后说明了数据商业运作的几种方式。在管理变革方面,讲述了大数据时代带来的风险,并给数据管理上提出了几个建议和作者认为的大方向。

放上一张自己看完后整理的体系图。

整本书里有些观点还是有点嚼头的。

首先是关于大数据时代所有的根基——数据。

《大数据时代》告诉我们,数据化是指“把现象转变为可制表分析的量化形式的过程”,而数字化是“把模拟数据转换出用0和1表示的二进制码”。在我的概念中,可能更好的便于自己理解的表述是数字化是将信息录入电脑的过程,而数据化是按照统一的数据规范录入电脑可让机器分析的过程。这一点的确是戳中了要害,就和信息化最初发展的时候,人们觉得有电脑了,所有的信息都录入进去就完成信息化了的误区是一样的,大数据时代数据化的工作将会非常重要。

讽刺的是,从书里我知道“‘数据’data这个词在拉丁文里是‘已知’的意思,也可以理解为‘真实’”。然而,现在太多人都在追求大数据的“大”,而忽略了真实。诚然,如作者所说,错误并不是大数据固有的,但是数据量的急剧增加让更多错误数据又了藏身之所,可怕的是不仅从源头上的错误,更有层层数据交易中的有意为之。书中表达的大数据时代不追求精确度甚至拥抱混乱,并不是数据质量的参差不齐,只是指的数据来源和数据结构的不一致性吧。

接下来要说的是数据和人工,看起来是非常矛盾的两种方式,一种被信奉者捧成绝对理性,另一种似乎只是直觉、长期经验的复杂结果。

书里在辅助决策这方面虽然十分重视数据的力量,但是也不得不承认专家的作用性,甚至单独列了一节强调数据独裁可能的危害。在书的种种叙述中也不断提到了人在产生大量数据之外,对数据分析产生的作用,即使是对群租房探究而进行数据分析的小组成绩很好,也离不开组员不断的实地调查和实时对模型进行纠偏。甚至举出福特汽车和苹果的例子表述有时候真正的变革并不是数据能够分析出来的,这一点也很是很可贵的。

虽然大数据最厉害的地方就是能够较为精准的进行预测,但是一些创造性的突破性的想法和在一段时期后给世界带来的变化并不是通过大数据可以预测出来的。人,永远是数据生成、处理、使用上不可忽视而最无法精确衡量的环节,《大数据时代》没有忘记这一点,没有过分地去吹捧大数据。

最后要说说其中的管理建议了。在垃圾邮件还苟延残喘的时候,垃圾短信、诈骗电话、花式推销已经充斥了我们的生活,对方清楚的知道你的性别、姓名、年龄、职业甚至是家庭情况。大数据时代真是一个细思极恐的时代,各式软件的同意声明对于用户来说完全没有选择。在这方面我十分佩服一个朋友,所有的社交账号都是实名,而虽然知道自己的抵抗十分微弱,自己还是坚持起了一个又一个用户名,聊以在心理上自我安慰。

然而,无论是对个人隐私进行保护,给数据建立“谁使用、谁负责”的机制,不滥用数据,还是反对数据垄断,或者是数据审计师(书中称为算法师,感觉与描述的职责不太吻合)的行业兴起,都离不开国家强制力的介入。而最明显的表现,就是得有相关法律法规的建立健全和实施到位了。

尤其是数据“谁使用、谁负责”的机制,真的是迫在眉睫啊,目前使用中常见的都是个人许可制的,使用到一些软件让勾选的都是:您已经充分认识到您的某某信息是重要的,理解并知晓被提供和使用的风险,包括但不限于什么什么。拜托,你要是单纯的认识、包括也就还好了,什么叫充分认识啊,什么叫但不限于啊,我提供给你但是只限于你列出来的那几项行不行啊?倒是没有那个选项啊!

于是,想到搜索一下目前在数据管理、使用方面有没有相应的法律法规,也许是自己搜商不够高,暂时在意料之中的没有找到一个覆盖数据商用规范的法律法规,只有一些零散部委厅之类对本条线上数据管理的要求或规范。想来目前应该还是囊括在知识产权的相关法律法规里,然而看之前的郭敬明到现在的《锦绣未央》,原有的根基还远远不够稳固,要想有健全覆盖整个数据的法律法规看来还是有很长的路要走。

不过在搜索过程中有两个意外的发现,一个是发现政府网站上有一个很显眼的专栏“数据”,当然,对于我这个没有这方面数据思维的人,看到了也无法产生什么价值,但是可以看到政府对这方面的重视。另一个是发现了14年国务院对《香港和澳门服务提供者在广东省提供在线数据处理与交易处理业务有关问题的批复》,虽然批复内容在我看来就是“同意”二字,但是发现14年国内就有成型的数据商了啊,深深感到自己的落伍。

岔远了,回到这本书上来,《大数据时代》不仅告诉我们大数据时代数据能够做什么,还提醒我们不要忘记人能做什么,大数据是非常重要的资源,但归根结底还是人使用的一种工具。就像书中说的,“大数据提供的不是最终答案,只是参考答案”。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容