当今世界是一个大数据的海洋

我观察后台发现,最近新进了一些各行各业的新用户。这让我觉得,我还是要适当写点普及性文字。

我经常使用狄更斯式句式,这是最好的时代、这是最坏的时代。

这是最好的时代,这是最坏的时代,这是互联网的时代。互联网代表开放。纵然秦始皇修建的 Great Firewall 仍然当头屹立,国境线早已无法封锁自由的心灵。没有人能够阻挡互联网前进的步伐,即使是倒行逆施的邪恶势力。我们信仰互联网,我们坚信互联网能改变整个世界。

这是最坏的时代,这是最好的时代,这是大数据的时代。大数据代表民主。纵然我们的家园仍然有可能被随意摧毁,数据开放带来的公开、民主、透明以及全民创新,使得“除了上帝,任何人都必须用数据说话”成为共识。从数据到信息、从信息到知识和智慧的 DIKW 体系,将在更广泛的范围里颠覆旧有的垄断与坚守。

在讲述大数据基本概念时,我开篇经常说:当今世界,是一个大数据的海洋。我画了一张图,表示每秒、每分、每天产生的数据量。

在这张图下方,我用红色字体写了一句话:

“我们在数据的海洋中遨游,水中满是鲨鱼,而且海平面在快速上升。”

我想表达的是:1. 数据量很大,已经将人类淹没;2. 数据量还在进一步急速增长,很快就将全球置于“水底”;3. 数据安全性问题日益严峻。

大数据有多“大”?心理学表明,人们对绝对值没有概念,相对值才会让人们震惊,就像你猜不出一只行李箱有多重,但你很容易感知两只行李箱孰重。大数据的相对概念是什么呢?大略统计表明,当今世界一年产生的数据量,相当于人类有史以来产生的数据量的总和。

事实上,上图绘于数年前,其中的数据早已刷新。2016 年的统计显示,在一分钟的时间里,社交媒体平台与社交网络中创造了令人讶异的数据量:

  • Google 翻译了 69,500,000 个词
  • Youtube 用户分享了 400 小时的视频
  • Siri 回答了 99,206 次提问
  • Twitter 用户发送了 9,678 条充满表情的推文

这么巨量的数据有什么用呢?可以毫不犹豫地说,并没什么用,大数据就是大垃圾。大数据对人们的直接影响,可以用下图来形象地概括:

面对汹涌而至的大数据,人们的体验与需求是矛盾的:一方面,人们说,求你放过我,不要给我推送那么多没有的信息;另一方面,人们又希望,你能够更理解我,给我提供实时可信、跨界整合的价值信息吗?!

所以我们说,大数据价值也有两面性:一方面,大数据已然产生很高的价值;但另一方面,大数据价值的密度非常低,例如警察察看视频监控数据来破案,24 小时的视频中有价值的信息可能仅有 1 秒。

事实上,大数据有没有价值,取决于特定人在特定场景下的需求。我经常举例说,如果你的手机被偷,你珍贵的照片、你和女朋友的聊天情话,对于那贼来说毫无价值,他第一时间就会重置你的手机,删掉你所有的数据。

挖掘大数据价值,完成于三个基本逻辑:

  1. 多来源的异构数据。大数据的关键特征并不是“大”,而是“多”。只有从多角度去看世界,才能还原世界的真相。只有从内部、外部和第三方多来源采集数据,才可能得到更多的价值信息。
  2. 基于数据挖掘的预测分析。尽管大数据的基础仍离不开统计,但是简单的统计分析并不属于大数据。大数据真正颠覆的是思维方式,它不依赖因果关系,它采用关联关系。
  3. 数据分析嵌入在业务流程。数据驱动业务,意味中数据分析在每个环节,客户尚未到来,已然对客户特征进行画像,而不是业务发生之后的“马后炮”分析。很多伪大数据,其实都是事后分析。

这三个大数据逻辑,貌似简单,其实很难实现。大数据的“悖论”式痛点,首先是缺乏大数据。传统的业务流程、传统的系统架构,都不能够支持嵌入业务流程的预测分析。

所以,真正落地的大数据,不是简单地搭建一个所谓的大数据平台,更不是从外面采购一些“大数据”,它是业务、数据、技术的“三元合一”的一体化解决方案。

大数据推荐阅读书单

最近应邀做点大数据讲座培训,也有不同领域的小伙伴希望我能推荐一些大数据读物。整理了一下,列了个书单。总体上偏应用,没有选入较技术的著作。仅供参考。

1 入门基础

1. 涂子沛:《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

这是国内第一本冠名大数据的书,也涂子沛一夜成名、后来有机会任某大互联网公司副总裁的基础。作为理解大数据概念,以及大数据在公共领域、特别是政府方面的应用,科普价值蛮好的。

2. 维克托•迈尔-舍恩伯格:大数据时代: 生活、工作与思维的大变革

另一本知名的大数据科普书。它重点论述了,大数据是从因果关系的串联思维,进化到关联关系的并行思维。其译者,成都某大学最年轻的教授,因此书获得很高知名度,以至于被江湖“验证”为“恍若骗子”。

3. 车品觉:决战大数据:驾驭未来商业的利器

神马,你不知道车品觉?那太不应该了。他也是国内知名的大数据大忽悠大师了。这本书比较生动,因为它讲了一些不错的应用场景。

4. 大河原克行:图解大数据

这是日本人写的一本小书。说实话,日本人还是很令人钦佩的。用这么小的篇幅,讲清楚了大数据的基本概念、发展背景以及大数据在不同行业的应用、在大数据领域有哪些有影响力的企业、大数据的未来等大话题。如果想快速入门又不想懂太多的话,此书是首选。

2 大数据趋势

5. 克劳斯·施瓦布:第四次工业革命: 转型的力量

这并不是很切题的大数据著作。但是在当今时代,什么趋势能离得了大数据呢?大数据是一切趋势力量的内在驱动。

6. 亚力克·罗斯:新一轮产业革命: 科技革命如何改变商业世界

从书名到包装,和前一本很像对不对?但这本更接地气。它的核心是,科技将改变、甚至重塑一些行业。它“遇见”了十年后的机器人、医疗、金融等行业的发展趋势。

7. 艾伯特-拉斯洛•巴拉巴西:爆发:大数据时代预见未来的新思维

现在出版社很下作,老喜欢玩标题党。这本书的原题并没有大数据字样。不过,讲到爆发,首当其中的那一定是大数据呀!这本讲趋势的书,内在逻辑离不开大数据。

8. 艾伯特•拉斯洛•巴拉巴西:链接: 商业、科学与生活的新思维

这是《爆发》作者多年前的一本老书,出版于十年前。所以本质内容,当然并没有大数据。但是它的创见在于,世界的复杂性在哪里?无非是链接二字啊。

9. 王坚:在线: 数据改变商业本质,计算重塑经济未来

这是一本新书,说实话我还没有看过(书正在路上)。我为什么没有读过却会推荐它?相当程度上出于对作者的信任。王坚博士“玩”了 8 年云,终于站出来写本书,他对于趋势和本质的把握,应该有独到之处吧。

3 大数据应用

10. 郑毅:证析: 大数据与基于证据的决策

这是国内较早出版的大数据专著。作者郑毅将 analytics 这个“熟悉的陌生词”译为“证析”,并讨论了“证析”应用场景和企业应用。全书体系架构一般,但与后来许多粗制滥造的国内大数据图书相比,作者是下了相当功夫的。

11. 大卫·芬雷布:大数据云图: 如何在大数据时代寻找下一个大机遇

有哪些人在搞什么样的大数据?《大数据云图》告诉你。这本书本质上一个网站,所以其内容可能随时过时,不如你到网站上钻研钻研,看看大数据行业别人都在搞些啥新花样儿。

12. 戈登·贝尔:全面回忆: 改变未来的个人大数据

如果你不知道本书作者,你就对计算机行业不太了解。戈登·贝尔是个大人物!史称小型机之父。但是他也是个疯子!他 1998 年就开始“玩”大数据,你信吗?他设计了一个匪夷所思的系统,把他的一言一行、一举一动全部保存起来。谁知道呢,也许他将来就是人类永生之父了哟。

4 大数据行业应用

13. 罗伯特·托马斯:大数据产业革命: 重构DT时代的企业数据解决方案

本书全面讨论大数据的行业影响。涉及的领域较多,讨论了农业、医疗、保险、零售等九大行业。可能因为面太广而不太深入,其内容不太给人深刻印象,但毕竟还是蛮不错的参考。

14. 坦纳:大数据营销: 互联网+时代如何定位客户

精准营销是大数据常见的重要应用之一,但大数据营销写得好的书还真不多。这本书至少不是国内作者“炮制”的,还是体系完整、值得参考的。

15. 麦德奇:大数据营销: 定位客户

 本书是大数据营销的反动。看英文书名你就知道了,它是讲小数的。讲真,其实大数据本身没什么好讲的,如何用数据解决业务问题才是创造价值的机会。这本书值得学习。

16. BRETT KING:Bank3.0: 銀行轉型未來式(繁体中文)

大数据怎么离得了银行!而说到银行的未来,这本 Bank 3.0 就是必然之选了。没错儿,它真不是一部大数据著作,它是告诉你银行未来不是 bank,而是 banking 的。但是,没有大数据,行吗!

17. 金(King.B.):大数据银行:创新者、颠覆者、企业家们正在重塑银行业

这是 Bank 3.0 作者后来写的一本书。确实,续篇容易陷入“狗尾续貂”的困扰,它没有 Bank 3.0 那么有创见。然而,数字货币、个性化金融服务、大数据征信等等话题,谁又能绕得过去呢。

18. Chris Skinner:互联网银行

这本书的中文名是“画蛇添足”式的,其实数字银行才是真正的大势啊。此书虽然较为科普,但是涉及到了数字银行未来的主要趋势,尤其是包含不少有趣的案例。相比之下,比前两本更值得一读。

19. 帕科•昂德希尔:顾客为什么购买(升级版): 新时代的零售业圣经

研究大数据,怎么少得了零售行业!本书是人称“零售学之父”的帕科•昂德希尔的经典作品,饱含 20 多年的实践沉淀。没错,本书可能一个大数据的字眼都没有。但是研究顾客行为,谁又能出其右者!本书值得你一读、再读、三读。不管你做不做零售业。

20. 珍妮•布利斯:顾客为什么”粉”你: 驱动顾客极度狂热的5大策略

如果顾客是你的粉丝,你还愁卖货吗?这本有趣的书,告诉你让顾客成为粉丝的诀窍。它确实不算杰作,但是比起某些流行的大忽悠,你还是能学到理念和技巧的。

21. 杰夫·霍金斯:智能时代

大数据是当代人工智能的根本,学习大数据,怎么离得了 AI!但是 AI 的书太多,既然你在大数据的门外探头探脑,太专业的 AI 对你来说估计也是“行路难”。这本书正好!虽然出书较早,但它既没有太艰深,又相对比较全面。

5 大数据架构

22. 威廉.H·英蒙:数据架构: 大数据、数据仓库以及Data Vault

这是数据仓库之父英蒙的著作,是一本新书。英蒙没有躺在数据仓库的“功劳簿”上,他在本书中以更宽泛的视角看待企业数据。本书最有趣的特色是把业务价值与重复型和非重复型数据结合起来,并描述了如何通过文本消歧实现非重复型数据中的业务价值。

23. 朱洁:大数据架构详解: 从数据获取到深度学习

国内作者的普遍问题是,因为缺乏深度,只能追求框架的大而全。本书从大数据的产生和采集讲起,涵盖了大数据架构的业务和技术,还算不错的综述。至于其中的机器学习与数据挖掘部分,那就是聊胜于无吧——包罗万象总是很难的。

24. 王保育:企业数字化转型架构: 互联网+时代的创新技术与实践

从书名便知,本书不是讲大数据架构的。不过,在大数据的驱动下,企业架构势必会发生很大变化。多来源、多类型的大数据分析嵌入业务流程之后,企业的数字化转型将何去何从?IBM 历来是框架高手,本书给出了 CAMSS 架构参考。

6 大数据管理与治理

25. DAMA International:DAMA 数据管理知识体系指南

说到数据管理与治理,那怎么也离不开“大妈”DAMA(国际数据管理协会)的。本书是国际数据管理协会提出的 DMBOK 的中文版,语言精炼、结构严谨,是数据工作者必备的案头书。包含大数据内容的 DMBOK 2.0 尚在起草中,出版中文版本更是遥遥祝无期,因此目前本书难得的精品。

26. 桑尼尔·索雷斯:大数据治理

把数据治理放到大数据环境下,本书就算是既有方法论、又有实战指南的好作品了。它从大数据类型出发,提出了大数据治理的框架与准则。不过,它总体上偏实战,还算不上是结构严谨的开山之作。

从不确定性中发现规律,正是大数据价值的本源

2017 年新年献词

2016,委实是诡异的一年。这一年,灾难不断、痛苦不断,而让人欣慰的事情却太少、太少、太少。

这一年,传统媒体加快了死亡的步伐。即使知名如美国《新闻周刊》,也干出了将印好的杂志销毁的傻事。总统大选之前,《新闻周刊》的精英们认为希拉里当选是一个大概率事件,早早就做好了封面和杂志,然而很不幸,11 月 8 日当选美国总统的,却是另有其人。

共和党人唐纳德·川普当选美国总统,是 2016 年最大的黑天鹅事件。川普入主白宫,而赢得普选的希拉里泪洒疆场。不按常理出牌的川普,不仅让媒体人颜面丢尽,更让美国一撕两半,前路漫漫,未知美国何去何从。

川普当选、英国脱欧,意味着 2016 年是反全球化的十字路口。“地球村”上的人们,突然发现世界原来并不是平的。2017 以及未来的三、五年,全球的政治、经济环境将出现巨大的动荡,强国商人当政、弱国极左回潮,黑天鹅将成为不可预期的正常现象。

这一年,雾霾进一步“侵略”中华大地,让人们感到更窒息的是禁止讨论的空气;这一年,以增值税、五险一金为核心的苛捐杂税让企业不堪重负,企业一边死亡,一边呼唤着“让我死个明白吧”。

据民间调查,中小企业健康率仅占 10%,而 GDP 的水分却可能高达 3 倍。人们能够清楚地感觉到,经济继续呈断崖式下迭,这让曹德旺一夜之间从一位老牌企业家变身网红,而他呼吁实事求是的文章却从互联网上消失。

美国大选预测失败,也让大数据人丢脸不已。在 2016,大数据持续高温不退,一边是大数据随同人工智能、机器学习、知识图谱、VR/AR等新兴领域尘嚣直上,一边是大数据应用场景和实施案例价值难彰,以致于“搞大数据的”在某些人看来几若行骗。

但是不管怎样,2017 还是迈着不急不慢的脚步,坚定不移地到来了。雄关漫道,从心出发。

其实,美国总统大选,也是 2016 年最重要的大数据事件。虽然大部分预测结果最终被证明是错误的,但是由于大选的巨大影响力,普通民众开始了解和探讨大数据、数据科学、预测分析等专业词汇,大数据从象牙塔中走出,与民众在数据价值、数据应用及数据滥用等方面进行了广泛而深入的亲密接触。另一方面,正是“预测不准”的不确定性,进一步显示了大数据的巨大潜力和真正价值。

可以预期,在2017年,越来越多的企业开始实现大数据的现实回报,从以往的“概念验证”(PoC, Proofs of Concept)逐渐转向“价值验证”(PoV, Proofs of Value)。以银行业为例:经过几年“东一榔头西一棒槌”的试验,务实的银行将在下一年度找到有商业价值回报的大数据应用场景,而领先的银行将在 2017 年勇当“小白鼠”,成为大数据驱动业务创新的先锋。

无聊的人们也许会继续谈论大数据的基本概念。但是当人们谈论大数据时,他们究竟在谈论什么?是狭义的数据处理技术变革,还是更深入、更广泛的数据应用?人们谈论着的大数据,也许是大数据思维、大数据商业模式,也许是大数据应用、大数据技术,或者是大数据资源、大数据管理与治理。总之,无论数据规模怎样增长、数据类型如何多样化、数据需求如何花样百出,只要数据应用最终还是简单的统计分析,它就不算一枚真正的大数据应用。

是不是大数据,有三个基本判据:

  1. 基于多途径、多结构的数据源
  2. 面向预测分析,而非现状统计
  3. 数据分析嵌入到业务流程之中

在 2017 年的工程实践中,可以从这三项基本判据出发,从不确定性中发现规律,使大数据价值正本清源:

  1. 从业务场景出发,尽可能全面地采集、清洗和解析多样化的数据资源
  2. 外部数据是重要补充,但如何充分挖掘内部数据的价值,更值得努力
  3. 无论何种数据资源,均需具备足够的数据管控能力,将数据整合为统一体系
  4. 大数据未必就是非结构的,也不见得非得用Hadoop,“工具论”是极其错误的
  5. 数据是人类描述世界的表征,数据的本质是业务,故一切可能性都来自业务
  6. 互联网代表开放,大数据代表民主,故数据和数据应用是开放给全体员工的
  7. 宜采用全局视角、重点突破的“钩子方法”,小起点、低投入实施大数据项目落地,通过反复迭代获得越来越大的投资回报,而不应盲目采用“大干快上”的策略
  8. 从爆发式市场动向,到大数据价值创造,必由之路是大数据业务转换和实施路径
  9. 大数据成熟度五阶段:业务监测;业务洞察;业务优化;数据变现;业务重塑
  10. 根据业务需求,通过统一的数据采集架构和方案,整合内外部大数据资源
  11. 大数据平台并没有“必须的”架构,它可能是MPP数据库,也可能是Hadoop/NoSQL/Spark或数据探索分析,总之应用与数据类型决定了平台架构
  12. 不要听传统IT厂商的,大数据就是要颠覆他们的;也不要相信传统咨询,他们也不知道大数据是什么;不要听专家的,大数据创新并无经验可借鉴;不要听领导的,他们瞎指挥
  13. 大数据要突破企业局限,以用户为中心部署数据和产品,360度用户画像是所有应用的基础
  14. 实施大数据要采用开放心态,没有谁能掌握全部资源,故宜采用开源的技术、开放的数据
  15. 精准营销、交叉销售、用户运营、产品创新、风险防控等领域,是现阶段容易实现的大数据机会。但若停留在数据采集 → 数据分析 → 决策支持的传统逻辑,它并不是真正的大数据应用
  16. 不能嵌入业务流程、不能帮助业务优化与重塑的“大数据”,都是耍流氓
  17. 要相信:大数据是活的!

最后,送你一支歌,祝你新年快乐。

世界上真的有“小数据”这种东东?

大数据突然火得一塌糊涂,以致于搞大数据的人,在某些人看来已然行同骗子。所以你一提大数据,就有人语重心长地规劝你。

这不,我今天在朋友圈写了两句废话:

最近写了一个材料,有两点感受:

1 大数据不再局限于数据分析,而是渗透和参与到业务流程中,因而有可能产生颠覆性效果。

2 大数据业务场景当真还不够成熟,需要所有行业的共同努力。

就有朋友前来“规劝”道:先把小数据用好,再提大数据吧。

我的第一反应是:大数据是时代的产物,是随着发展的需要而提出来的,“小数据”这个概念,纯粹是好事者“船载以入”,世界上只有数据、大数据,而不存在“小数据”这种玩意儿。

好吧,为了便于理解和区分,我们权且接受小数据、大数据这种划分吧。然后我去搜了一下,看到一个老外的整理,分享给你。

小数据是:

  • 抓取网站页面、Google Alert 和 RSS feed
  • 只使用结构化数据
  • 向业务人员提供原始数据,并不做汇总分析
  • 商业智能模式的传统报表
  • 专注于提供信息
  • 手工或批处理模式的数据分析
  • 用软性指标度量影响,如登录次数、账户访问数
  • 数据分散在电子表格中,业务人员可能从未打开
  • 依赖人工的不稳定模型,知识存储在少数人的大脑中
  • 数据主要用于规划未来行为

而大数据是:

  • 整合内部的、外部的、合作伙伴的数据,以便洞察客户和未来趋势
  • 使用结构化数据和非结构化数据(如文本、呼叫日志)
  • 处理数据的目的,只为发现相关性
  • 预测未来,优化行为
  • 完全与业务流程融合
  • 向业务人员提供实时数据和业务洞见
  • 用硬指标度量影响,如收入增长、借贷利率
  • 专注于业务人员,与其工作流程整合在一起
  • 有自动分析模型,聚焦于新发现或未曾预料的事情
  • 专注于一线执行力,而不只是规划和预测

另外有一张图,更简洁、当然也更狭义地对比了“小数据”和大数据:

小数据:容易获得,采用常规数据库

大数据:难以获取,采用大规模数据库

不管怎样,“小数据”和大数据,它不是一个先后顺序的问题。现状来说:企业业务和管理,主要还是依赖于内部数据为主的“小数据”,但大数据带来的思维与视角,必能以“大数据驱动创新”的逻辑,帮助企业从用户、产品和渠道等不同角度进行创新,从而提升和优化企业经营的“硬指标”。基于大数据的业务流程,基本思想就是企业不再是单一的个体,而是 Interconncted Enterprise。

大数据决不是骗局。走着瞧,大数据会将你淹死——如果你不做弄潮儿的话。

极致·理想·大数据

在 7 月 9 日的同学聚会中,我作为“教授陈书悦”,“教”给同学三个词。第一个词:极致

当年在华工,继文学之后,我着迷外语,并开始学习没人学、没开班的俄语。为了把俄语学好,我决定用俄语考研、决定报考哈工大。在考研中,我取得了很好的俄语成绩,被研究生同学过誉为“你学一年俄语,顶我学十一年”,并被俄语外教允准旁听俄语专业研究生课程。

华工是伟大的学校,哈工大也是一个好学校,但是我始终难以忘怀,高考、研考我都想报清华的。十年未改初衷之后,我很幸运地踏进了清华园。这次我又换回英语报考,出题老师说,我的专业英语是史上从未有过的好成绩(他不知道,他出题的那本英文专业书,刚好被我仔仔细细通读过)。读书就要读最好的学校,我做到了。

后来,我在金高科技,从一名兼职的网络工程师,一步步做到天花板职位,有很大的办公室、有专职助理。但我又只身加入微软,从“穷乡僻壤”的成都起步,从西区而东区+西区、而全国,并将我们的工作成果推介到美国总部。工作就要最敬业、最出彩,我做到了。

如今,我们的领诚科技、金百睿科技,都还是幼苗,经不起太大的风吹雨打。但我坚信,坚持不懈会带来好运,我们一定能够在大数据领域,创造出最令人自豪的硕果。

然后我说,很多同学感觉,作为工科生,不太会写东西。U R wrong, boy! 写出诺贝尔奖固然不易,把事情说清楚是每个人都可以做得到的。我现在就来“教”你写作!

2006 年,我写:理想如斯夫!2008 年,我写:我心怀梦想、激情满怀。2013 年,我写:我要创造智慧的世界。2014 年,我又写:我总是心怀梦想、激情满怀。2014 年,我写:世界属于笨人。看到没?十年以来,我都在说同一件事:理想。如果你穷十年之功去描写一件事,你还不会写作吗?

嗯,我知道,只要我站在台上,我就必须得讲大数据,这也是你们的期望。那么,我就来“教”你认识大数据。我就讲三点:

一、为什么会出现大数据?因为当今世界是一个数据的海洋。某老外说:“我们在数据的海洋中遨游,水中满是鲨鱼,而且海平面在快速上升。”什么是大数据?迄今为止,大数据并没有业界公认的定义,通常人们用 4V 特征来描述它:Volume 海量,数据量大到传统技术已经无法处理。Variety 多样,人对人、人对机器、机器对机器的不同数据,使数据类型和复杂性急剧增加。Velocity 高速,一方面大数据增长速度快,近几年的数据量已经超过人类有史以来的数据总量,并且增长速度还会加快;一方面要求处理速度快,不管你面临多少困难,都必须 1 秒钟将结果提交给用户。Value 价值,一方面创造价值高,各行业大数据价值已经得到认可;一方面价值密度低,例如连续视频中有用数据可能只有 1 秒。

二、大数据就是巨大的垃圾堆,绝大部分无用。按照数据-信息-知识-智慧体系,数据必须转化为知识和智慧,才能从大数据“金矿”中挖掘到难得的价值。如何挖掘?用数据驱动业务创新的方法。王永庆还是个卖米的小店主时,他用大数据方法,预测顾客的用米时间和数量;林彪带部队打仗时,他用大数据方法,一举歼灭敌军司令部;Jack Maple 还是一个警察时,他用大数据方法预测犯罪,大幅度改善纽约治安情况,成为美国警察中的发明家。

三、不管你是干什么的,大数据都与你有关。大数据不仅可以帮助我完成梦想之旅,它也以无处不在的态势,要求你与大数据握手言欢。

大数据祖师爷告诉你:大数据很好玩

你急匆匆地冲进来,一半是好奇、一半是责骂,对吧?估摸着你想说:大数据一共才几年,哪里来的祖师爷?

童鞋莫急,且听我慢慢道来。大数据(Big Data)这个词,确实没有几年,但是大数据这个东东呢,却是由来已久。大数据祖师爷不仅有,他还是位中国人。

你瞧,就是这位老爷爷。

这老爷子是谁?说起来吓死你,他就是大名鼎鼎的王永庆!

啥子,不知道王永庆是谁?嘿嘿,你读书少,莫怪我骗你。我不是刚告诉你了嘛,王永庆老爷爷,他就是大数据的祖师爷呀。

好吧,不吓唬你。王永庆当真是了不得的真神呀,人称台湾“经营之神”是也!他生于1917年,还是位老寿星哦,2008年他老人家91岁才仙逝。

过世之前,王永庆爷爷虽然人在米国,却没有忘记为祖国做贡献,汶川地震老人家捐款一亿元(人民币)哦!想想也是感动得不要不要的。

嗯嗯,王永庆爷爷早在1954年就创办了台塑集团,很快就发展成为台湾企业的王中之王,下设十余家台湾公司和好多家米国公司。

老爷爷狂有钱!1984年的时候,台塑集团的资本额就多达45亿美刀、年营业额高达30亿美刀。

这是啥概念呢?那时候在我们大陆,“万元户”就受尽全国人民的追捧和景仰。据考证,那时候的1万元,相当于今天的1亿元。

那么,王爷爷是岂是富可敌国能概括的。要知道喔,他不仅是台湾首富,他一家的营收硬是占到全台湾GDP的5.5%!台塑集团位居全球化工“50强”之列,是台湾唯一一家进入“50强”的企业之王。啥子,大陆?大陆没有一家进“50强”好不好。

你看,“经营之神”王永庆老爷爷牛逼吧?可你想不到的是,老人家却是地道的苦出身。“想起了往日苦啊,两眼泪汪汪,哎咳穷人哪好心伤……”

小永庆家里穷得!上学都是奢望。不几年,他就只好辍学,去人家米店里当学徒,受尽欺凌。

但小永庆岂是久甘人下的!第二年,他就央求父亲东拼西凑,借了200块钱,开了一家小小的米店。

因为没钱,小米店只能开在偏僻小巷;还是因为没钱,小米店请不起伙计,只能由3个十几岁的小男孩打理。可是小小的一个镇子,米店多达30家,哪里会有人光顾小永庆的小米店啊!门可罗雀呢。少年王永庆望米兴叹,徒唤奈何。

恰此时,互联网大神路过,指点道:人人都是产品经理!

互联网大神说:产品的核心是极致。少年王永庆得此秘籍,开始用工匠精神打造他的大米,并将其命名为“i米”。

在远古的上世纪30年代,稻米加工技术十分粗糙,米中渗杂稗子、小石子司空见惯,米店老板甚至认为杂物可以增加份量,顾客也习以为常。

但是“i米”却追求极致!受互联网大神指点的王永庆,和他的小伙伴一起,仔细地将米中的秕糠、砂石之类的杂物拣出来,卖干干净净的真大米。

互联网大神又说:体验成就产品!于是王永庆又致力于改善顾客体验。

  1. 别的米店朝9晚6上班,王永庆开门到晚上10点。
  2. 手头不宽裕?王永庆的“i米”可以赊账,顾客发工资了再给钱。
  3. 妇女和老年人买了米拿不动?王永庆是小伙子,他主动帮顾客把米送上门,首创“送货上门”服务的先河。
  4. 送上门还是拿不动?王永庆帮助顾客把米倒进米缸。如果米缸里面有陈米,他还会将陈米倒出,把米缸打扫干净,然后把新米倒进去、再将陈米放在上层。
  5. “i米”的极致品质和顾客体验,让王永庆的口碑越来越好。

看见没?“小小少年,很少烦恼。”少年王永庆,他深得互联网大神的精髓:专注、极致、口碑。

啥,你说大神的互联网思维,还有一个“快”字?不不不,少年王永庆能够成长为日后的“经营之神”,最大的诀窍并不是“快”字,而是这个:

呃呃呃,不好意思,放错图了。在王永庆的少年时代,世界上还没有这样的笔记本。少年王永庆用的是这样的笔记本:

糟糕,又放错了。这是生在红旗下、长在新中国的少年使用的笔记本,待解放的台湾少年王永庆,用不上这么好的本子。

哎呀,终于拿对了!贫穷少年王永庆,他的秘诀是这个破本子。

是的,就是这么个破本子,帮助王永庆用“i米”积累财富,也帮助王永庆成为大数据的祖师爷。

你“嗤”地一声说:电脑都木有的时代,哪里有大数据嘛?太忽悠了!然后你关掉这篇文章的界面,错失了理解大数据的最佳时机。

你没关?OK,那你一定是想问:精明少年王永庆,他在破本子上写了些啥?嘿嘿,偏不告诉你!

我要告诉你的是,大数据无所不在,没有电脑有人脑。精明少年王永庆的精明大脑,不仅超越了他的时代,也超越了今天飞速运算的电脑。

他琢磨的是:顾客要吃饭,就一定要买米,但是怎样才能在顾客想到买米之前,提前知道顾客什么时候要买多少米?

哦买高地,这是怎样的神机妙算!你还不知道你要买东西,商家却算准了你某年月日需要多少他家的玩意儿。你聪明的,你告诉我,神人马云和他的淘宝,有木有这种本事?

然而王永庆有。贫穷少年王永庆,虽然只有一个破本子,他却能够在给顾客送米上门时,在本子上写下:亲爱的克斯忒玛,你家有几个大人、几个小孩,每个人饭量多少,你家米缸能装多少米,这次买米的时间和数量……

然后他掐指一算!就知道“亲爱的克斯忒玛”,下月3号米就该吃完了。于是下月1号,他就将刚好能够装满你家米缸的“i米”,主动送到你家,主动帮你把米倒进缸里,而那米还是业界最极致的“i米”……

面对此情此景,就算“亲爱的克斯忒玛”铁石心肠,你能忍心不掏钱吗!

这就是王永庆的秘诀,这秘诀就是大数据。他在所有的业务活动中,都不断地追问为什么,不停地搜集事实、分析数据,不厌其烦地在细节上下功夫,矢志不渝地用数据驱动业务优化。

所以我说王永庆是大数据的祖师爷,你有什么不服吗?

那么,大数据的徒子徒孙们,还不快来膜拜你们的祖师爷?

看看大数据祖师爷的大数据神迹吧:

  1. 定义大数据驱动业务创新的切入点:怎样比顾客更早预测他的需求?
  2. 寻找数据资源:通过所有可能途径,收集各种来源、各种形式的数据,哪怕是写在破本子上(你的“破本子”可以是Excel嘛)
  3. 进行创新实验:“亲爱的克斯忒玛”,你家有几口人,什么时候发工资
  4. 建立客户大数据库:普天之下,莫非“i米”的领地
  5. 大数据分析驱动业务:测算顾客下次购米时间,主动送米上门

你信不信呐?作为大数据祖师爷的王永庆,他还是“鱼骨图管理”的发明人耶!以数据分析为工具,他带领下属讨论主要问题及相关次要问题,将次要问题象一根鱼刺一样加在主要问题两侧,当讨论越深入,鱼刺越长越多,这样不断衍生出问题,最终进行归纳,就能得到问题的解决方案。

所以你能说,王永庆不是大数据的祖师爷吗?

你能说,大数据祖师爷王永庆的大数据秘诀,难道不是一个“快”字!

相见时难别亦难

小莫 数字大家2015-11-17

相见时难别亦难,

东风无力百花残。

春蚕到死丝方尽,

蜡炬成灰泪始干。

李商隐深刻洞察了小莫此刻的心情。是的,小莫难过地宣布:今天,小莫要与与大家告别了。

一直以来,经常有朋友询问:小莫是谁?小莫是男生还是女生?在这告别的时刻,小莫不讲笑话、不说段子,小莫严肃认真地告诉你:小莫谁都不是,小莫根本就不是人。

小莫,本名Teemo,一个游戏人物:

其实,小莫谁都不是,小莫又谁都是,小莫是你、我、他/她的每个人。小莫,生于数据,活于数据;小莫,时尚、可爱、萌;小莫,有点坏、有点八卦、有点想法。

小莫说,其实是数据说。小莫是每一个人,所以小莫说是你说我说大家说、他听你听大家听。

小莫说是大媒体的小尝试。它用大数据手段涵盖媒体运营的采编发全流程,采用垂直搜索思路采集互联网素材,通过机器算法产生后台资源库,并自动产生内容排序和推荐排序,最后经人工编辑整理发送到微信公众号后台,推送给公众号的订阅用户。

Hot & Cool 是小莫说的内容定位。Hot代表热门、性感、搞笑,Cool代表新鲜、独奇、有趣。小莫说是致力于让你轻松的,希望你午饭时刻、下班路上能够放下包袱,让身体和精神都得到释放。

因此,小莫说是大数据媒体,小莫说是小屌丝娱乐。

小莫说决定停止更新,并不意味着小莫已死,更不代表大数据媒体没有前途。小莫已经完成实验使命,它的全部梦想与追求,如今承载在“微知”中。

微知是什么?微知是一个内容整合工具。通过整合多来源的信息内容,为用户提供内容服务。

让我们相约微知吧,BigWe.com

内容就是货币

我曾经多次说过:这是最好的时代,这是最好的时代,这是大数据时代。

大数据时代的显著特征,就是信息过载极其严重。在 1990 年代,消费者每天接触到的营销信息不超过 500 条,然而今天,消费者则需承受每天 5000+ 条信息的狂轰滥炸。

千万不要以为,被泛滥信息淹没的消费者,从此就变成傻瓜。事实上,消费者有两个办法:一个办法,叫做“不阅读综合症”,就像你不读我这么精彩的文章一样,大部分时候消费者根本不理睬营销信息。对于自己关心的事情,消费者采取另一个办法:精挑细选。

根据谷歌的研究,2010 年,消费者在作出购买决策之前,平均查看 5 条相关内容,而到了2012 年,消费者至少要查看 10 条以上。由于消费者接触到的媒体越来越多(想想吧童鞋们,微信公众号都有一千多万个),这个数据会持续上升,我想当然地猜想,如今你在淘宝上买一双鞋,至少要翻阅 20 个页面不止吧。

智能手机已经成为人们的“器官”。毫无疑问,大多数时候、大多数人,都随时可以通过智能手机收集内容。然而,手机毕竟不是器官,人们在处理和手机的关系时存在严重问题。据国外统计(资料较老,感觉这些记录已被超越):

  • 84% 的受访者说他们离开手机一天也活不下去。
  • 50% 的人将手机放在枕边睡觉,其中 18~ 24 岁的占了 80%。
  • 20% 的受访者每 10 分钟就会查看手机。
  • 50% 的人在观看视频或电视内容时,也会使用手机查阅内容。

这就意味着,就算你把消费者每周 7 天、每天 24 小时都淹没在信息洪流里,他们仍然能够捕捉到他们想要和需要的内容。

所以严峻之处在于:你的内容要想抓住消费者的注意力,时间只有转瞬即逝的短短 9 秒!这就是“注意力经济”的来源。它说:最稀缺的不是时间,而是消费者的注意力?

那我们怎么才能吸引消费者的注意力?让我们回到初心:

  • 遇到疑问时,你会从哪里寻找答案?或许是搜索引擎。
  • 浏览社交网站时,你最想分享什么内容?或许是趣文、趣事或趣图。
  • 找餐馆或订酒店时,你去哪里看推荐或评价?或许是大众点评。
  • 周末你看的书、跑步时你听的音乐,从哪里获知?或许是亚马逊的推荐。

这些示例说明,只要内容有价值,总是能吸引消费者的注意力。不仅如此,在消费者看来有价值的内容,能够让人们谈论它,能够挑起人们的分享欲、激起人们的购买欲。

如果你说互联网通过连接创造价值的话,那么:人们建立连接,是通过内容实现的,内容是强化连接的货币。

所以有一位名叫乔恩·伍本( Jon Wuebben)的老外,写了一本书:《内容就是货币》(Content Is Currency)。

铁匠约翰的故事:一“失足”创造120年成功奇迹

约翰(John),是一个非常常见的英文名,就像我们中国人说张三一样。[以前我在微软工作时,有一年总部大会上,主持人喊 John Smith,大家哄堂大笑,结果居然真的有不止一位叫这个名字的。]

今天我们要介绍的这位约翰,他是一位铁匠。年轻的时候,他很落魄,在佛蒙特州结婚安家,却没有足够的收入养家糊口。

1836 年,约翰左思右想,决定响应“党中央”“Go West, young man, go west”的号召,怀揣仅有的 73 美元,离家西去。颠沛流离两周之后,约翰“停泊”在伊利诺伊州的大迪图尔。他本来是打算碰碰运气找份赚钱的工作,最后他只好干回老本行:开了一家铁匠铺。

约翰是个好铁匠。他经常当地农民一起下地劳动,聆听他们在劳动中遇到的问题。然而作为铁匠,约翰感到汗颜:农民经常向他抱怨,犁头翻不动泥土,因为伊利诺伊州的土壤容易粘结,农民犁不了几米地,就得将铁犁上的泥土清理干净,十分恼火。

约翰想,如果能用钢制成犁镜,泥巴和污物就不会黏附在犁上了。于是在 1837 年,约翰用一把残旧的锯条打造出第一个抛光的钢犁。此后,约翰经年钻研犁头,最终成为了当时最伟大的发明家和商人之一。

这位约翰就是约翰·迪尔(John Deer)。尽管他在 1886 年逝世,但他积极聆听和主动培训的价值理念始终与他的公司同在。

约翰·迪尔公司可称得上是世界最著名的农机公司。1895 年,迪尔公司创办并发行了《耕耘(The Furrow)》杂志。根据迪尔的精神,公司并没有利用该杂志直接销售设备(因为产品目录会发挥作用),只是传授农民新技术,指导他们如何成为更成功的农民企业家。

创刊伊始,《耕耘》杂志的内容都是由思想活跃的记者、故事作者和设计人员联合完成的,从不发布促销信息和自助服务内容,涉及的只是农民密切关注的话题。这些内容旨在使农民更加富足,并为公司赢得更多的利润。

如今,120 年过去了,《耕耘》杂志的发展势头依然强劲,它是世界上发行量最大的农业杂志,采用 12 种语言面向 40 个不同的国家发行,每月发放至 150 多万名农民手中。

作为世界上首家将内容营销作为业务流程重要环节的企业,约翰·迪尔公司奠定了 120 年光辉历程的扎实根基。

约翰·迪尔公司之后,是一连串的追随者:

  • 1900 年:米其林公司推出了《米其林指南》。这本指南共 400 页,可以协助驾驶员正确保养车辆、寻找舒适住所。该指南初版免费发行了 35000 册。
  • 1904 年:杰乐果冻食谱获得成功。至 1906 年,杰乐公司免费发行的食谱为其贡献的销售额超过了 100 万美元。
  • 1913 年:伯恩斯和麦克唐奈工程技术公司推出了《指标》杂志。直到今天,这家位于堪萨斯城的工程咨询公司,仍然在发行《指标》杂志。
  • 1922 年:西尔斯开播了世界最大零售商店的广播节目。在通货紧缩危机期间,这个广播电台协助农民了解西尔斯·罗巴克农业基金会提供的内容。
  • 1930 年代:宝洁公司进军广播连续剧。尽管当时它的主要产品是多姿香皂和奥克多洗衣粉等日化用品,但它以十足的创意和鲜明的特征,开创了肥皂剧的先河。

可见,尽管内容营销作为一个产业刚刚起步,但几个世纪以来,品牌公司一直在致力于讲述自己的故事。在正确的时间将优质的故事讲给正确的人,往往可以斩断乱麻,起到一针见血的功效。

这篇文章你不点进来看,你会懊悔一生,因为你将错过巨大的发财秘密

凌晨一点半,我从机场回到家[并不曾延误,我偏爱夜间飞行],惦记着写文章早上发给你看。冲着这精气神,你不来看看,怎么对得起我吖。

但其实,标题并没有欺骗你。我急于与你分享的,是一个巨大的发财秘密。

在揭晓秘密之前,先聊会天[坏笑]。你一定当过小孩吧[废话!]?十之八九你玩过乐高。没错,就是那些老少咸宜、变化多端的拼插玩具。乐高当然是家玩具公司,这没错吧。

但是且慢,你看看下面这些玩法,像是玩具公司该干的咩?

微型网站

乐高的每个故事都有一个专门的微型网站,主要介绍故事情节和角色、线上游戏、电影、民意调查和测验,当然还有零售链。乐高星球大战和乐高忍者就是其中的佼佼者。

乐高短片

每次推出新故事,乐高都会制作系列短片先在有线电视播放,然后在其乐高官方网站播放。乐高还与美国卡通台合作发行了乐高气功传奇系列的卡通版本。

乐高点击

乐高点击是一个社区平台,鼓励粉丝和狂热者分享其乐高创意图片和视频,下载应用程序,以及通过网游和故事开发乐高主题。

乐高私人网络

乐高设计了儿童专用的社交网络(安全级别很高并且内置家长控制),里面的成员可以创建他们自己的个人网页,赢得奖品,与其他的乐高粉丝见面并与他们在游戏模块里战斗,以及观看乐高电视剧。

乐高杂志

《乐高俱乐部》杂志可根据地方市场和年龄定制。该杂志最初是乐高在 1987 年以《玩转积木》(Brick Kicks)的名字发行的。


从 1987 年推出《玩转积木》杂志以来,乐高为它的铁杆粉丝已经制作了多种多样的创意内容。(资料来源:乐高官网)

乐高会员

乐高邀请用户免费注册一个网络身份,这样就可以入内玩多人游戏,为乐高画廊添砖加瓦,在乐高私人网络里创建专属网页。

乐高乐园

乐高联手默林娱乐集团在世界范围内开发“乐高乐园”公园(有 6 个完整的公园和多个探索中心)。

乐高俱乐部聚会

乐高会邀请其全球的俱乐部成员参加其组织的聚会,让男孩和女孩们相聚一堂齐幻想(通常在聚会结束时还会说服父母动动腰包)。

没错,这些都是玩具公司乐高玩出来的把戏。从这些内容看,与其说乐高是一家玩具公司,莫若说它是一家媒体公司。

乐高拥有极其优秀的产品,这使得它在全球独占鳌头。它的产品从吃奶的幼儿、到编程的极客,每个人都非常喜欢。作为一家玩具公司,乐高的成就无人能及。但在产品之外,帮助乐高占据绝对竞争优势的,是乐高的媒体运营能力。乐高创建的各种内容,不仅支撑着它的业务模式,而且就像媒体公司一样,乐高可以从内容本身赚取丰厚的利润。

乐高的故事告诉我们,无论你喜欢与否,在今天,所有的企业都是媒体公司。我们都有机会与我们的受众直接交流,通过与受众互动改变整个世界。

内容营销,这就是那个秘密。

毫无疑问,用户根本不在乎你、你的产品或服务,他们在意的是他们自己的欲望和需求。内容营销,就是通过创建用户感兴趣的内容、吸引他们对这些信息的关心,来达到用户关注公司产品和服务的目的。

内容营销,比较书面化的正式定义是:内容营销是创建及传递有价值和引人注目内容以吸引现实的或潜在的目标顾客的商业营销过程,目的是促使顾客做出能为企业带来利润的行动。

内容营销策略能够利用所有的故事渠道(包括印刷、在线、面对面、移动通信、社交等);可以运用在购买活动的整个过程,从引起顾客注意到保持顾客忠诚,以及团体购买等都可以使用这种策略。

内容营销本质上是一种同现有和潜在顾客交流而不谈销售的手段,属于非干扰营销。你不是在推销产品或服务,而是在传递能让购买者深入理解的信息,也或者是愉悦他们以建立情感联系。这种策略的精髓就在于:我们相信,作为卖方的我们,如果连续不断地向购买者传递有价值的信息,那么最终他们回馈给我们的将是业务往来和对我们的忠诚。

所以很显然,软文不是内容营销,它是挂羊头卖狗肉的恶劣硬广。准确地说,它是一种涉嫌欺诈的欺骗手段。

最近流行的那种故弄玄虚 blabla 讲一堆貌似有趣有料有干货的废话、最后硬生生端一坨广告到你面前的做法,自然也不是内容营销。它就像你吃了一碗像模像样的美食,到最后发现一只苍蝇,同时醒悟到你吃的整碗都是翔。这样的变态硬广,必须见一个杀一个、见两个杀一双。

那谁,说你呢!最近你就这样干了。恶心不?不懂什么是内容营销是不?明天继续说给你听。