[1] 地震发生之后,除了受灾地区发生物理、化学巨变,整个社会的互联网沟通行为、手机通话行为和移动模式都会发生明显的可观察的变化。有兴趣的读者可以阅读以下三篇论文“Earthquake shakes Twitter users: real-time event detection by social sensors”(发表在2010年WWW大会上)、“Collective Response of Human Populations to Large-Scale Emergencies”(发表在2011年的PLoS ONE上)、“Predictability of population displacement after the 2010 Haiti earthquake”(发表在2012年的PNAS上)。这些例子本身就包含了大数据的精髓和理念。——译者注

    [2] 作者对这个问题的理解稍欠深刻和全面。表面看起来数据越多,粒度越细越好,但实际计算的时候不一定如此,因为粒度细的数据往往包含更多的噪音。昨天销售了250斤糖炒板栗是有价值的数据,但是昨天下午2:50恰好有一个顾客买了两斤半的板栗,是多种因素结合的偶然。如果你每天下午2:50都眼巴巴等着一个大主顾,那就真要为自己的智商着急了。实际上,我们在为700多家电子商务和资讯媒体提供用户下一时刻喜欢看什么、买什么的推荐服务所积累下来的经验显示,很多时候利用品类的信息往往比单品的信息预测更准确。数据的粒度和噪音是两个矛盾体,其带来的复杂挑战,决非作者想得那么简单。——译者注

    [3] 此前我一直想找个有力的例子来证明为什么可视化信息如此重要。之后的一次偶然机会,我在维基百科的信息图网页上发现了华盛顿特区地铁图。

    [4] 亚马逊土耳其机器人是一个Web服务应用程序接口(API),开发商通过它将人的智能整合到远程过程调用(RPC)。它被用来完成计算机很难完成但人工智能却容易执行的任务,例如写产品描述等。——编者注

    [5] 刊登于《大西洋月刊》(The Atlantic),文章标题为《好广告如何起作用》(Why Good Advertising Works [Even When You Think It Doesn’t])。

    [6] 以尝试设计新按钮为例,这种测试的思路如下:首先随机选择少量(例如5%)的用户,让他们看到新的按钮设计,如果这部分人的点击率高于对照用户,就逐渐提高新按钮覆盖的用户比例,并测试其表现的稳定性;在相当比例用户中,具有稳定性且更佳表现的新设计将会替代原有的设计。对于亚马逊这样的大型企业,即便是千分之一的用户,数量也非常可观。如果他们拿出10%的流量用作测试,而每个基础测试桶只需要千分之一的用户量,就意味着亚马逊时时刻刻都可以测试上百个新算法和新设计的效果。国内阿里巴巴集团算法部门也使用类似的思路和技术进行效果测试。——译者注

    [7] 经济学家杰文斯通过观察工业革命得出该悖论,并以他的名字命名。

    [8] 截至2013年年中,最新的针对中外大数据投资最近的深度分析和比较,请参考张琳艳等人的报告——《中国大数据投资分析》,见链接 http://www.36dsj.com/archives/3123。——译者注

    [9] 想要了解Facebook的更多精彩故事,请见《Facebook效应》中文简体版。该书已由湛庐文化策划并出版。——编者注

    [10] 经济合作与发展组织是由30多个市场经济国家组成的政府间国际经济组织,旨在共同应对全球化带来的经济、社会和政府治理等方面的挑战,并把握全球化带来的机遇。——编者注

    [11] 由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,旨在利用网络视频进行免费授课。——译者注

    [12] 此处疑原文数字有误。——编者注

    [13] 在某种程度上,这一神话现已随着“苹果-三星”官司的结果公开而被打破。具体详情请见网址:http://blogs.wsj.com/digits/2012/07/26/turns-out-apple-conducts-market-research-after-all/

    [14] 此处英文原文为:high-and very low-level developrrent efforts.——编者注

    [15] 其创始人是Ignition Partners的一位投资者。

    [16] 此处英文原文为:“For everything else, there’s MasterCard”。——编者注