“人类最大的缺点是无法理解指数函数。”
——阿尔伯特·A·巴特利特(Albert A. Bartlett)
美国科罗拉多大学物理学荣誉教授
虽然戈登·摩尔(Gordon Moore)是英特尔公司的共同创始人、最慷慨的慈善家以及总统自由勋章获得者,但他最为人熟知的是他在1965年所做的一个几乎是题外话的预测。摩尔当时是仙童半导体公司的工程师,他应《电子学》杂志的邀请,写了一篇名为“让集成电路填满更多元件”(Cramming More Components onto Integrated Circuits)的文章。在那时,这种形式的集成电路——在一个主要由硅元素构成的单块芯片上集合了各种各样的电子元件,出现还不到10年时间,但摩尔却看到了这种发展的潜力。他写道:“集成电路将会创造像家用计算机——或者是与中央计算机相连的终端设备,以及自动驾驶汽车的自动控制系统、个人便携式通信设备这样的奇迹。”
这篇文章最出名的预测,也就是让摩尔这个名字变得家喻户晓的,是关于“填满元件”的阐述:
在保持元件成本价格最低的情况下,其结构复杂程度每年大约增加两倍……可以确信,短期内虽然这一增长率不一定会加快,但肯定还会继续保持。而从长期来看,这一增长率会略有波动,但我们有充分的理由相信,这一增长率至少还能持续10年。
这就是摩尔定律原始的阐述,它的深刻含义值得你认真琢磨。“在保持元件成本价格最低的情况下,其结构复杂程度每年大约增加两倍”,这句话的基本含义是,你仅仅用一美元就可以买到集成电路的计算能力。摩尔研究观察到,这种计算能力的大小每年都要翻倍地增加:你在1963年用一美元买到的计算能力将会是1962年的两倍,1964年的则是1963年的两倍,而1965年的又是1964年的两倍。
摩尔预测,这种发展速度将会一直持续下去,虽然随着时间的推移一些改变会发生,但至少还会持续10年。这一大胆的预测也就预示着,1975年集成电路的计算能力将是1965年的500多倍。[24]
然而,正像事情所发展的那样,摩尔的最大错误是太保守了。他的定律竟然持续了40多年,而不仅仅是10年,而且除了集成电路,数字化领域也在突飞猛进。值得注意的是,计算能力成倍增加所需要的时间也一直存在争议。在1975年,摩尔把他成倍增长的预测从一年修正为约两年,即今天人们普遍采用每18个月综合计算能力提高一倍的说法。可以毫无争议地说,摩尔定律将会一直持续大约半个世纪。
摩尔定律:不仅仅是定律,而是更多好的思想
摩尔定律和热力学定律或者牛顿机械定律等物理学定律截然不同。那些定律所描述的是宇宙是如何运转的;不论我们做什么,它们都是真实存在的。相比较来说,摩尔定律所描述的是计算机行业工程师和科学家所做的工作;它评估的是,工程师和科学家们所付出的努力带来了多么持久和成功的进步。我们在其他行业是看不到这种持续进步的。
拿汽车行业来说,我们是看不到在低油耗的情况下,汽车的速度每隔一两年就能提升一两倍的,而且还是一直持续50年。当然,飞机和火车也没有能力在短时间内把它们的速度提高一倍。奥运会赛跑选手和游泳选手即使在一代人的时间里也无法把他们的比赛时间缩短一半,更别说是在几年时间里。
那么,计算机行业是如何保持这种惊人的发展速度的?
这里有两个原因。第一,虽然晶体管和其他计算要素被物质世界的定律所限制,正像汽车、飞机和游泳者一样,但在数字世界里,这些限制就变得异常松散了。这些限制只是与每秒钟有多少电子在集成电路里移动有关,或者与光束在光缆中穿梭的速度有多快有关。而有时候在某个转折点上,数字技术的进步会突然冲破限制——虽然摩尔定律发生的速度一定会降下来,但这还需要一定的时间。半导体制造商博通公司的首席技术官亨利·萨缪里(Henry Samueli)在2013年预测:“摩尔定律将会走向终结——在接下来的10年时间里会渐渐终结,因此我们还有15年左右的时间。”
不过,尽管一些智慧人士一直在预测摩尔定律即将走向终点,但后来的事实证明,他们总是在反反复复地预测一个错误的结论。这并不是因为他们没有理解物质世界对数字世界的制约,而是因为他们低估了在计算机行业里那些努力开拓的人们。第二个原因是,摩尔定律长期以来一直“运转良好”,我们甚至可以称它是“最出色的修补工”——它在数字工程领域找到了避开物质世界障碍的捷径。比如,当填充集成电路变得困难时,芯片制造商就采取多层叠加的方式去解决——这又开发出了一块新天地。当通信流量超出了光缆可以承受的限度时,工程师们开发了波分多路复用技术,这项技术能够同时在同一根玻璃纤维光纤中传输不同波长的光束。可以说,我们“最出色的修补工”一次又一次地找到了各种解决方案,避开了物质世界的限制。正像英特尔公司的研究主管迈克·梅伯里(Mike Mayberry)所阐述的:“如果你仅仅使用同一种技术,那么原则上你很快就会走到尽头。实际上,40年来,每隔5~7年的时间,我们一直在提升和修补我们的技术,而且这样的做法没有尽头。”这种持续不断的修补使得摩尔定律成为我们这个计算机时代核心的思想和奇迹。而且在整个经济大背景下,它也是一个出色的亮点。
指数增长的魅力
一旦这种双倍增长的趋势持续一段时间,后面的数字就会推翻前面的,前面的数字也就变得毫无相关了。为了想清楚这一点,让我们看一个假设的例子。想象一下,埃里克给了安迪一只毛球——也就是在《星际迷航》中那个长着绒毛且有着很高繁殖能力的毛球Tribble。每天,每只毛球会繁殖一只毛球,因此安迪的小动物园的规模每天都会增长一倍。这时候一般人都会说,毛球家族呈现的是指数增长。那是因为,在经过x天之后,如果用数学公式来表达的话,毛球的数量将是2x–1,这里的x–1就是一个指数。像这样的指数增长是一种非常快的增长模式,在两周之后,安迪就会拥有1.6万只毛球了。下面这张图(图3–1)所描绘的就是毛球家族随着时间而增长的趋势。

图3–1 随时间增长的毛球:持续双倍增长的力量
这张图是非常准确的,但会给人一种误导。它看起来就好像是,所有的增长都发生在最后那些天里,而在第一周时间没有任何事情发生。但同样的奇迹——每天成倍增长的毛球,一直在所有时间里发生,并没有加速或突然爆发。这种稳定的指数增长是埃里克给安迪的“礼物”中真正有趣的事情。为了阐述得更明白点,我们必须要修改这张图表中的数量间隔。
前面我们绘制的这张图(图3–1)所使用的是标准的线性间隔,也就是说竖轴的每段分割指示的都是2 000多只毛球。正如我们看到的,这样绘制的图非常清晰明了,但它却不利于充分说明指数增长。为了更好地强调这一点,我们将把线性间隔修改为对数间隔,也就是说竖轴的每一段分隔都代表的是毛球数量10倍的增长:第一次增长从1~10,然后从10~100,再之后从100~1 000,依次类推。也就是说,我们在竖轴上用10倍的间隔标示数量级的增长(图3–2)。

图3–2 随时间增长的毛球:持续双倍增长的力量
对数图有一个非常出色的特征:它们可以把指数增长显示为一条完美的直线。图3–2就是用对数标尺标示的安迪毛球家族的增长趋势。
对数图强调的是随着时间的增长双倍增长的稳定性,而不是最后时间的大规模增长。正因为此,我们经常使用对数标尺来绘制双倍增长以及其他一系列指数增长的趋势。这种图凭借一条直线就能清晰地评估速度的增长:指数越大,增长得越快,图中直线的斜率就会越大。
要破产的国王、没有头脑的创新者以及棋盘的另一半
实际上,我们的大脑很难理解持续不断的指数增长。尤其是,我们会严重低估最后数据的规模。发明家和未来学家雷·库兹韦尔(Ray Kurzweil)复述了一个古老的故事,清晰地阐述了这个话题。国际象棋起源于公元6世纪的印度笈多帝国。故事是这样的,国际象棋是一位非常聪明的人发明的,有一次他旅行到了笈多帝国的国都巴特利普特那,就把象棋献给了国王。国王对这个新奇的玩意儿非常入迷,他就想着给这个发明者一些奖赏。
发明者赞美了国王的慷慨,他对国王说:“我只要能够填饱我们一家人肚子的米就可以了。”由于国王的慷慨是由象棋的发明激发的,所以发明者建议使用象棋的棋盘来测量他所要的米。“在棋盘的第一个方格里放一粒米,在第二个格里放两粒米,在第三个格里放四粒,就这样一直放下去,”发明者提议道,“每个方格里的米粒都是前一格里的两倍。”
“好,就这样做吧。”国王回答道,他认为这位发明者非常谦逊。
摩尔定律和前面毛球的例子使我们明白国王是无法满足发明者的要求的:即使以一个很小的数字开始,但以2倍的速度增长63次,最后产生的将是一个天文数字。如果这位发明者能够得到他所想要的米粒,那么最后一格米粒的数量将是264–1,如果将所有的米粒加起来,数量将超过1 800亿亿。一堆如此多的米粒将会令珠穆朗玛峰也显得矮小无比,这些米要比全世界历史上所有出产的米还要多。因此,这个国王是无论如何也满足不了这个要求的。在这个故事的其他一些版本中还有这样的结局,国王意识到他被戏弄了,于是把发明者的头砍了下来。
库兹韦尔讲述这个发明者和国王的故事是在2000年出版的书《灵魂机器的时代:当计算机超过人类智能时》(The Age of Spiritual Machines: When Computers Exceed Human Intelligence)中。他讲这个故事的目的不仅是为了说明指数增长的力量有多么强大,而且是为了强调当数字达到了一个很大的数量级时将会变得无法想象。
在填完32格之后,国王已经赐给发明者40亿粒米了。这还是一个比较合理的数量——大约相当于一大片土地的产量,这时候国王才开始注意到数量的庞大。
但这位国王依然神清气定,而那位发明者的项上人头也没落地。但当他们都进入棋盘的另一半时,他们中的其中一人就肯定会遇到麻烦了。
库兹韦尔极富远见地认识到,虽然棋盘的前一半的数量级已经很大了,但在现实世界中我们还是可以经历的。40亿粒米可能还处于我们直觉之内,比如我们在收获季节会想象米粒的数量,我们会去猜想当今世界最富有的人有多少财富,或者合算一下国家的债务水平。然而,在棋盘的另一半中,由于数量被累积到100万的平方、100万的3次方、100万的4次方,我们就无法想象了。我们甚至也无法想象这些数字是如何按照指数级的速度持续增长的。
库兹韦尔关于棋盘的一半和另一半的区别与分析激发了一种快速的计算方法。其中,美国经济分析局对美国公司费用支出的跟踪很有特色。经济分析局在1958年第一次把信息技术作为公司独特的投资领域。我们把那一年当作摩尔定律进入商业领域的起点,并且使用18个月作为双倍增长的时间节点。在经过32年的双倍增长之后,美国商业进入了棋盘的另一半,数字化工具开始使用了。那是在2006年。
当然,这种计算和划分方法并不正式,甚至还有点娱乐性质,也就是说,并不是你锁定了技术腾飞的某个起点之后,所有的改变都在这个点上发生了。你可以很容易地把1958年当作起点,将18个月作为双倍增长的时段。当然,不论这两个假定条件的哪一个改变,都将在棋盘的一半和另一半之间产生一个不同的分界点。我们也知道,商业技术专家并不仅仅在另一半棋盘里才进行创新;正像我们后来讨论的,今天和明天的技术突破如果没有昨天的技术推动也是不可能发生的。
我们之所以把这种评估方法提出来,是因为它涉及一个重要的思想理念,即指数增长最终会产生出令人惊愕的大数字,这些数字完全超出了我们的直觉和经验。或者说,事情突然在棋盘的另一半中变得奇异无比了。就像那个国王一样,我们大多数人都无法感知了。
能够让第二次机器革命时代突显出来的一个重要因素是,棋盘的另一半迸发出来的速度将有多快。我们当然不是在这里宣称,没有其他技术在以前出现过指数增长。事实上,由瓦特发明的蒸汽机带来的创新也曾经一度带来了巨大的技术提升,这种提升在接下来的200年时间里确实呈现了指数增长。但这种指数增长的规模还是相当小的,所以在那段增长时期,在效能上只出现了三四次的双倍增长。如果按照这种速度,那么要想达到棋盘的另一半,至少需要花费1 000年的时间。而在第二次机器革命时代,双倍增长发生的速度会快得多,也就是说,指数增长表现得会更显著。
棋盘的另一半里的技术
快速双倍增长的计算评估方法也能帮助我们理解为什么数字技术在这段时期里提升得如此迅速,以及为什么我们最近会看到如此多的商业小说所描述的场景都变成了商业现实。那是因为这种具备摩尔定律特征的稳定而快速的指数增长,使我们到达了一个与众不同的计算体系的节点之中。我们在前面章节所描述的创新技术,比如在车流中行驶的无人驾驶汽车,《危险边缘》游戏中获胜的超级计算机,自动创作生成的文章,廉价、灵活的工业机器人,价格低廉且集通信设备、三录仪与计算机为一体的电子设备,这些产品都是2006年之后才出现的,它们以及其他无数种令人炫目的科技产品大大有别于以前的产品。
它们之所以现在纷纷出现的其中一个原因是,构成这些产品核心的数字化技术已经变得足够迅速和廉价,能够大量地装配这些数字产品。这和10年以前的情况是不一样的。那么,数字技术的进步如果用对数标尺来衡量应该是什么样的?让我们来看一看(图3–3)。

图3–3 摩尔定律的多种维度
这张图说明,摩尔定律既具有持久性,也具有一定的广泛性;它已经持续了很长时间(在一些情况下持续了10年),而且适用于很多种数字化技术的进步。正像你看到的,如果在竖轴上使用标准的线性标尺,那么所有近乎平直的线段都看起来像前面图中安迪的毛球家族一样——大部分都是水平的,然后突然在最后就接近垂直了。实际上在这种情况下,并没有真正可行的方法能在一张图上把它们全部展示出来——它们所涉及的数字差异太明显了。而对数标尺可以考虑到所有的这些问题,它能帮助我们对数字化技术和工具的提升有一个清晰而全面的认识。
很明显,计算机处理系统的关键组成要素——微型集成电路片密度、处理器速度、存储容量、能效、下载速度等,长时期以来一直在呈现指数增长。为了真正理解摩尔定律在现实世界中的影响力,让我们对比几段双倍增长时期之前以及之后计算机性能的优劣。ASCI Red超级计算机,是美国增强战略运算能力计划(ASCI)[25]第一阶段的产品,当它在1996年被研发出来时是世界上运算速度最快的超级计算机。这台超级计算机被安装在新墨西哥州的桑迪亚国家实验室,它的成本费用高达5 500万美元,它由100个电子柜拼合而成,占地达到1 600平方英尺(约150平方米,有一个网球场80%的面积那么大)。在对计算机速度进行的标准的基准测试中,ASCI Red超级计算机成为第一台浮点运算达到万亿级别的计算机——每秒1万亿次的浮点运算。为了达到这一运算速度,这台超级计算机每小时要耗费800千瓦的电量,相当于约800个普通家庭的用电量。到1997年时候,它已经达到了1.8万亿次的浮点运算。
9年之后,另一台计算机也达到了1.8万亿次的浮点运算。但它不是用于模拟核爆炸,而是用于在实时的三维世界画面中进行复杂的图像处理。也就是说,这台计算机不是为物理学家服务的,而是为游戏玩家服务的。这台超级计算机就是索尼PlayStation 3(索尼家用综合计算机娱乐平台三代),它在性能上可以媲美ASCI Red超级计算机,然而其成本却只有500美元,所占用的面积不足一平方米的1/10,功率也仅有约200瓦。在不到10年时间里,数字化技术的指数增长已经把万亿级别的浮点运算从单一的政府实验室扩散到全世界的客厅和大学生宿舍。索尼PlayStation 3大约售出了6 400万台,而ASCI Red超级计算机在2006年就退出了服务的舞台。
指数增长还使得我们前面章节中提到的很多技术进步成为可能。IBM的“沃森”拥有极其聪明的运算“头脑”,但它如果没有优良的计算机硬件也是没有竞争力的——要知道“沃森”的硬件系统要比“深蓝”的性能强大100倍。而“深蓝”曾在1997年与世界象棋冠军加里·卡斯帕罗夫(Garry Kasparov)对弈中获胜。像Siri这样的语音识别应用也需要优良的计算处理能力,而它现在在像苹果iPhone 4S(是安装Siri系统的第一代手机)这类的手机上已经开始了应用。事实上,iPhone 4S在处理能力上就像苹果公司10年前研发的顶级Powerbook G4(第四代强力笔记本计算机)笔记本一样强大。正像现在所有的创新一样,指数增长和进步能够始终确保技术处在最前沿,也能促使科幻小说在棋盘的另一半中成为现实。
并不仅仅是计算机:摩尔定律的扩展
对计算机世代升级的另一种对比方法强调的不仅仅是摩尔定律的强大能量,还有它的广度。正像在ASCI Red超级计算机、索尼PlayStation 3、Cray–2超级计算机(1985年生产)和iPad 2平板计算机(2011年生产)的例子中,它们差不多都有相同的最高计算速度。但iPad 2还有扬声器、麦克风和耳机接口。它还有两个摄像头,一个是前置VGA(视频图形阵列)摄像头,另一个是后置摄像头,能够捕捉高清视频。这两个摄像头都具备摄像功能,背后的摄像头还有5倍的数字变焦。iPad 2平板计算机还拥有信号接收系统,这使它能够具备无线电话和WiFi(无线)网络系统的功能。它拥有GPS接收器、数字指南针、加速表、陀螺仪、光敏感器。虽然它没有内嵌式键盘,但它可以依靠高清触摸屏同步跟踪11个触控点。所有的性能都囊括在一种设备里,然而其成本却不到1 000美元,而且还要比很多杂志更小、更薄、更轻。Cray–2超级计算机的成本高达3 500万美元(以2011年的美元来衡量),但相比起来,它却是一个聋子、哑巴、瞎子和呆子。
苹果公司之所以能够把所有这些功能都融入iPad 2中,是因为一个更宽广而深远的转变在最近几十年里已经发生了:像麦克风、摄像头、加速表这类的传感器已经从模拟世界转移到了数字世界。在本质上,它们已经变成了计算机的芯片。在这一过程中,它们呈现出了摩尔定律指数级增长轨迹的特征。
记录声音的数字化工具和技术是在20世纪60年代开始使用的,1975年伊士曼柯达公司的一位工程师制造出了第一台现代意义上的数码照相机。早期的这种数码相机既昂贵又笨重,但之后产品性能迅速提升,价格也直线下降。柯达的第一台单反数码相机DCS 100在1991年出产时成本大约为1.3万美元;它拥有130万的最大像素,所拍摄的照片被存储在一块重量达4.5公斤的单独硬盘存储器里——拍摄者需要把存储器挂在脖子上。然而,数码相机每一美元所获得的像素每年都会成双倍增长[这一现象被称为“亨迪定律”,是由柯达公司澳大利亚雇员巴里·亨迪(Barry Hendy)发现并记录的],而与之相连的数字化部件也随着时间的变化而呈现出了指数级变化——更小了、更轻了、更便宜了、更好了。数字传感器累进式的技术提升也就意味着在DCS 100出现20年之后,苹果公司完全可以把兼具摄影和录制功能的微型摄像头融进iPad2之中。当苹果公司在第二年又推出了新一代的iPad产品时,后发的照相机革命已经把技术发展提升了7倍还多。
机器的眼睛
当摩尔定律在处理器、存储器、传感器以及其他计算机硬件(一个极其例外的情况是电池,它的性能并不是以指数比率而提升的,那是因为它基本上是由化学成分构成的,而不是电子化产品)发挥作用时,它并不仅仅使计算机设备变得更快、更廉价、更小、更轻,它还使得这些设备的性能提升到我们之前根本就无法想象的高度。
人工智能领域的研究专家一直着迷于(甚至是迷恋于)同步定位与建图问题,也被称作SLAM。[26]实际上,SLAM就是当你穿梭于一栋不熟悉的建筑物时,你把这栋建筑物以地图的形式在脑子里绘制出来的过程,包括门在哪里、楼梯在哪里,以及你可能碰到的所有东西。同时,你也能把你在这栋建筑物的行踪完整地记录下来(比如,你能发现回到楼下以及从前门出去的路径)。对于绝大多数人来说,SLAM仅仅需要一点点思想意识就能做到。但如果教会一台机器这样做,将会是一个巨大的挑战。
应该给机器人安装哪种传感器(摄像头?激光器?声波定位仪),传感器在接收到信号后又该如何解析?这些都是研究专家们曾经认真思考过的问题,但针对这些问题的解答进展得并不顺利。正像2008年对这个研究课题所进行的总结一样,SLAM是“机器人所面临的基本挑战之一——(但它)看起来好像几乎所有当前的方案都无法在一个面积较大的区域内持续不断地完成地图的绘制,主要原因之一是由于计算成本的增加,另一个是由于当场景和区域变大时,一些不确定的因素就显现了出来”。总起来说,感知一大块区域,并且能够立即吸纳、解析获取的所有数据是非常棘手的问题,这个问题严重阻碍了SLAM的进展。直到一件售价150美元的视频游戏周边设备生产出来之后,这个问题才得以解决——这个时间正是SLAM的难题被公布出来两年之后。
2010年11月,微软公司推出了Kinect传感器,作为应用于Xbox游戏平台的周边设备。Kinect能够跟踪两名操作中的玩家,捕捉每名玩家多达20个关节点。如果一名玩家移动到另一名玩家的前面,这个设备就会对被隐藏在后面的玩家的动作做出最精准的推测,然后当他或她重新回到监控视野范围时,再对其所有的节点进行无缝式的捕捉。Kinect能够通过光线和声音识别玩家的脸、声音和手势,要完成这些,它需要使用数字传感器——包括一排麦克风(一排麦克风要比单独一只麦克风更精确地探明声音的来源)、一个标准的视频摄像头以及一套既能投射又能探测红外线的全方位感知系统。然后设备中的数个处理器和大量的专用软件把这些传感器的输出信息再转换成游戏设计者能够使用的信号。到最后,所有的功能都被融进了这台仅有4英寸(约10厘米)高、不足1英尺(约30厘米)宽、零售价为149.99美元的设备中。
在产品发售之后,Kinect在60天之内的销量就超过了800万台(超过了iPhone和iPad),直到现在这一数据还依然保持消费电子产品销售速度最快的吉尼斯世界纪录。早期的Kinect能够让玩家玩飞镖、搏斗以及哈利·波特的魔法术等游戏,但这些还远远没有穷尽这台设备的功能。2011年8月,在加拿大大不列颠哥伦比亚省温哥华市SIGGRAPH(图形与交互技术特别兴趣组)大会上,微软公司的员工和专家使用Kinect砰的一声[27]关上了机器人领域这个长期存在的难题和挑战。
SIGGRAPH是致力于研究和实践数字图形规模最大且最负盛名的研究团体,参与者包括研究专家、游戏设计者、记者、企业家和对这一领域感兴趣的其他人士。这个团体的大会是微软展示“创想计划”网站所称的“自垦改变一切”[28]项目的最佳平台。这个项目指的就是“KinectFusion”——它利用Kinect来解决SLAM难题。
在SIGGRAPH 2011年的一段视频展示中,一个人手持一台Kinect,对着一间普通的办公室——里面有椅子、盆栽植物以及台式计算机和显示器。当他这样做的时候,视频图像就被分解成Kinect能够感知的多幅屏幕。从这段视频中,我们就能很清楚地知道,即使Kinect没有完全解决这间办公室的SLAM的难题,也基本差不多了。在实际的过程中,Kinect能够绘制一幅三维的房间地图,里面有所有的物品,还包括一位待在房间里的人员。对于KinectFusion,科技博客Engadget在SIGGRAPH大会之后的登记条上所写道的是:“Kinect把3D感应带到了主流世界,而且研究专家们的智慧也变成了商品化的产品,简直太疯狂了。”
2011年6月,也就是在SIGGRAPH大会召开前夕,微软公司已经开发了Kinect软件开发包,供程序员使用。在大会之后,人们使用Kinect来进行同步定位与建图的兴趣迅速增长,很多机器人和人工智能研究领域的团队都下载了软件开发包。
在不到一年的时间里,一支由我们麻省理工学院计算机科学与人工智能实验室的同事约翰·伦纳德(John Leonard)引领的爱尔兰和美国研究团队宣布了Kintinuous的诞生,它实际上相当于一个“空间扩展”了的KinectFusion版本。借助Kintinuous,使用者可以使用Kinect扫描像公寓大楼里面积更大的室内场景,甚至是室外的环境(这个团队在夜间驾驶时,借助手持Kinect,透过汽车玻璃,来扫描外面的场景)。在阐述他们项目的文章最后,Kintinuous研究团队写道:“在未来,我们将会把这个项目扩展到彻底解决SLAM的难题。”我们也认为,距离他们宣布成功的日子已经不远了。当极富创造天分的技术专家与摩尔定律的指数增长完美结合起来的时候,即使最棘手的问题也可以迎刃而解。
在前面章节里我们谈到,价格低廉、功能强大的数字传感器是一些科技类科幻小说一定会涉及的话题。Baxter拥有多个数字摄像头,以及一组强大的定位探测器。所有这些工具和设备在不久之前还显得笨重无比,而且精确性也不够,昂贵的价格也使其无法实际应用。Google自动驾驶汽车吸纳了几种传感技术,但它最重要的“眼睛”是被装配在汽车顶部的巨大的LIDAR[是LIght(灯)和raDAR(雷达)的结合体]。这个设备是由Velodyne(一家激光雷达传感器制造公司)公司生产的,它安装在每秒旋转10次的机器罩里,包含了64道相互分离的激光束以及同等数量的探测器。LIDAR每秒可采集130万个数据点,然后设备上的计算机把这些数据点整合起来,转换成一个实时的3D画面——范围可以达到周围100米。早期的商业LIDAR系统在2000年左右就出现了,但其成本却高达3 500万美元,而在2013年中,Velodyne公司为自动行驶车辆装配的雷达系统价格却只有约8万美元,而且这个数字在不远的将来还会大幅下降。该公司的创始人和首席执行官戴维·霍尔(David Hall)预测,大批量生产将会使得这一产品的价格降至相当于“一台几百美元的照相机”的水平。
这一章所有的这些例子都在说明,为什么我们现在处于第二次机器革命时代的三个基本特征中的第一个:稳定的指数增长已经把我们带入棋盘的另一半时代——我们所惯常认为的那种可以催生未来的“前车之鉴”在这个时代里已经不再可靠。摩尔定律的双倍累积效应,以及双倍累积的外溢效应仍会纷至沓来,用不了多少年,我们的世界将会是一个超级计算机的世界。在这个世界里,前所未有的廉价传感器所带来的“廉价”解决方案将会使以前棘手的难题消遁于无形,科幻小说的虚幻世界也将变成活生生的现实。
有时候一定程度上的不同(换句话说,更多的是相同),能够变成根本上的不同(换句话说,与任何事物都不相同)。棋盘的另一半的故事提醒我们,我们应该充分意识到,充足的指数增长和进步能够把我们带入一个令人吃惊的新天地。实际上,最近的很多例子都让我们确信,我们已经进入了一个新天地。
[24] 即29=512。
[25] 美国克林顿总统执政期间,美国能源部启动了提高战略运算能力计划,把以前用于研制核武器的一部分经费拨出来,资助企业和大学使用比较普通的部件研制超级计算机,以便在不危及国家安全的情况下通过三维建模和仿真进行模拟试验来检测其核武器的战斗力。ASCI项目的最终目标是研制出100万亿次的超级计算机系统及相应的软件和算法。ASCI计划分为5个阶段逐步实现最终目标,分别是打造1万亿次、3万亿次、10万亿次、30万亿次和100万亿次的系统,即每个阶段运算速度大约提高3倍,平均每两年为一个阶段,前三个阶段分别称为红色、蓝色和白色。——译者注
[26] SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。——译者注
[27] 作者在此处用了“SLAM”这个词的双关语义,“SLAM”既可以指“同步定位与建图”,也可以指“砰的关门”。——译者注
[28] 全称为The Self-Hack That Could Change Everything。在这一背景下,“开垦”指的是把一台数字化设备的内部详情挖掘出来,并用于非常目的。而“自垦”则指的是公司把数字设备的研发摆在第一位置。
