您当前的位置:周末画报 > 商业 > 财富 > 大脑芯片正领跑人工智能

大脑芯片正领跑人工智能

摘要: Graphcore的“智能处理单元”吸引了几乎所有超高速人工智能企业的关注。

Graphcore公司首席技术官西蒙· 诺尔斯(Simon Knowles)面带微笑,在白板上勾勒着他对机器学习未来的愿景。他用黑色记号笔做标记,绘制人类大脑节点的示意图:这些节点可让人进行“沉思、深思和思考”。他的初创企业尝试在其下一代计算机处理器中模拟这些神经元和突触,该公司相信这种处理器可以实现“自动化智能”。


人工智能通常被认为是挖掘大量数据集的复杂软件,但诺尔斯和联合创始人、首席执行官奈杰尔·图恩(Nigel Toon)认为,运行这类软件的电脑仍然存在更重要的障碍。问题在于芯片[根据其功能称为CPU(中央处理单元)或GPU(图形处理单元)]没有设计成按照人类特有方式“思考”的产品。人类大脑利用直觉来简化处理某些问题,比如识别走近的朋友,而计算机可能会尝试分析对方面部的每个像素,与包含数十亿张图像的数据库进行比较,然后才会开口打招呼。在计算机主要作为计算器使用的时候,这种精度是有意义的,但是对人工智能来说效率非常低,要消耗大量能量来处理所有的相关数据。


2016年,诺尔斯和图恩创立了Graphcore公司,他们把“低精度”计算作为芯片的核心能力,将其称为智能处理单元(IPU)。“你脑子里的概念很模糊。实际上,正是把这些非常接近的数据点聚集在一起,才让你产生了清晰的想法。”诺尔斯说。关于为什么人类智能以这种方式形成,各种理论众说纷纭,不过对于需要处理“图形”这种规模庞大无序的信息结构的机器学习系统来说,打造专门连接类似节点的数据点的芯片,可能是人工智能进化的关键。诺尔斯说:“我们想制造一台超高性能的计算机,利用低精度来处理数据。”


也就是说,如果Graphcore公司的两位联合创始人判断正确的话,该公司正在为计算机开发的大脑将像人类一样处理信息,而不是通过大量的数字运算来模拟人类。“几十年来,我们一直告诉机器每一步该做什么,但我们不再这么做了,”图恩说,他描述Graphcore的芯片怎样教会机器如何学习。“这就像是回到20世纪70年代,当时微处理器刚刚问世,我们需要摆脱传统模式。我们在重现英特尔的历史。”


投资者赫尔曼· 豪泽(Hermann Hauser)是安谋控股公司 (Arm Holdings Plc)的联合创始人,该公司掌握着应用最广泛的芯片设计业务,豪泽认为诺尔斯和图恩开发的IPU将掀起下一波计算浪潮。“在计算机历史上,这种情况只出现过3次,”豪泽说,20世纪70年代的CPU、20世纪90年代的 GPU,“Graphcore是第3次。他们的芯片是全世界最伟大的新架构之一。”


Graphcore 的“智能处理单元”引发AI行业密切关注

Graphcore 的“智能处理单元”引发AI行业密切关注。


创立Graphcore

Graphcore公司的起源要追溯到豪泽于2011年和2012年在剑桥大学为皇家学会举办的一系列专题研讨会。在国王学院一间豪华的餐厅里,人工智能专家、神经学家、统计学家和动物学家就先进的计算技术对社会的影响展开了辩论。


当时剑桥大学信息工程学教授史蒂夫· 扬(Steve Young)在演讲中提到了计算对话系统的局限性,他后来把自己创办的语音处理公司出售给了苹果公司,现在用于Siri 语音助手。在其演讲时,诺尔斯向他提出了有关能量效率的问题。“我问他的算法采用什么样的数字精度,对史蒂夫来说,这似乎有点出乎意料。”他强调说,在硅芯片中,“数字精度是非常关键的能量决定因素。”


几天后,扬给诺尔斯发了一封电子邮件,说他的学生调查了这个问题,发现他们每次计算都使用64位的数据。他们意识到,正如诺尔斯建议的那样,使用低精度的算法(8位)也可实现同样的功能。当计算机需要完成更少数学运算的时候,可以用节省下来的能量处理更多的数据;这就像是人类的大脑从计算一家餐厅的精确GPS坐标到仅仅记住餐厅的名字和社区。“如果我们制造出更适合这类工作的处理器,我们可以把性能提高1000倍。”诺尔斯说。扬和其他人对此印象深刻,于是诺尔斯和图恩决定必须创建Graphcore。早在2013年,他们就开始筹集资金来实现这个想法,并在2016年让全世界认识了这家公司。


Graphcore首席技术官西蒙·诺尔斯(左) 和首席执行官杰尔·图恩(右)

Graphcore首席技术官西蒙·诺尔斯(左) 和首席执行官杰尔·图恩(右)。


设计更智能芯片

半导体行业目前正在讨论摩尔定律的可持续性,这个追溯到20世纪60年代的定律指出,芯片上可容纳的晶体管数量(以及性价比)每隔两年就会增加一倍。Graphcore的领导者关注的是另一个相关概念,叫做“登纳德缩放定律”,该定律指出随着晶体管密度的提高,功率需求将保持不变。但这个原则已不再适用,芯片上增加更多的晶体管现在意味着芯片将变得更热、耗能更高。为了缓解这个问题,有些芯片制造商把产品设计成不会同时使用所有的处理能力(芯片上未使用的区域称为“暗硅”),而只运行支持应用程序所需的部分。


诺尔斯和图恩说,除非彻底重新设计电路以提高能效,否则尤其是高温问题将阻碍手机和笔记本的运行速度。研究Graphcore芯片架构的丹尼尔·威尔金森(Daniel Wilkinson)说:“我要由一张白纸从头开始,这是芯片设计中从未有过的情况。”他们向几十名工程师组成的团队发起挑战,要求他们设计一种芯片,既能同时利用所有的处理能力,又比最先进的GPU消耗更少的能量。硅芯片的主要能量压力来自转移和检索数据,但从历史上来看,处理器与内存是分开的。诺尔斯说,在这些组件之间来回传输数据“非常耗费能量”。Graphcore开始设计他称为更“同质化结构”的芯片,将芯片的逻辑运算与内存“混合”起来,这样就不必耗费太多能量将数据传输到另一个硬件。


在三年多的时间里,他们对数百个芯片设计架构进行了计算机模拟测试,最终确定了包括1216个处理器内核的设计方案,诺尔斯将其称为“可以分解能源的多个独立处理器小岛”。该公司在2018年制造了最终的IPU成品,这款光滑的芯片只有薄脆小麦饼干大小,有近240亿个晶体管,能够以远低于GPU的功率访问数据。“每块芯片的功率是120瓦,和明亮的白炽灯泡差不多,大约相当于0.8伏和150安培。”图恩说,他站在布里斯托总部一间凌乱的电子实验室里,用拇指抚过IPU镜面般光滑的表面。


为了对原型产品进行测试,该团队为芯片提供了标准的数据训练模型,由数百万个带有普通物体(水果、动物、汽车)标签的图像组成。一位工程师随后用自己的猫宙斯的照片向IPU发出查询请求,不到一个小时的时间,计算机不仅正确识别了这只猫,还准确描述了宙斯的毛色。“IPU能够认出这是一只斑纹猫。”诺尔斯说。自从第一次测试以来,这款IPU已经加快了运行速度,现在每秒可以识别1万多幅图像。这样做的目的是让芯片能够消化和判断更复杂的数据模型, 使系统能够在更基本的层面上理解猫的概念。“我们不告诉机器该做什么,只是描述机器应该如何学习,提供大量的例子和数据,机器实际上不需要监督,”他说,“机器正在探索自己该做什么。”


Graphcore 的第一款芯片“巨人”

Graphcore 的第一款芯片“巨人”。


全球人工智能芯片市场


机遇与挑战并存

在Graphcore办公室的五楼,笨重的工业空调把冷空气送进该公司的数据服务器室。这些芯片安装在冰箱大小的机柜中堆叠的服务器里,尽管非常节能,但机器仍然会产生极大热量。这些IPU服务器机架性能强大,足以执行每秒64千万亿次浮点运算,相当于以最高速度同时运行的18.3万部iPhone X手机。诺尔斯和图恩以世界上第一台电子可编程计算机的名字,把他们的IPU命名为“巨人”,而巨人计算机是英国政府在二战期间为破解来自德国的加密信息而开发的。


Graphcore已经从包括宝马(BMW)、微软(Microsoft)和三星(Samsung) 在内的投资者那里筹集了3.28亿美元的资金,上一轮融资是在2018年12月,当时估值达到了17亿美元。有些用途似乎显而易见:自动驾驶汽车、类似Siri 的语音助手和云服务器农场。但诺尔斯对改变人类的应用最感兴趣,比如IPU可能对科学家在气候变化的影响。


IPU依赖于称为并行计算的概念,基本理念是需要为每个处理器编写程序使其正常运行,但随着芯片中内置的处理器数量激增(Graphcore的大型设备包括约500万个处理器内核,能够同时运行近3000万个程序),这个编码任务已经取代了人类编程工作,这意味着编程必须自动化,处理器才能独立执行程序。通俗地说,Graphcore 将庞大的计算任务分解为多个小的数据问题,每个问题分配到“处理器小岛”上单独处理,然后像海军行进乐队一样同步协作,分享他们在最高效的时刻学到的东西。


宝马风险投资部门的投资主管托比亚斯· 雅恩(Tobias Jahn)设想把Graphcore芯片用于该公司的数据中心,也许还有宝马汽车。自动驾驶必须立即执行多项关键任务,考虑到在云环境中运行往往伴随着时间滞后,使自动驾驶汽车成为IPU等产品的关键市场。安谋控股联合创始人豪泽现在是阿马德乌斯资本(Amadeus Capital)的合伙人,他估计每辆无人驾驶汽车可能需要两个IPU。声名显赫的竞争对手也纷纷涌入这个领域。特斯拉公司(Tesla Inc.)最近为自己的人工智能芯片申请了专利。谷歌2018年推出了一款专为机器学习而设计的微处理器。英伟达在修改该公司占据主流的GPU芯片设计,使其降低计算精度、提高效率,更接近Graphcore 的设计方案。“其他公司都想向英伟达展现实力,”咨询机构高德纳公司(Gartner Inc.)分析师艾伦·普里斯特利(Alan Priestley)说,“Graphcore 有很好的定位,但是相比英伟达的市场份额,该公司仍然是个非常小的竞争对手。”因此,尽管他们的IPU比英伟达的GPU更适合这些工作负载,但他们面临的风险是,客户目前选择的是“足够好”而不是“出色”。


另一个重大挑战是IPU面临的伦理困境,如像承诺的那样,IPU能够让机器的运行能力达到当今计算机的100倍。图恩和诺尔斯对这些风险持谨慎态度,尤其是这样的技术可能被滥用于武器和威权监控。不过他们表示,最终需要政府来设定限制。“机械动力给我们带来了航空公司和汽车,”诺尔斯说,“但也给我们带来了坦克。随着时间的推移,社会将必须实现善恶的平衡。”


撰文— Austin 编辑— Ruby 摄影— Catherine Hyland

(本文选自《商业周刊/中文版》第440期)

相关推荐 更多>
请填写评论内容
确定