IBM日前公布了TrueNorth处理器效率的更多信息。TrueNorth是模拟人类大脑的新型芯片,该芯片并不是把亿万计的数字晶体管拍成一列,而是让100万个计算机“神经元”通过2.56亿个神经元连接(突触)进行协同工作。据这些报告显示,其做法极大地提升了芯片的处理性能,更重要的是提高了能耗效率。毫无疑问:神经计算将会颠覆世界,而那一天将比你想象中来得更快。
神经计算机的发展方向跟数字电脑十分类似:首先要确定运算的作用(例如,在战争中计算出射击的轨迹);然后根据现有的工具开发出一种粗略的解决方案(比如说,让工作人员进行手工运算);接下来发明一种可以进行高效自动处理的机器。数字电脑的效率比人类更高的部分原因是,它的晶体管能快速传输信号,但我们的神经元也能做到这一点。数字电脑最大的问题在于开发者是从零开始为各种各样的数学运算进行设计。从某种角度来说,我们试图在电脑上进行像人脑那样的高效计算工作看上去有点疯狂。
虽然全新的GPU处理速度很快,但其效率还是远远比不上神经计算。
同样,在以后回顾今天的人们尝试通过数字芯片(包括GPU)来进行深度学习时,我们也会认为这是十分不明智,甚至是一种愚蠢的做法。更为合理的做法是从最基本的硬件层面设计出匹配这样计算的机器。这不仅会大幅度提高处理率的工作效率,而且还能大大减少所需的能耗。这也是IBM所做的事情,其结果比大部分人预测的还要惊人。
在处理图像分类任务时(一种很好理解的机器学习任务),TrubeNorth芯片可按1200-2600帧的速度进行分类,而能耗仅为25-275毫瓦,有效效率超过6000帧每秒每瓦。目前使用类似分类算法和数据集的传统GPU并没有标准的帧/秒/瓦规格,但考虑到今天的显卡本身或许就需要200瓦,甚至是250瓦,很难想象GPU可以实现低耗高能的应用。
上图为12个不同的分析过滤器的输出结果。
最重要的是,现代机器学习的成本极其昂贵。只有像苹果、Facebook和谷歌这样公司才能使用昂贵的超级计算机阵列来为其提供先进的服务。但这种专业化的服务极其昂贵,就算不考虑这一点,一天24小时满负荷或接近满负荷运行多台计算机所产生的电费就已经是一笔不少的开支。“比特币矿工”对此不会陌生。
类似TrueNorth的先进神经网络令Alphago战胜了世界围棋冠军李世石
所以在早期阶段,昂贵的神经计算设备对服务提供商来说或许是一个重大利好。我们也只能说希望性能更优更节能的消费者版产品能早日出现。但神经芯片所能提供的速度和效率不会在此止步,几个数量级的能耗减少将会使完全通过云端处理成为可能。
希望拥有像雅虎宝贝鱼那样的自动翻译软件,但无需一直保持网络连接吗?那么一台能独立处理数据的健身追踪器,无需将数据上传到另外的电脑进行分析又怎样呢?一台离线无人驾驶汽车呢?
目前并没有任何证据表明传统硬件可以实现上述任务,但神经芯片是目前最有可能做到的方式。
上图为IBM的NS16e电脑。
IBM推出了一台全新的NS16e电脑,搭载了16个TrueNorth处理器,相当于400亿个神经突触。虽然这还远远比不上人类大脑,但已经足够处理现代机器学习所面临的挑战。借助相互之间的连接机制,这16个芯片可以彼此沟通,从广义上反映出连接大脑两个半球的胼胝体的功能。
但IBM并不是唯一朝着这条特殊终点线冲去的公司。有传闻表示谷歌也有一个进行类似研究的项目。更值得注意的是,高通此前已经表示即将推出的骁龙处理器会迎来神经计算功能,但高通并没有透露具体工作原理,最近也没有太多的相关消息。现在该领域中的私人投资大多为试探性的投资,而IBM的大部分突破主要得益于DARPA的资助。
DARPA的另一项发明是:超微型高效GPS追踪设备。
没错,就是DARPA。士兵经常需要行走在信号覆盖不佳的区域,而且还需要跟操着方言的当地居民进行交流。传统的解决办法是借助自然语言处理(NLP)工具,现在执行外勤任务的士兵会为NLP分析进行大部分的数据收集。通过神经计算,他们的翻译工具可以马上破解一种全新的方言,实时改善翻译效果。
士兵并不是唯一需要便携性计算工具的人群。从谷歌眼镜2.0到Snapchat的Spectacle,似乎只有智能眼镜才能实现其真正的潜能,免除远程数据服务器的需要。我们可以想象一下,一副可以将有用的增强现实信息叠加在真实世界的眼镜,如果它需要持续地接受远程的大量数据,那么这种功能将很难普及到成千上万的电子产品消费者。
有报道称埃隆·马斯克希望建设全球规模的互联网卫星网络,但其速度仍然不足以让所有人在每时每刻进行数据传输。
但问题不仅只是这样。如此大规模的持续数据传输会损坏我们的电池,但如果能对这些复杂的任务进行本地处理,那么性能和成本,尤其是隐私问题将会从根本上得到改善。当然,对服务供应商而言,这可是个不利的影响。
可穿戴式计算设备、增强现实和虚拟现实这些新兴的潮流需要先进的机器学习算法。我们在IBM和其他地方可以看到,新技术的兴起很有可能让这些算法传播得更快更远,足以实现其所有的潜能。