人工智能进入“大航海时代”-睿象云平台

人工智能进入“大航海时代”

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

人工智能进入“大航海时代”

1492年哥伦布从西班牙巴罗斯港出发，一路西行发现了美洲。葡萄牙人达伽马南下非洲，绕过好望角到达了印度。不久之后，麦哲伦用了整整三年时间，完成了人类史上第一次环球航行，开启了人类历史上的大航海时代。大航海时代的到来，拉近了人类社会各文明之间的距离，对人类社会产生了深远的影响。

基于面部识别的emoji表情

全球FPGA市场的年均增长率会达到7%（图片来自：gartner.com）

FPGA三大特点

FPGA具有很强的灵活性（图片来自：ruggedpcreview.com）

FPGA被称为大型数据中心和计算机群众的“加速多面手”也有其技术生态背景。FPGA的开发社区规模相对较小，也具有一定的门槛，但是，FPGA具备良好的存储器访问能力，并且可以非常灵活高效的处理各种不同位宽的数据类型，其有效计算力接近专用处理器的水平，FPGA还可以在线重编程成为其它非人工智能任务的硬件加速器，这也是其有别于GPU和TPU的关键因素。

自定义功能芯片

如果说在AI芯片领域各家有各家的拿手绝学，那么身为“变形金刚”FPGA的拿手绝学就是自定义功能了。作为特殊应用积体电路领域中的一种半定制电路的FPGA，既解决了全定制电路的不足，又克服了原有可编程逻辑器件门电路数有限的缺点。也就是说，尽管FPGA不是辐射范围最广的，但是一旦匹配后，输出惊人，所以也是良好的芯片选择。

不止FPGA

随着人工智能的发展，芯片的设计不仅要能够满足人工智能对计算力的需求，还要能够适应不断变化的产业需要。在不同的应用领域和不同的位置，前端还是数据中心，甚至边缘计算等应用场景。刘斌表示：一种芯片是没办法解决所有问题的。从移动设备，到服务器，再到云服务、机器学习和人工智能的加速，需要不同种类的技术支持，需要能够支持从毫瓦级到千瓦级的多种架构。

在英特尔人工智能领域，除了FPGA之外，还提供了ASIC方案下的NNP神经网络计算加速器、Movidius专注前端智能摄像头领域和Mobieye加速芯片，在无人车领域做视觉相关的物体、道路、异常情况的监测。

微处理器趋势图（图片来自NVIDIA）

随着人工智能、深度学习等技术的兴起与成熟，起初为图像渲染而生的GPU找到了新的用武之地，以GPU驱动的计算环境随处可见，从HPC到AI训练。站在数字世界、高性能计算、人工智能的交叉口，GPU悄然成为了计算机的大脑。将性能从10倍提升至100倍，GPU的加速能力远超以X86架构构建的CPU系统，将时间压缩至分钟级别，功耗也相对较低。

传统CPU计算架构难以支撑快速成长的HPC（图片来自NVIDIA）

与以往的通用算法相比，深度学习对计算性能的要求则到了另一个量级上。尽管在GPU中运行并行核心时处理的应用数量相同，但在系统中单个内核的使用效率却更高。此外，经过重写的并行函数在应用程序关键部分运行时，在GPU上跑的速度更快。

其次，英伟达也与研究机构、大学院校，以及向Facebook、YouTube这样的科技巨头合作，部署GPU服务器的数据中心。同时，还为全球数千家创业公司推出了Inception项目，除了提供技术和营销的支持，还会帮助这些公司在进入不同国家或地区的市场时，寻找潜在的投资机会。

可以说，英伟达之于GPU领域的成功除了归功于Tesla加速器、NVIDIADGX、NVIDIAHGX-2这些专属的工作站或云服务器平台，更依托于构建了完整的产业链通路，让新技术和产品有的放矢，从而形成了自己的生态圈，这也是英特尔难以去打破的。

在不久前举行的谷歌I/O2018开发者大会上，TPU3.0正式亮相。根据官方介绍，TPU3.0的计算能力最高可达100PFlops，是TPU2.0的8倍多。TPU的英文全名是TensorProcessorUnit，它是谷歌自主研发的针对深度学习加速的专用人工智能芯片。TPU是专为谷歌深度学习框架TensorFlow设计的人工智能芯片。著名的AlphaGo使用的就是TPU2.0芯片。

谷歌TPU3.0芯片

谷歌TPU架构

除了强大的性能外，谷歌在生态系统的建设上做了大量的工作。在TPU1.0和2.0的初期，谷歌并没有大规模推进其商业化，而是围绕生态做文章。这就意味着要投入巨额的成本，而且冒着极大的市场风险。当然，背后的潜在市场也是巨大的。在人工智能市场竞争激烈的形势下，吸引到更多的开发者到谷歌的生态系统中，将会比对手有更强的竞争优势。

TPU计算集群

目前谷歌正快速扩张自己的云计算业务，TPU也依托于云平台运行。通过更低的售价让人工智能开发企业抛弃GPU，转投成本更低的TPU服务，是谷歌目前正在大力发展的业务。如果TPU无法获得巨大的市场份额从而降低单颗TPU的成本，那么谷歌将很难在人工智能市场盈利。不过，TPU强劲的计算性能和集群计算阵列可以让人工智能开发企业更快的开展业务。TPU的强大，让谷歌在人工智能芯片领域已称霸一方。

上游厂商喊得再欢，落地到千人千面的行业场景中也要由解决方案商来帮忙，无论是GPU、FPGA还是TPU，最终还是要听听客户的使用感受。为此，我们采访了人工智能产品和行业解决方案提供商旷视科技。旷视科技利用自主研发的深度学习算法引擎Brain++，服务于金融安全、城市安防、手机AR、商业物联、工业机器人等五大核心行业。

如果拿汽车类比，GPU是大巴车，适合多人同目标；FPGA是小轿车，能到任何地方，但得自己会开；而TPU是火车，只能在比公路少的多的铁轨上开，但开的飞快。人工智能还在快速发展，还处于在各个行业落地的过程中。这个阶段对GPU，FPGA和TPU都有需求。

目前，旷视科技选择的是T型技术方案，即在维持一定广度的同时，深耕某些应用场景，因此在算法实际落地的过程中，自然而然地产生了从GPU/CPU到FPGA的需求。GPU主要用于训练，而FPGA能在端上能提供比GPU更好的性能功耗比。CPU则是无处不在的“默认“选择。未来，不排除采用TPU的方案来进一步提高端上的能力。