中研网

随着5G和物联网发展 AI芯片的应用和普及指日可待

ZhangHongYuan

中国数控系统行业发展全景调研与投资趋势预测研究

“不管有什么好的AI算法,要想最终得到应用,就必然要通过芯片来实现。”在2018中国半导体市场年会上,清华大学微电子所所长魏少军教授曾这样表示。

AI芯片的出现,与深度学习技术的成熟及应用密不可分。深度学习的过程可以简化理解为利用大量标注的数据进行训练,训练出一个行之有效的模型,再将这一模型运用于新数据的推理。随着5G和物联网的发展,AI芯片的应用普及也指日可待。

“从最早的人工智能的计算,不管是训练还是推理实际上都是发生在数据中心,因为深度学习需要大量的运算,只有在数据中心运用一些通用的处理器才能够提供如此巨大的计算以及提供这些计算所需要的电力的消耗。近年来,我们看到随着人工智能技术的发展,现在无论在算法方面还是在芯片方面,人工智能都达到了一个很高的水平。”英特尔中国区物联网事业部首席技术官兼首席工程师张宇说。

与传统计算模式不同,AI芯片结合了多层次的人工神经网络算法,需要通过大量的数据训练,它的发展推动芯片新一波的热潮。与此同时,也让芯片厂商重新思考一个问题:芯片需要适配不断出现的AI新算法,这让芯片研发不再仅仅是硬件工程师的“专属”,但对于算法工程师来说,想要把原来软件的功能实现到硬件上就需要面临更多挑战。这一点,要如何应对?

“深度学习网络模型是以大规模数据经过千万次的迭代而形成的结果,整个的转接过程对于我们来说是黑盒,而在这个基础上进行模型优化确实需要对算法进行更深入的了解。”科达研究院执行院长曹李军说。

在和从事人工智能应用开发的开发者交流时会发现,目前在进行人工智能开发的时候还有诸多问题有待解决。比如,开发者已经有了一个经过训练的网络模型,但是推理平台相对来说能力有限,需要把现在网络模型的一部分而不是全部下载到推理平台之上,这要如何实现。另外,现在训练的模型,如果推送到推理平台之上发现其性能不高,要如何提升?再者,深度学习、人工智能应用开发所用到的框架并不被一些架构所支持,要如何兼容?

这也是芯片厂商面临的挑战:CPU虽然能解决单次复杂问题,但无法支撑深度学习的大规模并行计算需求。GPU最初随着图像处理需求出现,处理大量数据并行运算、浮点运算的能力迎合了深度学习的需求,相比CPU处理速度更快、功耗更低,因此被最先引入深度学习,但通用和优化之间仍有差距。相比之下,FPGA被称作可编程的“万能芯片”,可以通过FPGA配置文件来定义这些门电路及存储器间的连线,从而实现特定的功能,并且可以通过配置特定的文件将FPGA转变为不同的处理器,就如一块可重复刷写的白板。虽然有可以多次更改的优势,但是在AI芯片的进展上不算快。

“有用CPU做的、GPU做的,也有用VPU做的,还有喜欢用FPGA做的,每家根据市场需求不同,都强调不同硬件架构的不同特性。在上面有特别多的编程的框架又不一样,怎么办?”英特尔中国销售总经理王稚聪给出了自己的答案,“英特尔也不可能为每一种组合都推出一个软件工具,所以OpenVINO的推出就是在最大程度上能够水平化地给客户(提供基础功能),里面又带有很多定制化的特性,能够使得在保持硬件的多样性异构计算的同时,又能够保持上面编程的多样性需求。这样使得我们开发的成本、时效性能够得到很大的提高。”

OpenVINO工具包是英特尔新近面向中国市场推出的专注于加速深度学习并将视觉数据转换为业务洞察的工具,可以方便地使用英特尔的各种硬件的加速资源,包括CPU、GPU、VPU、FPGA,这将充分帮助企业在边缘侧快速实现高性能计算机视觉与深度学习的开发。它能够支持异构处理和异步执行,这样能够减少由于系统资源等待所占用的时间。这就意味着一次编程可以通过异构的接口支撑跑在其他的硬件平台之上。

赛灵思技术销售总监朱勇告诉第一财经,这几年芯片厂商越来越关注软件工具的提供,而不仅仅是关注硬件,目的就是为了实现“更好用”的目标,“这种好用是指对软件工程师的好用,在他们熟悉的领域里能更好地对硬件进行升级。”

作为FPGA芯片的领军者,赛灵思有设置软件开发者专区和硬件开发者专区。在软件开发者专区,赛灵思和第三方的生态系统的关键开发环境和嵌入式平台提供一整套的工具、库和方法。这些环境不仅可以缩短开发时间,更轻松地定制硬件加速器,包括提供类似GPU和CPU的编程体验,面向数据中心负载加速的SDAccel,还有类似C/C++应用开发体验的SDSoC,以及将可编程性从“控制”扩展至“数据面板”的SDNet。

“就是因为这个平台里提供了好多库,让工程师觉得更好用,所以英伟达在AI芯片领域的发展才这么快。”一位业内人士告诉第一财经。他提到的就是英伟达搭建的CUDA开发平台(ComputeUnifiedDeviceArchitecture,统一计算设备架构)。这一编程模型可以在应用程序中充分利用CPU和GPU各自的优点。

留住开发者,适配更多的人工智能算法,已成为AI芯片浪潮中各家厂商的发力点。

相关阅读:AI芯片遍地开花 技术含量难辨高下

[在AI概念普及之后,各方都在寻找商业模式,期待AI技术尽快落地,但目前大部分的AI创业公司处于依靠融资烧钱阶段]

Pre-A轮融资3.4亿元人民币,一则人工智能领域神经网络解决方案公司燧原科技宣布获得融资的消息再度引起芯片行业的关注。

燧原科技今年3月成立于上海,产品是针对云端数据中心开发的深度学习高端芯片,定位于人工智能训练平台。这是腾讯首次投资国内AI芯片公司,种子轮投资方亦和资本(武岳峰资本旗下基金)、真格基金、达泰资本、云和资本继续跟投。

近年来,AI芯片无疑是最火热的话题之一,不仅英伟达、谷歌等国际巨头相继推出新产品,国内百度、阿里等也纷纷布局这一领域,诞生了寒武纪等AI芯片创业公司。在CPU、GPU等传统芯片领域与国际相差较多的情况下,中国AI芯片被寄望能实现弯道超车。

AI芯片遍地开花

从去年下半年到今年上半年,国内不少AI初创企业纷纷推出了自己的芯片。两个月前,云知声在北京召开发布会,推出其第一代UniOne物联网AI芯片及解决方案。仅仅在这两个月内,就有多家公司发布AI芯片或模组。出门问问正式发布了AI语音芯片模组“问芯”;Rokid发布KAMINO18AI语音专用芯片;思必驰也宣布将在下半年推出AI芯片……


按使用场景划分,AI芯片主要分为云端和终端芯片。而目前主流的深度学习人工神经网络算法包括训练和推断两个环节。由于训练侧需要大量数据去训练人工神经网络,因此训练主要在云端进行。云端追求高性能,开发成本更大,终端更侧重低成本和低功耗,目前中国AI初创企业主要布局在此。

云端芯片方面,寒武纪在2016年推出全球首款商用终端智能处理器IP产品后,于5月3日正式发布了首款云端智能芯片MLU100。7月,百度在AI开发者大会上正式推出了昆仑,基于百度CPU、GPU、FPGA的AI加速器研发。官方称,这是中国首款云端全功能AI芯片。

根据市场研究公司CompassIntelligence发布的全球AI芯片排行榜,除了英伟达、英特尔等传统芯片公司巨头,寒武纪、地平线等AI芯片公司也位居前列。

由于灵活性高,在AI算法并未成熟固定的当下,FPGA(现场可编辑门阵列)被认为是一种中间方案,其最大的优势在于能够使系统的硬件功能可以像软件一样通过编程修改。与GPU、CPU通用芯片相比,性能更高、能耗更低。

深鉴科技开始从赛灵思采购FPGA,将核心算法DPU放到FPGA,然后以模组的方式销售给客户,但FPGA价格相对较贵,而且与专用定制芯片ASIC相比,性能和功耗方面也有不小差距。除了FPGA方案,深鉴科技也在研发AI专用芯片,目前正在流片,该公司一相关负责人对记者表示:“如果在这个时间点,AI的初创类企业做硬件再选择FPGA,可能就有点滞后了。”

ASIC是专为特定目的而设计的芯片,效能高、功耗低,但灵活性较差,更适合AI算法成熟固定后期使用。一旦规模量产,成本也会显著降低。

云知声创始人兼CEO黄伟表示,无论是CPU还是GPU、FPGA,现有的芯片架构并非为AI专门设计,不能满足物联网AI算力需求,且考虑了太多的向后兼容性,因此在性能上远非最优。“基于业务方面对芯片产品、场景的反复验证,以及对AIoT(人工智能+物联网)终局的判断,云知声在2014年就明确必须自主研发面向物联网的AI芯片。”他称,如果云知声不做芯片,必死。对此,Rokid创始人兼CEO祝铭明也同意做语音的公司一定都会做芯片,“现在排在顶级的公司都做”。

出门问问创始人兼CEO李志飞在被问到为何要做芯片模组时表示,主要为了满足特定需求,“比如今年智能电视所谓的智能化,远场语音交互是很强的需求,但市场上没有很好的解决方案。一是贵,二是效果没有那么好,集成起来没有那么方便。”

另一AI语音公司思必驰在宣布获得D轮5亿元融资消息后,也表示将推出智能语音芯片,预计在下半年流片。

AI芯片难在何处?

芯片行业是一个高投入、高风险、慢回报的行业。多位业内人士对记者表示,芯片研发周期非常长,从立项到上市通常需要两年左右时间。作为创业企业,特别是从事算法的企业,如果自己独立研发芯片,在时间和资金方面都面临巨大压力,其中最重要的原因是芯片成本高,对错误零容忍。

与软件可以修正和快速迭代不同,芯片的迭代周期会很长。如果已经流片,纠正一个错误可能需要半年以后花几百万美元再去流一次片。“你得有非常强大的心理素质、极其严谨的工作作风,以及对任何事情宁可错杀一千,不能漏掉一个的态度去做,不仅是要一个这样的人,而且是需要一个这样的团队,才能把这个事做好。”深鉴科技芯片研发副总裁陈忠民告诉记者。

这是芯片行业本身具有的特点,但目前AI算法尚未固定,如果直接做专用芯片无疑又有新的风险。地平线智能解决方案与芯片事业部总经理张永谦对记者说,传统芯片公司在设计IP和做一个芯片之前,已经确定了目标客户,“如果你做一个很大的决定的话,要有一个头部的大客户一起合作。相当于芯片还没出来,你已经确定谁会用它,怎么用它或者对一个市场研究得很透”。但这是传统的方式,AI芯片则有所不同,他指出,“现在的AI落地还在早期,你没有办法事先就已经知道谁一定会用你,这个时候是带有一定风险的,也需要考验一定的眼光。如果你要盯着有量的市场去做AI芯片,首先这样的判断也有可能错,第二你在做出来的时候已经晚了。等你看到有量再去做,有一些预判的公司已经做出来,在那个市场里面等着了。”

杭州国芯于去年10月底发布其首颗语音AI芯片GX8010,今年初正式上市。国芯AI事业部的总经理凌苯云在接受记者采访时表示,该公司于2016年初确定布局AI芯片,而在当时该款芯片也没有明确的客户。“我们当时为什么敢做这个决策?我们认为这些算法底层的架构都基于神经网络来做。不管你的形态怎么变,那个核心不太会变。”另一方面,没有产品也很难和客户深入接触,“我们也去跟客户聊过,但是通常来说,当你还没有一个东西的时候,你跟客户去聊需求的时候,通常来说聊不到很深入。”他表示,上市半年后,目前该芯片已经有百万级的订单。

正是因为造芯不易,有AI算法企业选择与芯片公司合作一起服务客户。上述的杭州国芯此前主要从事于数字电视、家庭多媒体的芯片设计和系统方案开发。出门问问的芯片模组、Rokid的芯片都是和该公司合作,思必驰也是该公司的合作伙伴。凌苯云告诉记者,在和这些AI公司合作时,“我们出芯片,他们出算法,我们一起去推客户”。根据不同的市场场景选择不同的合作方,“我们跟Rokid的合作主要就是智能音箱,跟出门问问现在合作主要是电视、机顶盒和部分家电,跟思必驰现在合作主要也是以家电、IoT为主。因为领域不一样,算法也需要去优化。”

Rokid一芯片负责人告诉第一财经记者,双方的合作中,Rokid提架构与性能需求,国芯设计生产芯片并提供底层bsp(板级支持包),“我们负责输出基于Rokid语音服务的os整体解决方案。”

祝铭明表示,Rokid不是芯片公司,只是芯片会成为其中非常有竞争力的元素,“如果这个竞争力元素不存在,我们也不会做芯片。”他指出,今天的芯片基本都是SoC,“SoC里边有90%的东西,Rokid没有必要花精力去做各类IP。Rokid做芯片不是做以芯片为出发点。因为做行业的人都知道芯片的利润特别低。如果市面上没有,我来做;如果市面上有,我就用它。”

黄伟也表示,对云知声来说,造芯不是目的,只是起点。

行业或更趋理性

在AI概念普及之后,各方都在寻找商业模式,期待AI技术尽快落地,但目前大部分的AI创业公司处于依靠融资烧钱阶段,AI芯片也被认为是AI技术落地的一种方式,但目前而言,这条路并不容易。

有业内人士认为,AI芯片行业将迎来整合并购时期,也让大家更清楚地看清做芯片的难度。

以FPGA龙头赛灵思收购深鉴科技为例,赛灵思表示,将继续加大对深鉴科技的投入,不断推进公司从云到端应用领域部署机器学习加速的共同目标。该人士指出,深鉴科技掌握的是DPU的算法,但是芯片的链条太长,光有DPU不够,如果仅靠自己,在可见的范围内一直要不断加大芯片设计和研发费用,烧钱非常快。

陈忠民在接受第一财经记者采访时表示:“为什么芯片这么难?不是说知识有多复杂,资金投入高。更重要的原因是,从研发层面上来说,芯片与其他行业最大的差别是对于错误的零容忍性。”

他指出,现在单次流片的费用越来越高,如果使用目前最先进的7纳米工艺,流一次片就需要花费几亿人民币,因此对于错误的容忍几乎是零。就算是较为成熟的40纳米和55纳米工艺,一套光罩费用也需要上百万美元,更不用说上千万美元的设计软件。

清华大学微电子所所长魏少军曾指出,AI无疑十分重要,但AI芯片的发展很可能会在未来2~3年遭遇一个挫折期。今天的部分,甚至大部分创业者将成为这场技术变革中的“先烈”。

张永谦也对记者表示,AI芯片市场将来肯定很大,但容纳不下那么多家公司,所以肯定有些公司会死掉。“这个也很正常,任何一个新技术起来的时候,特别像AI这么大的一个底层技术崛起的时候,有泡沫很正常,2000年的互联网泡沫破灭的那个时间,很多大的互联网公司就倒闭、裁员,然后再起来。产业有周期,现在就是已经到了一个最高点了,我觉得后面一年肯定会下来,然后再回归一个理性成长。”


标签: 芯片 AI芯片

相关阅读

热点头条

精彩图文