收藏本站 The Best Quality of Power Equipment

人工智能持续升温,神经网络加快器将成SoC标配

自动驾驶、无人机、智能音箱,以及智能监控等等,越来越多的运用引入了人工智能(AI),人工智能将会成为未来十年最具突破性创新的技能类别。这将促使构建人工智能的东西:深度学习,机器学习和神经网络等技能迎来开展高潮。

尽管人工智能年代一定会来临,但就现在来说,完成人工智能还有不少问题需求突破,比如功耗、带宽、功能、可靠性、安全,以及推迟等等。

现在人工智能的许多核算才能都布置在云端,未来一部分的核算才能会往设备端搬运。这是由于依靠云端的人工智能往往需求较高带宽的支撑,还需求较低的推迟。而在设备端布置人工智能核算才能则能够规避这些问题,一起还能够完成更高的安全性、更低的功耗和更高的可靠性。

走在前面的苹果现已在其A11 Bionic仿生处理器中加入了全新的神经网络引擎;华为海思的麒麟970也内置了专为深度学习而定制的神经网络单元(NPU);Intel旗下的子公司Movidius乃至还推出了一款选用USB外形的独立式人工智能加快器,它能够简略地刺进Raspberry Pi或许X86电脑,让大学研究人员、独立软件开发人员,以及人工智能爱好者简略方便地为嵌入式体系进行编译、调整,以及加快深度学习运用。
Imagination PowerVR 产品与技能营销资深总监 Chris Longstaff

图1:Imagination PowerVR 产品与技能营销资深总监 Chris Longstaff。

Imagination PowerVR 产品与技能营销资深总监 Chris Longstaff就指出,未来神经网络加快器将成为SoC的规范IP模块,就像CPU、GPU和视频编解码器一样,由于人工智能需求更高功能的硬件支撑。

为何需求神经网络加快器?
神经网络在语音、视觉、搜索、机器人、自动驾驶,以及医疗保健等范畴取得了重大进展,但许多运用仍是遭到了当时设备硬件功能的约束。要想打造更强壮的神经网络,就需求更加运算功能更好的硬件支撑,以构成很多的机器学习模型。

为此,Imagination在沉寂了一段时刻后,带来了其完好,独立式的硬件IP------PowerVR 2NX NNA神经网络加快器。据Chris Longstaff介绍,PowerVR 2NX NNA是专为神经网络算法所规划,与单纯的DSP解决计划比较,它可供给8倍的功能密度提高,能够以最低的功耗和本钱达到最高的功能。

Chris Longstaff拿无人机防撞举例说,如果没有硬件支撑,无人机的飞行速度为67米/秒时的防磕碰间隔一般需求10~15米。而如果选用了Power VR硬件NNA,则能够完成在不到1米的间隔内避开障碍物,而且能够运转多个网络,在避开磕碰的一起识别和盯梢物体。

此外,他还以从手机相片库中寻觅所需求的相片为例。Chris Longstaff表明,如果运用高端GPU或许CPU来从1000张相片中选出自己想要的相片大约需求60秒的时刻,而如果运用了他们最新的硬件加快器的话,只需求2秒钟。如果以耗费1%电量来衡量的话,运用高端GPU可完成2400张相片排序和1分20秒的的视频剖析;而运用了他们硬件加快器后,则可完成428000张相片排序和237分钟的视频剖析。

为何如此高效?
对于为何会如此高效,Chris Longstaff的解说是,PowerVR 2NX NNA是从头开始全新规划的架构,它不同于CPU,GPU架构,而是专门针对神经网络而规划的。它是一个可扩展的架构,16位支撑从128到1024MAC/clock,8位支撑256到2048MAC/clock;而且还支撑不同位长的数据类型,可支撑16、12、10、8、7、6、5、4位,这是由于一些汽车运用需求16位支撑,而另一些市场需求发挥较低精度的优势。此外,它为数据和权重供给可调精度,能以最小功率和带宽完成最大功能。

从图4中能够看到在位宽调整后,如8位调整到4位,推理吞吐量提高了60%,带宽下降了简直一半,所需功耗也下降许多,可是精度下降不到1%。

一直以来,神经网络是十分耗费带宽的,因而,内存的带宽需求跟着神经网络模型规划的添加不断在添加。这给SoC规划人员和OEM公司带来了很大的规划应战。Chris Longstaff 骄傲地声称,PowerVR 2NX能最小化外部DDR内存的带宽需求,保证体系的功能不会遭到带宽的约束。

功能体现怎么?
说了那么多,那PowerVR 2NX的功能体现怎么呢?Chris Longstaff表明,根据现在市面上的揭露信息以及Imagination的工程团队的测验,PowerVR 2NX解决计划与最接近的竞赛计划比较,可供给两倍的功能,而仅需一半带宽。

他一起着重,PowerVR 2NX对制作工艺并没有特殊要求,PowerVR 2NX计划所测验的数据是根据现在市面上干流的16nm工艺制作的PowerVR 2NX硬件得到的。

Chris Longstaff还特意提到了PowerVR 2NX与海思麒麟970和苹果A11在图片检索和图片排序方面的功能比照。根据海思给出的数据,麒麟970的图片检索才能是2000张/分钟,耗费1%的电量能够对5000张图片进行排序。

Imagination 给出的数据显现,其PowerVR 7XTP GPU的图片检索才能就现已达到了1800张/分钟,耗费1%电量可对2400张图片进行排序。而PowerVR 2NX NNA的功能得到了大幅提高,它能够在1分钟内检索30000张图片,耗费1%的电量,则可对438000张图片进行排序。

与苹果A11的神经网络引擎比较,PowerVR 2NX NNA支撑4万亿次操作/秒,功能可达苹果A11神经网络引擎的6.7倍左右。

Chris Longstaff特别着重,PowerVR 2NX是专为移动和Android而规划的。它包含硬件IP、软件和东西,可为SoC供给完好的神经网络解决计划,能有效地履行所有常见的神经网络运算层。而且,根据推理使命的运算需求,它能无须额外硬件而独立运用,也能与CPU和GPU等其它的处理器结合运用。

此外,Imagination也更新了其PowerVR GPU产品线,推出了PowerVR Series9XE和 9XM GPU,据介绍,两个新系列产品均获益于内存子体系的提高,与前代产品比较,带宽减少25%,可保证更高的处理才能能被充分发挥。9XE 和9XM 的一起新特性包含新的MMU,能支撑更大的寻址,而且供给10位YUV的规范支撑,彻底不会影响芯片面积。

相关文章

在线留言

*

*

◎欢迎您的留言,您也可以通过以下方式联系我们:

◎客户服务热线:021-51095123

◎邮箱:xin021@126.com

021-51095123
扫描二维码关注我们

扫描二维码 关注我们