Arm发布Mali多媒体套件，让机器学习在入门级手机上也“跑起来” 原创

作者：高玉娴

3月6日，ARM宣布推出了包含全新的视频、显示和图像处理器的Mali多媒体套件，针对主流手机和数字电视，提升视频、图像显示等视觉体验能力，满足手游的响应速度和智能数字电视播放4K高清内容等消费需求，重点指向了相关设备中的机器学习负载。

至顶网个人商用频道 03月07日北京消息（文/高玉娴）：在人工智能狂潮再次被掀起的当下，谁掌握了计算力，谁就赢得了一个关键筹码。

为此，作为超级计算领域的“红人”，Arm在去年5月份就推出了基于DynamIQ微处理器架构的第一波处理器产品，直击人工智能所带来的计算力挑战。

该产品可以说完全颠覆了Arm Cortex系列处理器的部署方式，通过为CPU引入全新的指令集，能够在单一集群当中容纳多达8个计算核心，且各个核心皆提供不同的性能级别，帮助使用者实现对各计算核心进行混合与匹配，让处理器大小核的配置更具弹性，实现1+3或者1+7的SoC设计配置。极大的提升了处理器在人工智能方面的性能及灵活性。

这才刚刚迈入新的一年，Arm就面向“所有的IP都将支持机器学习”的机器学习战略，“马不停蹄”地在两周前正式发布了Trillium项目，目的就是打造可扩展的机器学习处理器。

据 Arm资深市场营销总监Ian Smythe介绍，在这一项目中，Arm提供了一个RNN软件框架，为开发人员提供机器学习执行位置的选择。

Arm资深市场营销总监Ian Smythe

而就在昨日，Arm又宣布推出了包含全新的视频、显示和图像处理器的Mali多媒体套件，针对主流手机和数字电视，提升视频、图像显示等视觉体验能力，满足手游的响应速度和智能数字电视播放4K高清内容等消费需求，重点指向了相关设备中的机器学习负载。

实际上，早在去年的Arm Tech Day上，Arm就已经发布了“Mali家族”中针对图形密集型移动游戏、移动VR以及手机内机器学习等高性能应用的Mali-G72图形处理单元，以作为Mali-G71的换代方案。

此次推出的IP套件中，包括了Mali-G52和Mali-G31 GPU、Mali-D51显示处理器、Mali-V52视频处理器等组件。通过与现有基于DynamIQ的CPU和其他Arm IP无缝集成，全面覆盖主流移动设备和数字电视（DTV）的相关需求。

其中，两款GPU产品Mali-G52、Mali-G31与Mali-G72一样，都是基于Arm Bifrost架构，与G72不同的是，G52的定位是中档主流移动设备，而G31针对的则是数字电视以及入门级的智能手机。

具体来看一下每一个组件都有哪些方面的提升：

相较于上一个版本Mali-G51，Mali-G52能够应对更高的图形复杂度，允许在主流系统的功率和带宽限制内实现更多的机器学习功能。通过采用更宽的执行引擎，相比前代产品的4线程，Mali-G52最多可提供8线程，可在相同芯片面积上，提供更高的图形性能，非常适用于复杂的内容处理，使得性能密度提高30%；此外，在能效方面，Mali-G52提高了15%，可降低设备的功耗和散热，并支持更长的游戏时间，甚至可支持AR等高耗电技术；同时，为了更好地支持机器学习，其中添加了一些具体指令，使其机器学习性能为上一代产品的3.6倍，这确保了所有级别的设备都可支持下一代机器学习应用。

重点说一下Mali-G31。随着如今所有级别的设备对计算需求的大幅增加，用户甚至期望中档级别的设备也可提供高品质的内容，这为数字电视用户界面领域带来了不少挑战。Mali-G31就是在这一需求下的产物。

该产品是Arm 基于Bifrost架构的G30系列家族中的第一款GPU，主要是针对可能低端配置的智能手机和数字电视。相较于Mali-G51，它的总硅面积降低了20%，在性能密度上却有20%的提高，同时在UI的性能方面有12%的提升。

“我们可以把它视作在全球开发人员环境中带来了最小可能尺寸的全新API，也就是说通过Arm尺寸最小的GPU就能够去支持全球最为先进的图形API。”Ian Smythe表示。

Arm产品营销总监 Anand Patel介绍，虽然是Arm家族中最小的处理器，但G30却能够支持OpenGL ES 3.2和最新一代Vulkan API，开发人员可将其应用于数百万设备上。

Arm产品营销总监 Anand Patel

“此外，在可配置性方面，使用者可以自由选择一个或者两个执行引擎，显示时钟也可以配置成每个一个像素或两个像素。”他补充说。

另外，Arm也希望在视频解决方案中实现高端能力的下放。

在显示方面，此次发布的是Mali-D51显示处理器。它拥有了去年推出的Mali-D71的众多优势，并将之整合至迄今为止Arm旗下最小的DPU上，是第一款基于Komeda架构构建的主流显示处理器。

与上一代相比，Mali-D51整个系统节能30%，同时，场景复杂度加倍，与Mali-D71一样支持8层图像处理能力，而在无缝、高效内容投射方面，内存访问延迟性能则提升了50%之多。

值得一提的是，在DP650的基础上，Mali-D51经过全面优化，能够与Mali多媒体套件中的其他IP无缝协作，结合Assertive Display 5技术使用，甚至可将HDR（高动态范围图像）带入主流设备；结合CoreLink MMU-600，可提升系统内存管理效率。能够在主流设备上有效实现更复杂的视觉体验。然而，得益于offload技术，系统功耗却得到了30%的节约。

Ian Smythe在发布会现场展示了打开efficient display和关上efficient displa看到的不同效果，如下图：