至顶网个人商用频道 03月07日 北京消息(文/高玉娴):在人工智能狂潮再次被掀起的当下,谁掌握了计算力,谁就赢得了一个关键筹码。
为此,作为超级计算领域的“红人”,Arm在去年5月份就推出了基于DynamIQ微处理器架构的第一波处理器产品,直击人工智能所带来的计算力挑战。
该产品可以说完全颠覆了Arm Cortex系列处理器的部署方式,通过为CPU引入全新的指令集,能够在单一集群当中容纳多达8个计算核心,且各个核心皆提供不同的性能级别,帮助使用者实现对各计算核心进行混合与匹配,让处理器大小核的配置更具弹性,实现1+3或者1+7的SoC设计配置。极大的提升了处理器在人工智能方面的性能及灵活性。
这才刚刚迈入新的一年,Arm就面向“所有的IP都将支持机器学习”的机器学习战略,“马不停蹄”地在两周前正式发布了Trillium项目,目的就是打造可扩展的机器学习处理器。
据 Arm资深市场营销总监Ian Smythe介绍,在这一项目中,Arm提供了一个RNN软件框架,为开发人员提供机器学习执行位置的选择。
而就在昨日,Arm又宣布推出了包含全新的视频、显示和图像处理器的Mali多媒体套件,针对主流手机和数字电视,提升视频、图像显示等视觉体验能力,满足手游的响应速度和智能数字电视播放4K高清内容等消费需求,重点指向了相关设备中的机器学习负载。
实际上,早在去年的Arm Tech Day上,Arm就已经发布了“Mali家族”中针对图形密集型移动游戏、移动VR以及手机内机器学习等高性能应用的Mali-G72图形处理单元,以作为Mali-G71的换代方案。
此次推出的IP套件中,包括了Mali-G52和Mali-G31 GPU、Mali-D51显示处理器、Mali-V52视频处理器等组件。通过与现有基于DynamIQ的CPU和其他Arm IP无缝集成,全面覆盖主流移动设备和数字电视(DTV)的相关需求。
其中,两款GPU产品Mali-G52、Mali-G31与Mali-G72一样,都是基于Arm Bifrost架构,与G72不同的是,G52的定位是中档主流移动设备,而G31针对的则是数字电视以及入门级的智能手机。
相较于上一个版本Mali-G51,Mali-G52能够应对更高的图形复杂度,允许在主流系统的功率和带宽限制内实现更多的机器学习功能。通过采用更宽的执行引擎,相比前代产品的4线程,Mali-G52最多可提供8线程,可在相同芯片面积上,提供更高的图形性能,非常适用于复杂的内容处理,使得性能密度提高30%;此外,在能效方面,Mali-G52提高了15%,可降低设备的功耗和散热,并支持更长的游戏时间,甚至可支持AR等高耗电技术;同时,为了更好地支持机器学习,其中添加了一些具体指令,使其机器学习性能为上一代产品的3.6倍,这确保了所有级别的设备都可支持下一代机器学习应用。
重点说一下Mali-G31。随着如今所有级别的设备对计算需求的大幅增加,用户甚至期望中档级别的设备也可提供高品质的内容,这为数字电视用户界面领域带来了不少挑战。Mali-G31就是在这一需求下的产物。
该产品是Arm 基于Bifrost架构的G30系列家族中的第一款GPU,主要是针对可能低端配置的智能手机和数字电视。相较于Mali-G51,它的总硅面积降低了20%,在性能密度上却有20%的提高,同时在UI的性能方面有12%的提升。
“我们可以把它视作在全球开发人员环境中带来了最小可能尺寸的全新API,也就是说通过Arm尺寸最小的GPU就能够去支持全球最为先进的图形API。”Ian Smythe表示。
Arm产品营销总监 Anand Patel介绍,虽然是Arm家族中最小的处理器,但G30却能够支持OpenGL ES 3.2和最新一代Vulkan API,开发人员可将其应用于数百万设备上。
Arm产品营销总监 Anand Patel
“此外,在可配置性方面,使用者可以自由选择一个或者两个执行引擎,显示时钟也可以配置成每个一个像素或两个像素。”他补充说。
另外,Arm也希望在视频解决方案中实现高端能力的下放。
在显示方面,此次发布的是Mali-D51显示处理器。它拥有了去年推出的Mali-D71的众多优势,并将之整合至迄今为止Arm旗下最小的DPU上,是第一款基于Komeda架构构建的主流显示处理器。
与上一代相比,Mali-D51整个系统节能30%,同时,场景复杂度加倍,与Mali-D71一样支持8层图像处理能力,而在无缝、高效内容投射方面,内存访问延迟性能则提升了50%之多。
值得一提的是,在DP650的基础上,Mali-D51经过全面优化,能够与Mali多媒体套件中的其他IP无缝协作,结合Assertive Display 5技术使用,甚至可将HDR(高动态范围图像)带入主流设备;结合CoreLink MMU-600,可提升系统内存管理效率。能够在主流设备上有效实现更复杂的视觉体验。然而,得益于offload技术,系统功耗却得到了30%的节约。
Ian Smythe在发布会现场展示了打开efficient display和关上efficient displa看到的不同效果,如下图:
“这也就意味着对于主流的设备的显示屏而言,我们都能够实现HDR4K的画质。”
而在视频处理方面,基于多核的视频解决方案Mali-V52,解码性能是Mali-V61的两倍,上传视频质量提升了20%,芯片面积却降低了38%,能够大大满足4k内容播放的需求。
据统计,2018年全球使用的智能手机设备数量将超过10亿台。其中,大部分的智能手机都装载了Arm 的Cortex-A的处理器。此外,IDC调研显示,目前市场上90%具有人工智能的设备都是基于Arm的,2017年全球的出货基于Mali的SoC达到了12亿片。
这在很大程度上要“归功于”人工智能、机器学习给它带来的巨大市场机会,当然,也离不开Arm自身在战略层面的果敢决策与快速投入。
除此之外,据介绍,Arm的合作伙伴迄今已交付超过1,250亿枚芯片,而到2021年这一数字将达到2,000亿。
“这归因于我们一直致力于在计算行业最广泛的设备中不断创新,并提供可扩展的CPU、GPU、视频和显示处理器架构。Arm正致力于让更多主流用户感受到完美的视觉体验,今天Mali多媒体套件的发布是Arm众多努力之一。“Ian Smythe表示。
好文章,需要你的鼓励
本文揭示了AI时代CIO的七项关键行为特征,基于对多位CIO和AI专家的深度访谈。专家指出,AI精通的CIO需具备实用AI素养、战略视野和变革领导力,能将技术与业务战略对齐,建立强大数据治理基础。文章详细解析了分析型AI、生成式AI和智能体AI三大技术领域,强调数据基础的重要性,并提出CIO应从项目思维转向产品思维,通过跨职能团队实现端到端价值交付。
斯坦福大学等机构联合开发的CIFT系统首次解决了机器人"近视眼"问题,通过精确控制真实数据和合成数据的混合比例,让机器人在陌生环境中的表现提升54%以上。该系统包含多视角视频增强引擎MVAug和数据组合优化策略,能够预测数据失效的"去相干点",确保机器人学习真正重要的任务特征而非环境表象,为实用化通用机器人奠定了重要基础。
尽管苹果在AI竞赛中看似落后,但其私有云计算基础设施展现了技术优势。当行业为追赶大语言模型而降低隐私标准时,苹果坚持原则,开发出保护用户数据隐私的技术方案。谷歌最新宣布的类似实施方案验证了苹果技术路线的正确性,这可能推动其他AI实验室采用相同做法,为用户隐私带来重大胜利。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。