至顶网个人商用频道 01月10日 拉斯维加斯报道:已经连续三年出征CES的地平线,今年携携其高性能、低功耗、低延时的最新嵌入式人工智能产品成果亮相:
CES创新奖的地平线Matrix自动驾驶计算平台,和基于该平台的两款最新自动驾驶解决方案——地平线NavNet众包高精地图采集与定位方案(下文简称NavNet),以及地平线激光雷达感知方案。
同时,还有面向AIoT技术将广泛应用的智慧城市与智慧零售场景的地平线XForce边缘AI计算平台(下文简称XForce),以及基于该平台的数款解决方案。
地平线早在2015年创立之初起,就将算法集成在高性能、低功耗、低成本的嵌入式人工智能处理器及软硬一体平台上。如今,软硬结合已经成为全球人工智能领域的重要趋势之一,这使得地平线具备明显的边缘计算技术先发优势。而为满足自动驾驶与AIoT边缘计算应用级需求,地平线在过去一年里成功将技术先发优势转化为独特产品路径,开发出Matrix与XForce两款软硬结合AI计算平台,并衍生出多个基于这两款平台的应用级解决方案,赋能智能驾驶、智慧城市、智慧零售等场景。
其中,此次CES展出的地平线Matrix自动驾驶计算平台在性能上相较于获奖版本又有了进一步提升。该平台基于地平线BPU2.0处理器架构(伯努利架构),能够为L3和L4级别的自动驾驶提供高性能的感知系统,目前已向世界顶级自动驾驶厂商大规模供货。
作为成功实现大规模商业化应用的自动驾驶计算平台,Matrix利用地平线AI加速IP最大化了嵌入式AI计算性能,可支持激光雷达、毫米波雷达的接入和多传感器融合。以视觉感知能力为例,该平台能够基于稀疏化和定点化神经网络实现8类不同类型物体的目标检测和多达25类像素级语义分割,同时结合有助于预测和深度估计的三维车辆检测,能够更好地理解复杂场景,可轻松应对高度遮挡,且需快速响应场景下的自动驾驶挑战。
而在保证高性能的前提下,其可在31W的低功耗下运行,无需水冷系统,满足了高性能和低功耗的行业应用级需求,非常适合嵌入式自动驾驶的应用和产品化。同时,依托地平线自主研发的工具链,开发者可以基于Matrix平台部署神经网络模型,实现开发、验证、优化和部署。
依托Matrix的边缘计算能力,地平线开发出NavNet众包高精地图采集与定位方案(以下简称NavNet),以及地平线激光雷达感知方案。
这些方案在本届CES上均是首次公开亮相,并搭载到实车,为试乘观众现场展示NavNet仅通过单目摄像头视觉感知即可在车端实现的强大地图采集与实时建图能力,以及激光雷达感知方案的多线360度激光雷达点云3D检测能力。两款解决方案在展会首日就获得大量媒体与观众瞩目。
地平线NavNet是地平线基于Matrix开发的众包高精地图采集与定位解决方案。该方案将点云建图过程全部在边缘进行,输出建立好的局部三维地图,进而用以与已有高精地图进行匹配获取定位,同时可在无地图区域进行自动建图。当前,地平线NavNet针对众包场景,利用深度学习和SLAM技术进行道路场景的语义三维重建,支持16大类地图元素的重建、识别、矢量化。并且在仅使用单目摄像头的情况下,便能够实现重建结果与全局地图的匹配定位和众包建图,并根据实时重建的局部地图与云端高精地图进行关联优化,持续提升高精地图的质量。
而地平线Matrix激光雷达感知方案采用全卷积深度神经网络对栅格化后的点云特征,进行车辆,行人等障碍物的实时检测,具备高性能,低时延,低功耗的特点,且可基于地平线工具链进行自主开发。
除上述两项全新方案外,同样基于Matrix平台的地平线Matrix前向视觉感知方案、地平线360度视觉感知方案, 以及基于地平线征程处理器的地平线红外热成像避障方案等也在本次CES上展出。
地平线的技术先发优势与独特的软硬一体产品路径,也体现在面向AIoT应用场景的产品与解决方案中。
2018年10月,地平线正式发布XForce边缘AI计算平台。该平台通过算法与处理器深度结合的软硬件联合优化,在功耗、性能、成本上相比目前的其他AI计算平台具有明显优势。其内置深度学习感知算法以及相应的model zoo,形成软硬件一体的AI感知平台。
而本届CES,地平线推出了面向服务器市场的XForce_P(Professional)和面向PC形态市场的XForce_E(Express)两款结构化FPGA边缘计算平台产品,以满足不同的边缘计算需求。如:智慧城市场景中的人脸和人体抓拍识别、人体行为分析、视频结构化,智慧商业中的客流统计、自动建档、人员动线、场景热力图、顾客行为分析等。
本届CES,地平线展出了基于XForce计算平台的密集人群时空结构化方案、跨镜多目标轨迹动线方案以及安防视频结构化方案等多个嵌入式人工智能解决方案。
地平线密集人群时空结构化方案可以在极低的功耗下实现大规模人脸和人体的抓拍识别、人体行为分析、视频结构化等。地平线跨镜多目标轨迹动线方案融合业界领先的人体检测、人体Skeleton、人体单例分割、单目标跟踪、人体ReID及多目标跟踪等视觉感知技术,能够实现对多目标、跨区域的跟踪。地平线安防视频结构化方案对视频每一帧中的行人、机动车、非机动车等信息进行检测、跟踪、抓取和识别,将非结构化数据结构化,以进行视频数据的存储、分析及后续应用。
地平线基于XForce打造的系列解决方案可应用于商业、城市安全、交通等多个场景,如商业中的客流统计、自动建档、消费者动线、场景热力图、消费者行为分析等;在交通、城市安全等多类城市公共场景中也可以实现高效率的人脸、人头、人体检测,以及多人的人体骨骼点和单例分割。结合“端+云”,则更可实现商业场景中的智能化识别、管理、服务;以及城市安全、交通等场景下的人脸管控、人员分析,车辆分析等,从而实现各类事件的及时发现,甚至是事先预测。
在智能驾驶领域,地平线与全球四大汽车市场顶级Tier1s和OEMs保持着稳定的合作关系,生态合作伙伴包括奥迪、博世、长安、比亚迪、上汽等。地平线智慧城市解决方案已助力多个国家级开发区智慧城市建设。地平线智慧零售解决方案合作企业包括韩国SK电讯(SK Telecom)、百丽国际、永辉超市、龙湖地产、建投书局、Kappa等。此外,地平线还与全志科技合作推出应用级解决方案,并与多家智能摄像头厂商达成合作,以其边缘计算能力助力合作伙伴产品的智能化升级。
好文章,需要你的鼓励
AI技术的最新应用展示了其在日常办公场景中的强大能力。用户现在可以通过简单的截图操作,让AI智能识别和提取图像中的时间、地点、事件等关键信息,并自动创建相应的日历事件。这种功能大大简化了日程管理流程,提高了工作效率,代表了AI技术在实用性和智能化方面的重要突破。
耶鲁大学团队首创AI论文审稿基准测试系统LIMITGEN,通过人工植入缺陷和真实审稿数据两套测试集,系统评估大语言模型识别科学论文局限性的能力。结果显示AI审稿准确率约52%,远低于人类专家的86%,但检索增强技术和多智能体协作显著提升了性能,为AI辅助学术评议提供了新思路。
最新调查显示,91%的AI用户都有首选的聊天机器人工具。其中ChatGPT以28%的占比位居榜首,其次是谷歌Gemini(23%)、Meta AI和亚马逊Alexa(各18%)、苹果Siri(16%)。用户主要将这些AI工具用于撰写邮件、研究感兴趣话题和管理待办事项。报告指出,61%的美国人在过去半年内使用过AI,19%的人每天都在使用。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。