2019年6月26日,世界移动大会-上海, N2.B85展位,世界著名的音频及媒体技术研究机构Fraunhofer IIS展示了MPEG-H音频实时流媒体端到端解决方案。用户能够在Fraunhofer展位(N2.B85)上体验下一代音频技术带来的沉浸式和互动式音频。
随着互联网技术的飞速发展,IPTV和OTT用户规模持续增长。IPTV在2017年跻身成为全国第二大电视传输通路,OTT在2018年跃居全国第三大电视传输通路,拥有了4.2亿用户。除接收内容方式发生了变化,用户对于沉浸式内容的渴望也日益攀升。个性化的交互方式和沉浸式的音频体验成为了网络传输和内容供给平台争相为客户提供的热门增值服务。
MPEG-H音频系统专门为未来流媒体设备而设计,基于对象的音频系统能够带来沉浸式及互动式音频效果。凭借该技术,用户能够根据自己的喜好调节混音效果并且显著提升声音的真实性和感染力。上述功能为用户带来全新的节目内容观看体验,例如:为视障人士开辟特殊音频引导服务; 也为内容供给和网络平台创造了全新的定制盈利模式,例如:为付费用户提供额外的解说和声音效果。
2019年3月,工业和信息化部、国家广播电视总局、中央广播电视总台联合印发《超高清视频产业发展行动计划(2019-2022年)》, 明确指出三维声编解码为未来重点工作之一。为了加速三维声技术的落地与应用,Fraunhofer IIS深耕通信和消费电子产业。在国际上, 3GPP (第15版) 和虚拟现实产业论坛(VRIF)均将MPEG-H音频列为VR流媒体的唯一指定音频编解码器,而MPEG-H已于2017年在韩国UHD服务中正式商用。在国内,Fraunhofer IIS加入了中国超高清视频产业联盟,成为了中国首台8K转播试验车的技术提供方,并参与到由中国电子技术标准化研究院牵头的《电视接收设备三维声性能技术要求和测量方法》标准起草工作中。与此同时,作为中国广播电视三维声标准提案方,Fraunhofer IIS于2018年底向政府部门提交了基于MPEG-H音频的标准草案。
Fraunhofer IIS中国区业务代表Toni Fiedler先生表示:“在过去的一年里,我们在广播电视行业三维声标准工作上取得了阶段性了成果,先后与几家本土芯片企业达成了合作协议。此外,我们积极布局IPTV和OTT市场,目前正在与行业领先企业洽谈,共同探讨如何通过沉浸式及互动式三维声为用户创造更高的价值。我们期待着高质量的中国三维声能够在快速发展的4K UHD制播产业链中迅速普及。”
此外,Fraunhofer IIS还在其展位上展示了:
好文章,需要你的鼓励
Salesforce推出三大AI研究项目,包括CRMArena-Pro数字孪生平台,用于在部署前对AI智能体进行压力测试。该举措旨在解决企业AI实施中的关键问题:95%的生成式AI试点项目未能投入生产。新平台在真实业务环境中评估智能体,涵盖客户服务升级、销售预测等复杂场景。同时发布的还有CRM智能体基准测试工具,从准确性、成本、速度、安全性和环境可持续性五个维度评估AI智能体。此外,账户匹配功能利用精调语言模型自动识别重复记录。
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。