至顶网个人商用频道 01月14日 北京消息 这是一场数字语音助手在沙漠里展开的battle。
我不会说德语。但在拉斯维加斯凯撒宫的礼宾服务台,我与谷歌合伙经理Phillip Klimke谈天说地,而他只会说德语。
而我们的翻译呢,正是谷歌智能助理。
这是谷歌智能助理的最新技能,这家搜索巨头的数字助手软件类似于亚马逊的Alexa和苹果公司的Siri。在CES2019这个最大的舞台,谷歌为智能助理推出了翻译模式,旨在成为人们跨语种交流时的中间人。
谷歌正在凯撒宫的礼宾台、纽约市的Dream Downtown和旧金山的凯悦酒店试用这项功能。该功能将首先在内置谷歌智能助理的智能显示屏中提供。其中包括谷歌自己的Home Hub——这是一款智能家居设备,于10月份发布,其屏幕可以显示食谱和新闻更新等内容。它还将出现在谷歌合作伙伴——如联想、JBL和LG——制造的智能显示器中。
但谷歌希望最终将其引入其他设备之中,这个“其他设备”也包括智能手机。
它的工作原理是这样的:你说:“Hey,Google,做我的泰语翻译。”然后你会听到一声鸣响,然后该助理会告诉你开始说话。在你用英语说完一句话之后,你会听到另一声鸣响,然后软件会用泰语将这句话复述出来。该工具支持27种语言,包括西班牙语、捷克语、印地语和越南语。
谷歌智能助理的产品副总裁Manuel Bronstein 表示:“这是非常具有未来感的……我们的核心重点是制造一种产品,能够理解你所说的一切,能够听你说话,能够将这些意图转化为行动并帮助你实现这些目标。”
谷歌智能助理的翻译模式就像使用谷歌翻译应用程序,但它可以更加流畅地进行双向翻译,让它感觉更自然。在谷歌计划的凯撒宫礼宾服务演示期间,该工具运转正常。但是,当我们自己尝试时,遇到了一些绊脚石。有时你可能会在哔哔声中迷失方向,因为你会急于找到一个答案,没有给软件留出工作的时间。谷歌表示,他们仍在试图找出最佳的对话节奏。
我问Klimke他在拉斯维加斯做什么以及他喜欢做什么。我问他最喜欢的篮球运动员是谁。助理用德语吐出问题。他用德语回答说,他最喜欢的球员是德克.诺维茨基。
除了停顿时间的问题之外,谷歌智能助理很好地翻译了我们提出的所有问题:最近的洗手间在哪里?发生在拉斯维加斯的就真的会留在拉斯维加斯吗?我在哪里可以找到最好的猫王模仿者?你知道,这很重要。
新的翻译工具是谷歌在CES精心策划的重头戏。连续两年,这家搜索巨头都在这个展会大放异彩。
在2019年的展会上,谷歌尽情展示自己:它在CES上的展示比去年大了三倍。在拉斯维加斯会议中心的主要入口处,该公司还悬挂了一个巨大的横幅,上面写着“Hey,Google”,就好像它已经冠名了这场活动似的。谷歌还在会议厅外的停车场上设置了一个宽敞的游乐场和互动式游乐设施,以展示谷歌智能助理如何配合从电视到洗衣机在内的各种电器工作。
CES和拉斯维加斯现在是谷歌和亚马逊在智能家居霸权方面的战争前线,而谷歌仍在扮演“追赶者”的角色。
亚马逊的Echo设备由其广受欢迎的Alexa软件提供支持,占据了智能音箱行业73%的市场份额。根据Consumer Intelligence Research Partners的数据显示,谷歌的Home设备排在第二位,占24%,不过这家研究公司指出谷歌正在“大踏步前进”。
上周,亚马逊宣布已销售超过1亿台Alexa设备。谷歌不甘示弱,立刻在周一还以颜色,表示,该公司的助理于2016年首次发布以来,预计将在本月底累计售出超过10亿台设备,高于去年5月的5亿台。虽然谷歌和亚马逊之间的鸿沟似乎很大,但这些数据并没有真正告诉我们有多少人是真的想要在家里安装谷歌智能助理,因为安卓手机现在已经默认安装了该软件。
为了在智能家居设备领域取得成功,谷歌还推出了Google Assistant Connect平台,该平台可让第三方硬件制造商更轻松地将谷歌智能助理集成到他们的小工具中。现在,设备制造商将能够在其产品中使用谷歌提供的工具,这些工具可以与附近的Google Home配对。该技术充当了桥梁,将Home的智能输送给外部设备。
Bronstein表示,由于所有的计算都是由Home设备完成的,因此数据与谷歌保持一致。该公司表示,它仍在研究它将与设备制造商确定的条款。这些决定将非常重要,因为谷歌、脸书和其他硅谷公司不仅要面对自己的数据收集实践,还要确保在面对外部时保护数据安全的能力。
谷歌还强调了支持谷歌智能助理的设备的范围。它还宣布推出由联想制造的80美元的智能时钟,这是一个较小版本的Home Hub,它在床头柜上看起来显得不那么引人注目。它类似于电子商务巨头两年前推出的亚马逊Echo Spot。其他新的智能助理设备包括由Anker Roav制造的车载电话适配器,它可以插入点烟器,还有WhirlpoolKitchenAid推出的智能显示器。
Altimeter Group的分析师Brian Solis说:“他们打算利用这个展会作为多样性实力的证明……设备只会变得更加紧密地连接在一起。”
谷歌智能助理面临的最大挑战可能是让所有人停止将其与亚马逊的Alexa进行比较。这说起来容易做起来难,因为比较是有价值的:两者都可以用来控制你的恒温器或锁门。
尽管谷歌想要将家庭自动化市场据为己有,但是该公司仍然在努力吸引消费者使用谷歌智能助理,努力证明它能够做的不仅仅是告诉你当天的头条新闻。因此,谷歌倾注了自己20年来作为世界上最先进搜索引擎的经验,并且搭上了自己作为人工智能巨头的地位,以打造一款比竞争对手更聪明的智能助理。
Bronstein 表示:“一开始,会是一些基本的东西,比如‘Hey,Google,播放音乐’和‘打开这盏灯’……但正如你所看到的翻译以及以后会出现的功能那样,我认为谷歌智能助理能够处理的任务的复杂性会增加。而且它会帮助你做你以前做不到的事情。”
这些事情包括让机器人代表你拨打电话。这就是谷歌5月份用名为Duplex的新助理技术所做的事情,结果引起了和首席执行官Sundar Pichai一样多的争议。Duplex是一种令人惊叹的、逼真的人工智能,可以模仿人类的语音。该软件会使用“呃”和“嗯”这样的口头禅,并在说话时暂停,好像在考虑下一步要说什么,尽管它的反应是预先编程设定好的。
Duplex的目的是让谷歌智能助理为你预订餐厅和预约剪发。但几乎立刻,行业观察家、人工智能伦理学家和消费者都担心该软件会欺骗与之交谈的人。谷歌后来表示将披露这些电话是自动化的。
尽管Duplex仍然存在争议,但正是这些项目可以让谷歌智能助手与其竞争对手区分开来。它包括解释器模式等项目。
现场翻译工具,特别是智能手机——现在几乎每个人都随身携带,对我们彼此之间的互动方式产生了深远的影响。我在极端的情况中对其有过一手的体验。2016年,CNET曾派遣一个团队前往希腊,撰写技术对全球难民危机的影响。当叙利亚人离开家时,他们首先前往土耳其,然后前往希腊岛屿Lesvos,那里离欧洲大陆最近。
在我们访问难民营时,我们遇到了来自叙利亚、阿富汗、伊拉克、摩洛哥和其他几个地方的移民。许多人说英语,但也很多人不会说英语。当他们不会说英语时,我们在智能手机上使用谷歌翻译来回传递彼此的意思,就像一个数字说话棒。当时在雅典遇到了一位当时15岁的叙利亚男孩,并同他进行了一场难忘的对话。他只能说很少一点英语,但是通过应用助理聊天,我得知他和其他15个家庭一起乘船到达了希腊,他玩一种名叫Trex的纸牌游戏来打发时间,他喜欢唱歌。他的计划是成为下一个贾斯汀.比伯。
手机上的翻译模式有可能使体验更加自然和自由,使讨论能够更自然地进行。
那是梦想。但是,当然,这是现实。在谈到下一代翻译工作时,谷歌的现实并不总是那么好。两年前,当谷歌推出Pixel Buds无线耳机时,它还发布了一个实时翻译功能。该工具在演示中运行良好,但没有给评论者留下深刻印象。CNET编辑David Carnoy在他的评论中表示:“关于谷歌Pixel Buds的最好的事情就是它们的外壳。”
如果谷歌为手机提供翻译模式,它将不会是第一家创建翻译设备的公司。包括Dosmono和中国搜狗在内的开发商已经开始制造此类设备。但是,如果谷歌的版本可以处理现场翻译的所有细微差别,它就可以帮助大大扩展这项技术:毕竟,世界上的10部智能手机中,就将近有9部使用的是谷歌的Android软件。
谷歌智能助理产品经理Vincent Lacey 表示:“Android的规模非常有趣,因为它分布在许多人会讲多种语言的地方……你可以看到这解锁了很多机会。”
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。