AI代理生活全面来袭
作者:编辑部
2024-06-26
摘要:AI多模态,语音互动再进化:AI助理已拥有多模态能力,能同时解读语音、影片与程序代码,甚至支持即时翻译等任务。

电子音乐家兼YouTuber雷比莱(Marc Rebillet),在五月中的Google I/O年度开发者大会上,生动的展示了该公司在生成式AI上的最新成就。

这是个可自动提示建议、生成音轨的AI音乐工具,他形容,就像有个神奇的朋友在一边建议:“试试这个,试试那个。”

上述的“AI助理”是一种个性化的机器人,旨在帮助你更好的工作、创作或沟通。此类应用,在最近一系列AI应用新发表会上抢尽了锋头。

AI助理融入生活,趋势底定

AI助理现在已拥有“多模态”的能力,这代表它们能同时解读语音、影片、图片与程序代码,甚至还能支援即时翻译或规划家庭旅游等复杂的任务。

OpenAI技术总监穆拉蒂(Mira Murati)告诉《金融时报》:“这非常重要,因为我们正在展望人类与机器之间互动的未来。”

虽然AI助理已发展了近十年,但是新技术让它的语音互动功能变得更快、更流畅,也有更好的理解能力。

现在,科技公司之间正在进行一场新的竞争,将所谓的“AI代理”(AI agents)带进消费者的生活中。

Google的CEO皮扎伊(SundarPichai)五月中表示,这些系统可被理解成“智能系统”,它们展示了推理、规划和记忆的能力,能够提前多步“思考”,并能跨软件与系统工作,而这所有一切都是为了替你完成某项任务。

除了Google和OpenAI,苹果也被预期是这场竞赛的主要玩家。而Meta四月时,也在旗下的脸书、Instagram和WhatsApp等平台上推出AI助理的服务。与此同时,新创公司如Rabbit和Humane等,也尝试打造独立的AI助理产品,加入战局。

AI助理是AI技术推向大众关键

尽管分析师指出,上述许多发布会中所揭示的内容,更多的是概念而非真正的产品,但对于产业观察家来说,AI助理无疑将是把AI最新技术推向大众视野的关键。

“毫无疑问,这是个人化AI的时代,”微软AI(Microsoft AI)CEO苏莱曼(Mustafa Suleyman)说,“技术已成熟到,它就像一种新型黏土,我们都可以用它来发明、创新……,我们现在正在见证这件事的发生。”

近十年来,苹果的Siri、微软的Cortana以及亚马递(Amazon)的Alexa等虚拟助理,都在试图将AI带进消费市场。

如Google2016年就推出AI助理,当时皮扎伊描绘了后智能手机时代的景象,其中“智能”被嵌入音响到眼镜等各种物品中。然而,八年过去了,智能手机仍然是消费者使用网络的主要途径。

大规模采用AI助理的主要挑战是反应速度,以及在理解与执行人类指令时的出错。经营科技技术分析博客Stratechery的技术分析师汤普森(Ben Thompson)表示,要打造大家愿意使用的AI助理,最关键的是速度,因为得到即时反馈时的喜悦和趣味,和坐着干等的感觉截然不同。

他声称,自己越来越常使用Google上的AI Overview(AI摘要)功能,这并非是想刻意减少ChatGPT的使用。而是“Google比任何人都更清楚,每一毫秒都会影响人们的参与度。”

但OpenAI的旗舰机器人也毫不示弱。其GPT4o模型中的一个版本能够在即时对话中,流畅的在意大利语和英语间进行翻译,它还能展现出一种对话感。

苹果合作OpenAI展开合纵连横

而苹果正在伺机而动。日前,OpenAI宣布已经与苹果达成协议,将替Mac开发一款桌面应用程序。据闻,苹果也正在探索与OpenAI和Google的Gemini进一步合作的可能,同时聘请专家并发布研究论文。

苹果的优势是在全球拥有超过22亿台的活跃设备。知名投资银行Wedbush的分析师艾维斯(Dan Ives)预测,苹果可能会与OpenAI合作,开发下一代Siri技术,这个能执行复杂任务的虚拟助理,最终可能变成一项付费订阅服务。

而Google的优势在于,可以将AI导入从电子邮件到日程表工具等全套的应用程序里,带给消费者更好的体验。

不过,距离AI助理们要真正融入人类的日常生活,可能还需要一段时间。

AI生成的内容创作仍在起步阶段,有时候会出现错误、幻觉或虚假信息。如果AI助理要完成的是更强调准确性,而非创造力的重要任务时,这就可能是个大问题。

苏莱曼说:“扩大规模也是一个巨大的挑战。这是一个竞争异常激烈的市场……渠道和品牌的重要性不言而喻——在这方面,苹果和Google有着显著的优势。”

但是,OpenAI董事会主席暨AI新创公司Sierra的CEO泰勒(Bret Taylor)认为,“在大型科技转变中,新创公司有可能脱颖而出并取得成功,因为市场的领先者不一定存在。”

“在不久的未来,我们与虚拟世界的每一次互动都将通过某种形式的AI助理进行,”Meta首席AI科学家杨立昆(Yann LeCun)说,虽然科技巨头与其合作伙伴最有条件掌握商机,但他们需要开放自己的模型,让AI助理具备多样性,并拓展到西方国家以外的世界。


热门文章