logo
繁体
繁体

火爆全球的生成式AI技术,会终结Siri和Alexa的虚拟助理时代吗?

《纽约时报》报道,从Siri虚拟助理问世以来,亚马逊Alexa和谷歌助理等同类竞品一直不温不火,十几年来停留在查询天气和餐厅等基础功能。近期火爆的ChatGPT聊天机器人迅速激起用户的热情和兴奋,生成式AI技术将终结Siri开创的助手时代,还是合二为一打造出更加强大的AI助手?

2011年,在一个下雨的周二,苹果公司的高管们在旧金山的一个拥挤礼堂里揭开了iPhone 4S的面纱。这款手机看起来与前一版本相同,但有一个新功能:虚拟助理Siri。观众很快就被吸引住了。

图源:YouTube账号the unofficial AppleKeynotes channel

时任苹果公司软件主管的斯科特·福斯特尔按下iPhone的home键,召唤Siri,并向它提问。在他的要求下,Siri查看了巴黎的时间(Siri回答”现在是晚上8点16分”),它还定义了“有丝分裂”一词(它说这是指“细胞分裂时,细胞核分成含有相同数量染色体的小细胞核”),并调出了14家评价很高的希腊餐馆名单,其中5家位于加州的帕洛阿尔托。

福斯特尔说:“我已经在人工智能领域工作了很久,这还是让我感到震惊。”

那是12年前的事了。在那之后,Siri和它的AI竞争对手们再没有令人们感到震惊过,这些对手包括亚马逊Alexa和谷歌助理等。这项技术在很大程度上处于停滞状态,这些会说话的助理变成了人们讥笑的对象。2018年的“周六夜现场”小品讲述了老年人使用智能音箱的滑稽场面。

科技界现在对另一种虚拟助理赞不绝口:聊天机器人。这些AI驱动机器人可以对输入到聊天框中的问题进行敏捷地回复,如旧金山公司OpenAI的ChatGPT和新推出的ChatGPT Plus。人们已经在借助ChatGPT处理复杂任务,如编码软件、起草商业提案和写小说。

ChatGPT通过AI算法猜测人们下一句想说的话,它还在迅速改进学习中。几个月前,它还无法写出一个合格的俳句,现在它可以大段大段地输出内容。当地时间周二(3月14日),OpenAI发布了新一代AI技术:GPT-4,这将为ChatGPT提供新动力。

图源:OPENAI官网截图

围绕着聊天机器人的兴奋说明,Siri、Alexa和其他语音助手,已经在AI竞赛中告别了曾经的领先地位,它们曾经引起过人们类似的热情,而现在没什么吸引力。

在过去十年中,这些产品的研发之路遇到障碍。曾参与虚拟助理工作的前苹果工程师约翰·伯基说,Siri遇到了技术障碍,包括笨重的代码,要花几周时间才能更新基本功能。前雇员说,亚马逊和谷歌估措了语音助手的使用方式,这导致他们在技术领域的投资很少得到回报。他们说,当这些尝试失败后,这两家公司对这项技术的热情减退了。

微软首席执行官萨提亚·纳德拉本月在接受《金融时报》采访时说,语音助理“像石头一样笨”,他宣称新的AI技术将引领潮流。微软已经与OpenAI紧密合作,向这家初创公司投资130亿美元,并将其技术纳入必应搜索引擎和其他产品。

苹果拒绝对Siri发表评论。谷歌表示,它致力于提供一个极好的虚拟助理,以帮助人们在手机、家庭和汽车中使用。谷歌正在单独测试巴德聊天机器人。亚马逊表示,去年在全球范围内,Alexa的客户参与度增加了30%,它对自己打造世界级人工智能的使命感到乐观。

聊天机器人由大型语言模型提供动力,这些模型是经过训练的系统,可以根据从网上收集到的巨大数据集识别和生成文本,之后为完成句子提供词汇建议。

相比之下,Siri、Alexa和谷歌助理本质上是指令与控制系统,只能理解有限的问题和请求,如“纽约市天气如何”或“打开卧室的灯”。如果用户要求虚拟助理做一些代码之外的事情,机器人就会简单地说无法提供帮助。

伯基说,Siri的设计也很繁琐,增加新功能特别耗时,他在2014年负责改进Siri的工作。Siri的数据库包含一个巨大的单词列表,包括音乐艺术家的名字和餐馆等地点,支持近二十种语言。

他说,这使它成为“一个大雪球”,如果有人想向Siri的数据库添加一个词,“它加入的是一大堆单词”。

因此,看似简单的更新需要重建整个数据库,如向数据集添加一些新短语,伯基说这可能需要六周时间。增加更复杂的功能可能需要近一年时间,如添加新的搜索工具。他说这意味着Siri没有办法成为像ChatGPT那样的创意助手。

亚马逊和谷歌的前经理说,Alexa和谷歌助理依靠的是与Siri类似的技术,但这两家公司很难通过这些助理产生有意义的收入。相比之下,苹果公司成功地利用Siri来吸引买家购买iPhone手机。

一位参与Alexa工作的前亚马逊领导人说,亚马逊在2014年发布了由Alexa驱动的智能音箱Echo后,希望这个产品能够通过让消费者与Alexa对话完成下单操作,从而增加亚马逊网店销售额。但他补充说,人们在使用Alexa回答天气提示和设置闹钟的功能时玩得很开心,但很少有人要求Alexa订购商品。

Raysonho @ Open Grid Scheduler Scalable Grid Engine, CC0, via Wikimedia Commons

这位前高管说,亚马逊或许过度投资于新型硬件制造,比如现已停产的闹钟和微波炉,它们可以与Alexa搭配使用,现正以成本价或低于成本价销售。

除此之外,公司在创建生态系统方面的投资不足,这种系统可以让人们轻松扩展Alexa能力,就像苹果公司在其应用程序商店所做的那样,这有助于激起人们对iPhone的兴趣。虽然亚马逊提供了一个“技能”商店,让Alexa控制第三方配件,如电灯开关,但人们很难找到和设置扬声器的技能,这同从应用程序商店下载移动应用程序的流畅体验不同。

研究公司“创业策略”的消费者技术分析师卡罗琳娜·米拉内西说:“我们没有迎来为虚拟助理创建应用商店的时刻。”她曾是亚马逊的顾问。

去年年底,亚马逊的Alex部门成为公司18000人裁员计划的主要对象,Alexa的一些高层管理人员已经离开了公司。

亚马逊女发言人金莉·佩尔索说,Alexa远不止语音助手,“我们对它一如既往地乐观”。

一位曾参与谷歌助理工作的前经理说,亚马逊在Alexa方面的失误可能让谷歌误入歧途。谷歌的工程师们花了几年时间对谷歌助理进行试验,以模仿Alexa功能,还设计了配套的智能音箱和语音控制平板电脑屏幕,以控制恒温器和电灯开关等家居配件。谷歌后来在这些家居产品中整合了广告,但这并没有成为主要收入来源。

这位前经理说,随着时间的推移,谷歌意识到大多数人只将语音助手用于有限的简单任务,如启动计时器和播放音乐。2020年,当谷歌高管拉巴卡·拉加万接管谷歌助理时,他的团队将这个虚拟伴侣重新纳入安卓智能手机重要功能。

图源:谷歌官网截图

今年1月,当谷歌的母公司裁员1.2万人时,从事家用设备操作系统的团队失去了16%的工程师。

许多大型科技公司竞相回应ChatGPT。两位知情人士透露,上个月,在苹果公司在总部举行了年度人工智能峰会,这是一次内部活动,让员工了解其大型语言模型和其他人工智能工具。每周都有许多工程师在测试语言生成概念,包括Siri团队的成员。

周二,谷歌还表示,它将很快发布生成式AI工具,以帮助企业、政府和软件开发商构建带有嵌入式聊天机器人的应用程序,并将底层技术纳入其系统。

人工智能专家说,未来聊天机器人和语音助理技术将融合在一起,这意味着人们将能够用语音控制聊天机器人,而苹果、亚马逊和谷歌产品用户将可以要求虚拟助理帮助他们完成多种工作,而不只是查询天气。

Perplexity是一家提供聊天机器人搜索引擎的人工智能初创公司,其创始人阿拉温德·斯里尼瓦斯说:“这些产品在过去从未真正发挥作用,因为我们还不具备与人类对话的能力,现在我们有这个能力了。”