logo
繁体
繁体

“百度版ChatGPT”文心一言下周发布,员工担心产品匆忙上线可能令人失望

《华尔街日报》报道,百度版ChatGPT文心一言(Ernie Bot)计划于当地时间3月16日推出,内部员工正在进行上线前的最后冲刺,很多人昼夜加班,春节也没回家。据称目前产品还停留在基本功能调试阶段,很多员工担忧,用户和市场可能会失望。

图源:百度智能云官网截图

距离百度版ChatGPT的发布还有一周时间,百度这家中国搜索引擎巨头的员工表示,他们正在争分夺秒地完成发布目标。据称百度这款聊天机器人在一些最基本的功能实现方面仍然存在一些问题。

熟悉这个项目情况的人士表示,为了开发AI聊天机器人文心一言,上百名员工一直在昼夜不停地工作。他们说,其他团队也派出了各自的员工和强大的计算机芯片。由于美国的制裁,中国公司无法继续购买这些芯片。

其中一些人说,在预定的发布日期到来之前,此聊天机器人的基础AI模型仍在进行数据训练,中国科技界十分期待此次发布。一些员工说,他们还没有足够的时间来建成一个运作良好的产品。

知情人士透露,百度计划分阶段推出此产品,首先向有限的用户群体开放公开测试。上个月,百度计划先将文心一言嵌入搜索引擎,并于3月向公众开放。

这种匆忙的决定表明,百度在进行盘算后决定加入“赌局”,希望领先于国内竞争对手,后者已经先后推出了类似的产品计划。百度表示,它已经与400多家中国公司签署了协议,这些公司将在自己的产品和服务中使用文心一言。百度表示,作为回报,这个聊天机器人将获得不同场景的运行经验,从而提升其整体性能。

图源:百度官网截图

如果发布成功,百度可能重新回到中国最知名科技巨头行列。近年来,百度逐渐失去了投资者的青睐。然而,失败的发布可能令百度身陷与谷歌类似的尴尬境地。此前谷歌对AI产品的研发和创新比较谨慎,在已经滞后于同行的情况下匆忙发布了自有版本AI聊天机器人。遗憾的是,谷歌的巴德AI聊天机器人在演示中出现事实性错误,这导致其市值损失1000亿美元。对此百度拒绝发表评论。

无论发布结果如何,百度与中国政府的关系,以及政府对生成式AI技术的看法多少会受到一些影响。这种技术可以生产从文本到图像的多种形式内容。

知情人士透露,百度研发聊天机器人的计划得到了北京市政官员的鼓励,而公司所在地正是北京。文心一言可能成为中国首个与ChatGPT相抗衡的AI机器人。ChatGPT由位于旧金山的AI研究公司OpenAI开发。中美一直在竞相加强自己的战略技术优势。

据称,北京市政官员还提醒百度,要确保服务遵守中国法律法规和中国网络审查规则,例如对数据的收集和处理方式。

本周,中国科技部部长王志刚表示,开发ChatGPT类似产品存在困难。

他说:“踢足球都是盘带、射门,但是要做到梅西那么好也不容易。” 王志刚补充道,中国在这方面也作了很多布局,在这个领域的研究也进行了很多年,并且有一些成果,但目前要达到像OpenAI的效果可能还要拭目以待。

多年来,百度在开发大型语言模型方面投入了大量资金,这也是ChatGPT的基础技术,例如将谷歌和OpenAI的英文版本调整为中文。百度在2019年发布了第一个模型,称其为艾尼(ERNIE),而谷歌将其语言模型命名为伯特(BERT),两个都是《芝麻街》中的人物名称。

12月下旬ChatGPT名声大噪,百度首席执行官李彦宏和员工谈到这一新进展。根据《华尔街日报》浏览的一份内部记录,他说:“这个技术很厉害,但能否将它转化为人人都需要的产品?这才是最难的地方,但也是最伟大和最有影响力的一点。”

知情人士透露,1月初,百度高管要求其自然语言处理团队用艾尼模型构建类似于ChatGPT的产品。

这个项目面临挑战,从事类似ChatGPT技术的其他AI开发者也分享过这些难题。其中之一是让模型对用户要求做出更精确的反应,并教会它在多义短语或同名中区分歧义。另一个难题是让聊天机器人语言接近人类语言。

Photo by Rolf van Root on Unsplash 

第三个挑战是提高产出内容的事实准确性,这是大型语言模型的技术限制,它根据不同的词可能出现在一起的概率而不是根据信息片断把句子串起来。这种限制也使得这种模型难以通过控制避免敏感话题,这是通过审查制度的一个障碍。

据称,百度已聘请承包商来帮助审查和改进聊天机器人的答案。每个步骤都需要时间。AI研究人员说,这种包含成千上万芯片的大型模型适当训练可能需要几周或几个月的时间才能完成。

本周,百度的工程师和产品经理正抓紧改善文心一言的基本功能,如它对用户请求的响应速度以及总结搜索结果的方式。

据称开发团队人员一直在不停地工作,春节期间也在加班。他们说,这个项目已经从创建中英文双语聊天机器人缩减到一个主要关注中文对话的项目。

内部人士透露,文心一言的研发由百度技术主管王海峰监督,主要由技术开发部(包括自然语言处理团队)和移动生态系统业务组负责推进。百度AI云部门也会提供云计算方面的支持。

为了加速这一进程,高管们汇集了更多资源。据称,春节假期过后,李彦宏要求整个公司的AI研究团队(包括自动驾驶部)将其最强大的计算机芯片英伟达A100s借给文心一言开发组。美国去年年底实施的芯片制裁,禁止中国公司继续购买A100s。

据称别的部门的员工也被拉来帮忙,主要负责清理训练数据,如过滤掉低质量内容。百度还聘请了外部团队进行数据清理。

时间的紧迫使一些员工对文心一言能否满足用户及市场的期望感到不安。一些员工说,由于这种担忧,他们在推出产品前就卖掉了一些公司持股。