对标ChatGPT的文心一言发布,引发百度股价大跌

3月12日OpenAI发布多模态模型ChatGPT-4之后,北京时间3月16日百度公司宣布正式发布中文大语言模型“文心一言”,据了解该产品是中国公司推出的首款类ChatGPT的语言模型。百度创始人、董事长兼首席执行官李彦宏表示,“文心一言”的发布是响应市场的强烈需求。同时大语言模型落地将带来新型云计算、行业模型精调和应用开发三大产业机会。这次发布会百度公司通过录制的视频演示其在文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成的能力,并未对背后的文心大模型参数进行系统性介绍。为此市场信心受挫,当日百度股价开始出现下跌,跌幅一度达到9%。截至收盘,百度跌幅为6.36%,报125.1港元,总市值3458亿。

值得注意的是,在演示中由于训练数据主要基于中文,文心一言在中文理解能力上表现得较为突出。能够解释“洛阳纸贵”的含义、衍生意义,甚至基于这一成语创作藏头诗。

多模态生成功能也是发布会介绍的重点之一。用户输入文本后,应用可以即时生成文本、图片甚至视频。在现场演示中,经过多轮对话,文心一言可以生成创造性内容,并记住自己在前几轮的回复,根据回答内容生成视频。

“基于庞大的数据库,文心一言能做到‘智能涌现’。”李彦宏解释道,在多种技术的加持下,文心一言能够回答以前在训练中未曾出现过的问题。

据悉,百度的训练数据库内包含万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱,作为模型训练过程中的特有的知识增强、检索增强和对话增强技术的“材料”。

百度首席技术官王海峰指出,文心一言的研发基于百度的ERNIE及PLATO系列模型进行。训练技术上,除了前文提到的三项增强技术,还包括监督精调、人类反馈的强化学习、提示技术。

在“亲笔写就”的邀请函中,文心一言介绍道,自己的主要功能是通过人机对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

不过,目前并非所有人都能响应这一邀请。据悉,3月16日起,首批用户可以通过邀请测试码,文心一言官网体验产品,后续的体验机会将陆续开放;多模态生成中的视频生成内容也暂未所有文心一言的用户开放。针对企业用户,百度智能云开放了文心一言API接口调用服务的申请通道,将在之后开放接入。

有业内人士表示,百度公司发布会上没有实时演示,结束后并未全面开放体验,当前只是公开了一个测试版本,这些都与市场的预期有很大差距。当日百度股价下跌正是市场信心的表现。

尽管文心一言未达业内预期,李彦宏亦承认其发展远未完善,但不可否认其在引领产业变革上的重要性。

“AI市场即将迎来爆发性的需求增长。”李彦宏指出,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。

他在会上预测,大语言模型将带来三大产业机会:新型云计算、行业模型精调和应用开发。

云计算方面,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

行业模型精调方面,这类公司是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。

应用开发方面,李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。