人工智能初创公司Cerebras发布类ChatGPT开源模型
据路透社消息,位于加利福尼亚州奥克兰的人工智能芯片初创公司Cerebras Systems周二表示,它发布了类似ChatGPT的开源模型,供研究和商业社区免费使用,以促进更多协作。
总部位于硅谷的Cerebras发布了七个模型,这些模型都在其名为Andromeda的人工智能超级计算机上进行了训练,包括较小的1.11亿参数语言模型到较大的130亿参数模型。
Cerebras创始人兼首席执行官安德鲁·费尔德曼(AndrewFeldman)表示:“关闭AI开源项目的趋势很大……这并不奇怪,因为现在有巨额资金投入其中。”“社区的兴奋,我们取得的进步,在很大程度上是因为它是如此开放。”
具有更多参数的模型能够执行更复杂的生成功能。
例如,OpenAI去年年底推出的聊天机器人ChatGPT拥有1750亿个参数,可以创作诗歌和进行研究,这有助于更广泛地吸引人们对AI的兴趣和资金。
Cerebras表示,较小的模型可以部署在手机或智能扬声器上,而较大的模型可以在PC或服务器上运行,尽管像大段落摘要这样的复杂任务需要更大的模型。
然而,Cambrian AI的芯片顾问KarlFreund表示,越大并不总是越好。
“已经发表了一些有趣的论文,表明如果你训练得更多,(一个较小的模型)可以准确,”Freund说。“所以在更大和训练有素之间需要权衡。”
费尔德曼说,他最大的模型花了一个多星期的时间来训练,而这项工作通常需要几个月的时间,这要归功于Cerebras系统的架构,其中包括一个餐盘大小的芯片,用于人工智能训练。
今天的大多数AI模型都是在NvidiaCorp的芯片上训练的,但越来越多像Cerebras这样的初创公司正试图在该市场占有一席之地。
Feldman说,在Cerebras机器上训练的模型也可以在Nvidia系统上使用,以进行进一步的训练或定制。