美国国家能源研究中心以半价提供 Nvidia A100 节点


资料图片:美国国家能源研究中心

据微软 HPC 存储专家Glenn K. Lockwood表示,美国国家能源研究科学计算中心正在以 50% 的折扣租用 Perlmutter 超级计算机的基于 Nvidia A100 的计算 GPU 节点,直至 9 月底。 这一优惠是在全行业对人工智能训练的计算能力的需求稀缺的情况下提出的。同时,该提案仅适用于 NERSC 用户。

“现在利用您的时间有利于整个 NERSC 社区,并在全年中更均匀地分配需求,因此为了鼓励现在使用,我们将从明天开始一直到 9 月底,将在 Perlmutter GPU 节点上运行的所有作业打折 50%,” 写道 NERSC 用户参与小组负责人 Rebecca Hartman-Baker 在给 NERSC 用户的电子邮件中。“今晚午夜到 10 月 1 日午夜(太平洋时间)之间运行的任何作业(或作业的一部分)将仅收取平常费用的一半,例如,在 7 个节点上执行 3 小时的作业,这将通常会产生 21 个 GPU 节点小时的费用,现在将收取 10.5 个 GPU 节点小时的费用。”

在生成式人工智能热潮中,有数十家公司愿意租用 Nvidia 基于 GPU 的计算节点来训练他们的大型语言模型。据媒体报道,商业数据中心仍在以最大容量运行,并且 Nvidia 的计算 GPU 在未来几个季度内都已售罄。NERSC 的提供无疑是慷慨的,如果科学中心以商业方式提供其能力,可以轻松赚钱。

然而,问题是他们只将其提供给使用 Perlmutter 超级计算机进行科学研究的现有 NERSC 用户。由于这些用户正在放暑假,他们可能不会在超级计算机上运行工作负载,而且要到年底才会运行;至少有一些 GPU 节点闲置了一段时间,这就引出了一个问题:为什么该组织不用商业工作负载回填其闲置容量。

虽然使用美国政府为商业人工智能和高性能计算工作负载建造的超级计算机会带来大量资金,可用于提升美国超级计算机的实力,但这并不是像 NERSC 这样的机构所做的事情。

美国能源部的超级计算机主要用于涉及国家安全问题的事物或由预先选定的用户使用,包括那些使用这些机器进行可用于商业应用的研究的用户。因此,这些机器并不适合所有人。

(本文依据了[汤姆的硬件]的消息)