中国开发跨多个数据中心和GPU架构的生成式AI模型
近日,行业分析师透露,中国已经成功开发出一个跨多个数据中心的生成式人工智能(GAI)模型,这标志着该国在AI技术领域的重大突破。Moor Insights & Strategy的首席分析师Patrick Moorhead在X平台(前身为Twitter)上表示,中国是第一个实现这一壮举的国家,这项技术的复杂性在于跨不同地理位置和不同GPU架构进行AI训练的挑战。
这一技术进展对中国AI发展具有重要意义,尤其是在美国对其芯片出口施加严格限制的背景下。由于美国的制裁措施阻止了中国获得最新、最强大的芯片,中国的技术研发面临巨大挑战。尽管英伟达(Nvidia)为保持中国市场推出了性能较弱的H20 AI芯片,这些芯片在华盛顿的限制范围内,但市场传言表明这些芯片未来也可能面临禁售风险,增加了中国科技公司所处的政治不确定性。
为了应对这种不确定性,中国的研究人员一直在努力将不同品牌的GPU整合成一个训练集群。通过这种方法,他们能够将受制裁的高性能芯片(如英伟达A100)与华为Ascend 910B或Nvidia H20等性能较弱但可获得的GPU结合使用。这种技术可以帮助中国在高端GPU短缺的情况下,继续推动AI研发。然而,传统上这种跨架构组合往往伴随着效率的大幅下降。
尽管如此,中国似乎已经找到了应对这一问题的解决方案。通过这次跨多个数据中心开发单一GAI模型的成功,展示了中国研究人员为推动AI技术发展所采取的积极举措。尽管目前尚未有关于该GAI的更多详细信息,但这一成就证明了中国在美国制裁压力下依然能够保持技术创新的能力。
正如华为所言,中国将在逆境中找到继续推动AI发展的途径。这也印证了“需求是发明之母”的道理,中国的AI梦想将在挑战中不断前行。