自定义同意首选项

我们使用 cookie 来帮助您高效导航并执行某些功能。 您将在下面找到有关每个同意类别下的所有 cookie 的详细信息。

归类为“必要”的 cookie 存储在您的浏览器中,因为它们对于启用网站的基本功能至关重要。

我们还使用第三方 cookie,帮助我们分析您如何使用本网站、存储您的偏好并提供与您相关的内容和广告。这些 Cookie 仅在您事先同意的情况下才会存储在您的浏览器中。

您可以选择启用或禁用部分或全部这些 Cookie,但禁用其中一些可能会影响您的浏览体验。

始终活跃

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

没有可显示的 cookie。

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

没有可显示的 cookie。

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

没有可显示的 cookie。

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

没有可显示的 cookie。

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

没有可显示的 cookie。

DeepSeek-R1发布引发人工智能行业关注

DeepSeek
DeepSeek

中国AI企业DeepSeek近日宣布正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重,引发全球科技界高度关注。DeepSeek-R1在后训练阶段大规模应用了强化学习(RL)技术,即便在极少标注数据的条件下,也显著提升了推理能力。

根据测试数据,DeepSeek-R1在数学、代码和自然语言推理等任务中性能比肩OpenAI的o1正式版。在算法类代码(Codeforces)和知识测试(GPQA、MMLU)中的得分略低于o1;在工程类代码(SWE-Bench Verified)和美国数学竞赛(AIME 2024, MATH)项目上,则超越了o1。

DeepSeek-R1在训练过程中展现了“涌现行为”,例如自我反思、评估先前步骤、自发寻找替代方案等。尤其是在一次数学任务中,该模型甚至出现了类似人类的“尤里卡时刻”,主动为问题分配更多时间重新思考,表现出拟人化的反思能力。

Meta的工程师在社交平台Blind中表示,Meta的生成式AI部门正陷入恐慌,称“Llama 4在基准测试中已经落后”。英伟达高级研究科学家Jim Fan指出,DeepSeek-R1可能是首个成功展示强化学习飞轮效用的开源项目,加州大学伯克利分校教授Alex Dimakis则评价其为“向OpenAI最初使命致敬的最佳候选”。

DeepSeek-R1开源模型权重并公开完整训练细节,以开放姿态挑战闭源系统的技术优势。此外,其API服务的定价极具竞争力:输入tokens,每百万1元(缓存命中)/4元(缓存未命中);输出tokens,每百万16元,仅为OpenAI o1的3%。

DeepSeek-V3的训练成本仅为600万美元,而同类模型Meta的Llama-3405B的训练成本高达6000万美元,差距巨大。

AMD宣布将DeepSeek-V3集成至其Instinct MI300X GPU芯片产品线,试图打破英伟达与OpenAI在AI行业的主导格局。同时,市场人士分析认为,DeepSeek低成本的训练优势或将削弱对英伟达AI芯片的需求,对英伟达的战略布局构成潜在威胁。

DeepSeek是中国量化巨头幻方量化的子公司,其母公司在AI领域的深度布局为DeepSeek的发展提供了强大的底层支撑。幻方量化创始人梁文锋凭借DeepSeek的表现迅速奠定了在AI行业的地位。

梁文锋早年毕业于浙江大学信息与电子工程学专业,并于2015年创立幻方量化。2021年,幻方量化成为中国首家突破千亿规模的量化私募,被誉为“四大天王”之一。公司通过搭建“萤火”算力集群,为DeepSeek的突破奠定了坚实基础。