第1个获得数学奥赛金牌的开源模型！DeepSeek新模型获网友盛赞：公开技术文件，了不起！

华发囚徒 • 2025年11月29日 03:00 • 常识科普 • 阅读 50

DeepSeek最新发布的开源数学模型，正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型，在被誉为全球最难的高中数学竞赛中达到了金牌水...

DeepSeek最新发布的开源数学模型，正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型，在被誉为全球最难的高中数学竞赛中达到了金牌水平，成为首个实现这一成就的开源模型，标志着开源人工智能在复杂推理能力上的一次重大突破。

昨日DeepSeek宣布推出其最新的数学推理模型DeepSeekMath-V2 ，该模型在模拟的2025年国际数学奥林匹克竞赛（IMO）中解决了6个问题中的5个，达到了金牌水平。

这一成就使其成为第一个在IMO级别竞赛中获得金牌的开源模型，引发了AI研究和开发者社区的高度关注。

这一表现直接对标了行业巨头。就在今年7月，谷歌DeepMind的Gemini高级版本和一个来自OpenAI的实验性推理模型也达到了IMO 2025的金牌标准，同样解决了5个问题，它们是首批达到该水平的人工智能模型。

然而，与谷歌和OpenAI的闭源实验模型不同，DeepSeekMath-V2的模型权重根据Apache 2.0许可证公开发布，可供公众下载。

值得一提的是，DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”（verifier），其任务是评估证明过程的质量，而不是最终答案的对错。

而且为了防止模型过度拟合其自身的检查机制，DeepSeek通过增加计算量和自动标记难以验证的证明，来不断提升验证过程的难度，确保验证器与生成器同步进化。

此举被视为人工智能民主化的重要一步。该模型的发布不仅证明了开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室，也可能再次引发了市场对于开源模型是否会侵蚀闭源产品商业护城河的讨论——这一话题曾一度动摇投资者对英伟达等AI巨头的信心。

第1个获得数学奥赛金牌的开源模型！DeepSeek新模型获网友盛赞：公开技术文件，了不起！

跻身顶尖行列：与OpenAI和谷歌同台竞技

DeepSeekMath-V2的卓越表现，标志着其在复杂的数学推理领域，与全球领先的AI实验室站在了同一起跑线上。国际数学奥林匹克竞赛（IMO）通常被认为是全球难度最高的高中生数学竞赛，在2025年的竞赛中，630名人类参赛者中仅有72人获得金牌。

除了在IMO 2025取得的成就，该模型还在其他高难度数学竞赛中展现了顶级水平。据DeepSeek称，它在中国最顶尖的全国性竞赛——中国数学奥林匹克（CMO）中也达到了金牌水平。

在面向大学本科生的普特南数学竞赛（Putnam 2024）中，该模型在12道题中完全解决了11道，另一道题也仅有微小错误，最终得分118/120 ，超过了人类参赛者90分的最高分记录。

开源的里程碑：社区盛赞“了不起的发布”

与谷歌和OpenAI尚未公开的实验模型相比，DeepSeekMath-V2的核心吸引力在于其彻底的开放性。该模型的权重已在开源社区Hugging Face上发布，允许研究人员和开发者自由下载。

Hugging Face的联合创始人兼首席执行官Clement Delangue在社交平台X上盛赞道：“想象一下，你可以免费拥有世界上最优秀数学家之一的大脑。”

他补充说，“据我所知，此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。 ”他强调，用户可以不受限制地探索、微调、优化模型，并运行在自己的硬件上，“没有任何公司或政府可以收回它。这是人工智能和知识民主化的最佳体现。”

另一位网友elie也评论称：“DeepSeek Math V2是第一个在IMO上达到金牌水平的开源模型吗？而且我们还得到了技术报告，这真是一次了不起的发布。”

还有网友评论称，他们喜欢 5-7 个想法，每个想法都相对简单，不断堆叠，结果出乎意料地越来越好，看起来更像工程而不是研究。

自我验证框架：超越答案，关注推理过程

DeepSeek在技术报告中指出，近期的人工智能模型虽然擅长在数学基准测试中获得正确答案，但往往缺乏严谨的推理过程。报告写道：“许多像定理证明这样的数学任务，需要严谨的逐步推导，而非仅仅一个数值答案。”

为了解决这一问题，DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”（verifier），其任务是评估证明过程的质量，而不是最终答案的对错。随后，这个验证器被用作奖励模型，来引导一个独立的“证明生成器”（proof-generator）。只有当生成器成功识别并修复自身证明中的错误时，它才会获得奖励。

这种机制激励模型在最终确定答案之前，尽可能多地发现和解决自身推理链条中的问题。DeepSeek强调，“对于没有已知解决方案的开放性问题，自我验证在扩展测试时计算（test-time compute）方面尤为重要。”测试时计算指的是在推理阶段分配大量计算资源，让模型有更长时间进行推理、探索多种解决方案并完善答案。

动态进化系统：破解“自我过度拟合 ”难题

为了防止模型过度拟合其自身的检查机制——即只学会欺骗自己的验证器——DeepSeek采用了一种动态进化的策略。该团队通过增加计算量和自动标记难以验证的证明，来不断提升验证过程的难度，确保验证器与生成器同步进化。

DeepSeek在技术文件中解释，这种方法允许他们“扩展验证计算，以自动标记新的、难以验证的证明，从而创造新的训练数据来进一步改进验证器。”通过这种验证-生成闭环和元验证机制，模型能够实现全自动化的数据标注和持续的性能优化，验证了自驱动学习系统在解决复杂数学推理任务上的可行性。

⭐星标华尔街见闻，好内容不错过⭐本文不构成个人投资建议，不代表观点，市场有风险，投资需谨慎，请独立判断和决策。

本文来自作者[华发囚徒]投稿，不代表视听号立场，如若转载，请注明出处：https://stddy.com/cskp/202511-60768.html

50 4

本文作者

华发囚徒签约作者

489 文章

6080026 评论

1 粉丝

我是视听号的签约作者[华发囚徒],本篇文章《第1个获得数学奥赛金牌的开源模型！DeepSeek新模型获网友盛赞：公开技术文件，了不起！》主要讲述了:DeepSeek最新发布的开源数学模型，正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型，在被誉为全球最难的高中数学竞赛中达到了金牌水...

新闻资讯

大爆发！曼谷万人拉国旗集会

泰国头条新闻社讯6月28日，泰国多股政治力量在曼谷胜利纪念碑举行以“守护泰国主权”为主题的大型集会。参加集会的包括“人民民主联盟”（黄衫军）成员、“人民民主改革委员会”、“反独裁民主联盟”、部分“红衫军”成员，以及学者、艺术家和演员等社会各界人士。活动现场，核心领导人轮番登台发言，呼吁罢免总理佩通

江南沐雨
2025年06月29日
197
游戏攻略

中美正式签署谅解备忘录，美要求中国先交付稀土，美国才取消反制

中美正式签署谅解备忘录，美要求中国先交付稀土，美国才取消反制最近国际上的大消息是一个接一个，这边中东的乱局还没解开，那边泰国和柬埔寨也是局势紧张，一副要动手的样子，就在前几天，中美关税战也传来了新的消息。日前，特朗普突然宣布，他们已经正式和中国签订了“贸易协定”，随后美国商务部长卢特尼克也表示，两国

礼子晨
2025年06月30日
137
游戏攻略

微乐广西麻将输赢机制(揭秘小程序提高胜率).微乐广西麻将破解器？

微乐广西麻将停服是什么回事?〖壹〗、亲你好，根据您的问题描述，为您提供以下内容：微乐家乡麻将登录不了是版本升级了，后台进行维护。建议过后卸载了，重新下载新版本。〖贰〗、微信小程序，微乐广西麻将进不去怎么办？微信小程序微乐吗？广西麻将进不去了，你可以刷新一下退出来重新进入就可以了。〖叁〗、每个月1号

妙白
2025年08月10日
161
生活经验

教程辅助“微乐山西麻将助赢神器可试用（专用辅牌神器免安装）

这软件超厉害啦!微信小程序打麻将辅助开挂(小程序怎么才会赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序打麻将辅助开挂是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，

亦天
2025年09月04日
107
生活经验

终于发现了“微乐吉林麻将插件（助赢神器通用版）

这神器太绝了!心悦游戏辅助器(有输赢规律吗)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”心悦游戏辅助器是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加微下载使

野芳宁
2025年09月14日
87
知识分享

实测辅助“微乐福建麻将怎么样有好牌（专用辅牌神器免安装）

软件神器称王!福州开心麻将插件(专用神器)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”福州开心麻将插件是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加微下载使

竞兮mm丶
2025年09月15日
87
作者专栏

眼看中国不肯松口，美议员要求特朗普警告中方：若北京不答应美国的要求，就不准中国做一件事

最近，美国国会众议院中国问题特别委员会主席约翰·穆勒纳尔提出了一个令人震惊的提议，要求特朗普政府对中国施压，采取一项极具争议的手段——若中国不向美国提供稀土，就禁止中国航空公司在美国及其盟国的航线上降落。这一提议在美国引起了极大的讨论，究竟这会不会成为特朗普政府的政策，或者只是一次政治秀呢？穆勒纳尔

厍子儒
2025年09月23日
86
常识科普

玩家必看攻略“手机云扑克辅助真的假的（助赢神器通用版）

软件神器称王!小程序麻将怎样增加胜率(怎么抓到好牌)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”小程序麻将怎样增加胜率是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用

淡丽丽
2025年09月24日
88
游戏攻略

山东将实施交通事故赔偿统一标准：医疗费、误工费、护理费等超20项赔偿项目有了“硬标尺”

近日，山东省高级人民法院、省公安厅、省司法厅联合印发《山东省道路交通事故损害赔偿项目计算标准（试行）》（以下简称《标准》），明确自2026年1月1日起，全省道路交通事故损害赔偿实现保险理赔、行政调解、人民调解、司法裁判“四标统一”，医疗费、误工费、护理费等超20项赔偿项目均划定具体计算方法与证据审查

山蝶
2025年12月24日
36
作者专栏

玩家实测“程序麻将机检测仪（专用辅牌神器免安装）

速来试试神器!八闽十三水开挂辅助器(怎么能调好牌)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”八闽十三水开挂辅助器是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可

图门庆晨
2025年09月08日
97

发表回复

本站作者后才能评论

评论列表（4条）

华发囚徒 2025年11月29日

我是视听号的签约作者“华发囚徒”！

回复
华发囚徒 2025年11月29日

希望本篇文章《第1个获得数学奥赛金牌的开源模型！DeepSeek新模型获网友盛赞：公开技术文件，了不起！》能对你有所帮助！

回复
华发囚徒 2025年11月29日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
华发囚徒 2025年11月29日

本文概览：DeepSeek最新发布的开源数学模型，正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型，在被誉为全球最难的高中数学竞赛中达到了金牌水...

回复

第1个获得数学奥赛金牌的开源模型！DeepSeek新模型获网友盛赞：公开技术文件，了不起！

跻身顶尖行列：与OpenAI和谷歌同台竞技

开源的里程碑：社区盛赞“了不起的发布”

自我验证框架：超越答案，关注推理过程

动态进化系统：破解“自我过度拟合 ”难题