小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

姿妮 • 2025年11月11日 02:59 • 科技世界 • 阅读 41

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在...

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

2025年以前，AI界盛行着一种信念：只有闭源、巨额投入和疯狂堆算力才能打造最强大的模型。

OpenAI作为这一思路的旗手，不仅将模型训练秘而不宣，更与合作伙伴绘制了高达1.4万亿美元的基础设施蓝图。

八年内烧掉1.4万亿美元来构建数据中心，被视作确保领先的唯一途径。

在这种思维下，OpenAI旗舰模型的研发成本节节攀升：据报道，训练GPT-4就花费了约1亿美元。

闭源+重资本模式一度令人信服，OpenAI因此获得了天价估值和汹涌资本支持。

然而，这一「用钱砸出智能」的神话，正随着一系列意料之外的挑战而动摇。

信念的第一次动摇，DeepSeek-R1横空出世

今年年初，一家彼时名不见经传的中国初创公司深度求索掀起了巨浪。

它发布的DeepSeek-R1模型不仅开源，而且号称性能可与OpenAI顶级模型比肩。

更令人瞠目的是，DeepSeek宣称训练这款模型只花了约560万美元，连旧金山一套像样的房子都买不起。

这个成本数字相比业内普遍认为的「烧钱」级别相差悬殊，仅为Meta开发Llama模型成本的约十分之一。

事实证明，这并非夸夸其谈。

DeepSeek-R1发布后一周内，DeepSeek App下载量迅猛攀升，一举超越ChatGPT，登顶美国苹果App Store免费榜。

一款开源AI应用在美国用户中的受欢迎程度超过了OpenAI的王牌产品，这一幕令业界震惊。

DeepSeek以微薄成本实现高性能，直接质疑了开发AI必须投入天量资金和算力的传统观念。

华尔街对此反应剧烈，微软和谷歌股价应声下挫，而AI芯片巨头英伟达的市值甚至蒸发了约17%，相当于约6000亿美元。

资本市场用脚投票，开始重新审视AI赛道的投入产出模型：烧钱打造封闭模型的路线，或许并非高枕无忧的康庄大道。

开源低成本路线的核弹，Kimi K2 Thinking震撼登场

DeepSeek年初点燃的星星之火尚未平息，中国另一家初创公司月之暗面在年末投下了一枚震撼弹。

本周，月之暗面发布了最新的开源巨模型Kimi K2 Thinking（以下简称K2 Thinking），以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5。

要知道，GPT-5可是闭源巨头最先进的成果之一，而K2 Thinking仅用几百万美元训练，却在高难度推理和编码测试上正面较量并拔得头筹。

K2 Thinking在综合编程挑战「SWE-Bench Verified」上取得了71.3%的通过率，略高于GPT-5的成绩，甚至在复杂网页搜索推理任务BrowseComp上，以60.2%对54.9%的得分大幅领先GPT-5。

这些数字宣示了一个历史拐点：开源模型与顶级闭源模型之间性能鸿沟的实质性塌陷。

K2 Thinking的问世标志着开源免费模型在高端推理和编码能力上与封闭系统平起平坐，这一点在过去几乎难以想象。

而实现这一壮举，月之暗面投入的算力成本据传约为460万美元，比起OpenAI宏图中的万亿投入，几乎可忽略不计。

一边是几百万美元造就的开放奇迹，另一边是幻想烧钱万亿的巨无霸帝国，鲜明对比令人不禁怀疑：AI行业过去坚持的大投入逻辑，难道真的站不住脚了？

技术路径的胜利，巧用架构胜过砸钱堆料

K2 Thinking并非魔法横空出世，而是技术路线差异带来的成本逆袭。

传统的GPT-5这类闭源模型采用的是「通用大脑」式架构，每个参数对每个输入都会发动运算，因而模型越大推理开销越惊人。

K2 Thinking则采用混合专家架构，将庞大模型划分为384个专长各异的专家模块。

每次仅有8个专家（外加1个通用专家）被激活参与计算，相当于只动用320亿参数来解决特定问题。

换言之，K2-Thinking拥有一个「万智百宝箱」，每个token只调用其中不到3.5%的智力，却能享受近似万亿参数的知识储备。

这一架构设计让K2 Thinking在推理时既聪明又节省：「大而不笨重」。

架构优化带来的成本效率提升达百倍之多，令人叹为观止。

更关键的是，月之暗面研发了名为「MuonClip」的自定义优化器，在训练过程中自动稳压梯度，成功杜绝了超大模型常见的梯度爆炸和损失发散问题。

Kimi-K2在长达15.5万亿token的训练中实现了「零训练崩溃」，无需人为中途干预重启，这意味着即使资金设备相对有限的团队也能可靠地训练超大模型。

DeepSeek也在工程上强调「强化学习后训练」等高效策略，使得小团队得以攀登AI高峰。

这些技术路径上的创新，等于是用聪明才智破解了过去只有砸钱才能解决的难题。

曾经只有巨头烧钱才能铺就的康庄大道，如今民间高手另辟蹊径，用技术巧思抄了近路。

开源风暴的经济学冲击

当技术壁垒被攻克，开源路线在经济层面的优势便愈发凸显。

K2 Thinking的模型权重可在相应许可证条款下自由下载部署。

这与OpenAI等闭源模式形成鲜明对比，它们的模型被封藏于云端，只能通过昂贵API租用它们的大脑。

以K2 Thinking为例，其官方提供的API价格是每百万输入token收费4元（命中缓存时更低至1元）、输出token16元。

相比之下，OpenAI的GPT-5 API价格约为每百万输入token收1.25美元（约9元），输出token高达10美元（约71元）。

换算下来，同样百万token的处理，K2 Thinking的费用仅为GPT-5的十分之一不到。

对开发者和企业而言，这无疑极具诱惑力，更何况K2完全可以本地部署，不愿付API费的话，大可以自建服务。

正因如此，我们已看到市场正在迅速响应：越来越多AI工具和平台开始集成K2 Thinking模型，许多开发者在社区分享如何用K2 Thinking微调自定义应用。

DeepSeek-R1发布后，其MIT开源权重更是被无数开源社区下载、魔改，用于各种插件和研究项目。

甚至政府机构和大型企业也开始重新考虑，与其斥资购买封闭模型的算力配额，不如采用开源模型作为基础，掌控自主可控的AI能力——尤其当这些开源模型已经足够好且成本低廉。

这种用脚投票的风向转变，不仅出现在技术圈，更在资本圈引发连锁反应：OpenAI此前天价的数据中心投资承诺，正面对质疑和压力。

OpenAI高管甚至在公共场合暗示需要政府贷款支持，事后又忙不迭出来「灭火」澄清不寻求政府背书，以平息外界对其烧钱计划的担忧。

当巨头为融资「续命」四处游说时，开源对手们正用实际成绩证明，也许根本不需要那么多钱，也能把事情办成。

行业叙事的改写与泡沫的冷却

DeepSeek和Kimi K2 Thinking带来的并非单纯的「追赶」，而更像是一场对旧路线的证伪。

过去，封闭巨头们的护城河建立在一种假设之上：只有不断投入数量级增长的资金和算力，才能保持模型性能的领先。

这一假设曾让OpenAI们在资本市场上如日中天，甚至形成了某种估值泡沫，AI公司和底层芯片厂商的价值被无限推高，因为所有人相信烧钱会带来奇迹。

然而当开源挑战者以区区百万量级美元达到同类水准，这个故事的结局便不再那么线性。

事实证明，「性能领先的最后20%」或许并非大多数用户真正需要的，尤其如果为此要付出十倍乃至百倍的价格。

从普通消费者到中小企业，更青睐的是「够用+便宜」的实惠。

OpenAI等公司无疑依然握有行业顶尖的研究人才和技术积累，但他们再难宣称自己的路线是「唯一正确且必不可少」的。

行业叙事正在转向：与其痴迷于砸钱堆出更大模型，不如在架构创新和工程稳定性上下功夫，以换取成本效率和开放生态。

投资者也日趋清醒，过去见谁谈AI就砸钱的狂热减退了许多，现在更关注实际效能和商业可行性。

最危险的对手，不是那个跟你拼烧钱的人，而是那个证明根本不需要烧那么多钱的人。

参考资料

Kimi K2 Thinking 模型发布并开源，全面提升 Agent 和推理能力

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

本文来自微信公众号“新智元”，作者：艾伦，36氪经授权发布。

本文来自作者[姿妮]投稿，不代表视听号立场，如若转载，请注明出处：https://stddy.com/keji/202511-57193.html

41 4

本文作者

姿妮签约作者

409 文章

5025735 评论

1 粉丝

我是视听号的签约作者[姿妮],本篇文章《小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」》主要讲述了:2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在...

新闻资讯

28年人生错位案再上热搜！姚策确诊前离婚协议细节曝光

当“28年错换人生”案再次登上热搜时，一组姚策与熊磊的早期聊天记录引发公众关注。这场横跨两代人的家庭纠葛中，新曝光的细节正在改写事件的认知维度——在肝癌确诊前，这对年轻夫妻已签署离婚协议，而围绕房产归属的争议，更将两个家庭的伦理博弈推向新的临界点。确诊前的协议离婚真相根据已核实的聊天记录截图，20

勤浩宇
2025年06月28日
155
科技世界

3分钟学会“微信微乐棋牌有挂吗（专用辅牌神器免安装）

软件神器超神!中至麻将胡牌神器软件(怎么打会赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”中至麻将胡牌神器软件是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以

发疯的猪
2025年09月14日
72
生活经验

终于发现了“闲逸跑得快亲友圈怎么提高胜率（助赢神器通用版）

软件神器超亮眼!微乐双扣发牌有什么规律吗(怎么控制输赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐双扣发牌有什么规律吗是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需

及润宾
2025年09月19日
75
综合

实测结果“微信抢红包可以控制抢的金额吗”（详细透视教程）-今日头条

超绝软件佳作!掌中乐游戏中心开挂辅助器(怎么才能赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”掌中乐游戏中心开挂辅助器是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的

丹琴
2025年10月09日
64
百科栏目

《求是》杂志发表习近平总书记重要文章《推动落实全球发展倡议、全球安全倡议、全球文明倡议、全球治理倡议》

新华社北京10月15日电10月16日出版的第20期《求是》杂志将发表中共中央总书记、国家主席、中央军委主席习近平的重要文章《推动落实全球发展倡议、全球安全倡议、全球文明倡议、全球治理倡议》。这是习近平总书记2021年9月至2025年9月期间有关重要论述的节录。文章强调，当今世界，和平赤字、发展赤字

怀绿
2025年10月15日
60
新闻资讯

万亿美元富豪即将诞生？特斯拉薪酬方案通过，马斯克迈向新纪录

随着特斯拉重申希望这位全球首富继续领导这家电动汽车公司，马斯克的净资产有望很快突破1万亿美元大关。这一消息正式宣告：马斯克正朝着成为全球首位万亿富豪的目标稳步迈进。近日，特斯拉股东投票批准了一项新的高管薪酬方案，根据该方案，马斯克将在未来十年内获得近万亿美元的股票奖励，这对这位全球首富而言，无疑是一

寄翠
2025年11月07日
50
百科栏目

小米 17 Ultra黑科技曝光，手机摄影三大趋势已明？

近日，小米17Ultra正式入网，不出意外的话将在元旦前亮相/发布。作为超大杯机型，大家最期待的必然是小米17Ultra的影像表现，根据网友的爆料来看其将配备「可变长焦」和「可变镜头」两大黑科技。近些年几乎每一家手机厂商都在影像上下了很大功夫，但大多数都是「一代而亡」，小米17Ultra的

诗菱
2025年11月21日
42
百科栏目

玩家必备教程“微乐江西麻将修改器（助赢神器通用版）

软件神器优选!微乐广西麻将万能开挂器通用版(专用神器下载)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐广西麻将万能开挂器通用版是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器

海瑶
2025年12月09日
29
新闻资讯

美股面临“关键防线”，考验多头决心，若跌破则确认下行趋势至“明年初”

美国股市正处于一个关键的技术十字路口，多头决心面临严峻考验。据追风交易台消息，摩根大通于11月14日发布的最新技术策略报告显示，美股多个关键指数的支撑位持续承压。若这些“防线”被跌破，将确认市场进入下行趋势，调整可能持续到2026年初。其中，标普500指数正测试约6700点的第一道支撑。若此位置、6

耀火
2025年11月17日
42
综合

北京阜外医院的专家说：冬天户外运动，减肥效果最好最快

你知道吗，很多人都在努力减肥，却不知道其实冬天减脂效果还比夏天好？你肯定也听说过那些偏方、奇招，真正靠科学、长期的方法才靠谱。去年冬天，冯雪医生带领团队搞的“温度调节减肥法”出圈，帮助了超过三万胖友，随访成功率高达76%。这个方案还被国家列入基层指南，国际研究也证明它可以提高基础代谢20%

姿靓
2025年11月30日
36

发表回复

本站作者后才能评论

评论列表（4条）

姿妮 2025年11月11日

我是视听号的签约作者“姿妮”！

回复
姿妮 2025年11月11日

希望本篇文章《小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」》能对你有所帮助！

回复
姿妮 2025年11月11日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
姿妮 2025年11月11日

本文概览：2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在...

回复

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

信念的第一次动摇 ，DeepSeek-R1横空出世

开源低成本路线的核弹，Kimi K2 Thinking震撼登场

技术路径的胜利 ，巧用架构胜过砸钱堆料