国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

2025年这年,国产GPU算是真醒过来了,之前提起GPU,不管是玩游戏还是搞AI训练,大家脑子里基本就一个英伟达。现在不一样了,摩尔线程、沐曦股份、壁仞科技、燧原科技这“四小龙...

2025年这年 ,国产GPU算是真醒过来了 ,之前提起GPU,不管是玩游戏还是搞AI训练,大家脑子里基本就一个英伟达。现在不一样了 ,摩尔线程 、沐曦股份 、壁仞科技、燧原科技这“四小龙”,今年都陆续启动上市进程了 。华为更猛,直接亮出底牌 ,说昇腾系列GPU的规划都做到2028年了,性能还一路往上提,连黄仁勋都出来说美国AI芯片就比中国领先几纳秒 。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

说实话 ,我之前对国产GPU没抱特别大期待,总觉得跟英伟达比还差得远,但今年看下来 ,不管是咱们普通用户用的消费级产品,还是企业用的数据中心级产品,国产厂商还真拿出了能跟英伟达对标的东西。

消费级能玩3A ,数据中心靠“狼群 ”打配合

先说说消费级的 ,咱们平时玩游戏 、做设计都靠这个,摩尔线程出的MTTS90,还有砺算科技的7G106 ,测下来性能居然比英伟达RTX4060还高。我身边有个朋友专门试了用MTTS90跑《黑神话:悟空》,开高画质居然能流畅运行,这要是放在前两年 ,想都不敢想 。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

芯动科技的风华三号更全面,带了112GHBM内存,能搞8K渲染还支持硬件光锥 ,跟英伟达RTX40系列比也不落下风。更厉害的是,它单张卡就能运行72B参数的大模型,8张卡连起来还能驱动DeepSeek的满血版。本来想觉得国产GPU也就只能应付日常用 ,后来发现技术上确实在往英伟达的终端产品靠,速度比我预想的快多了 。

数据中心级的也不差,华为的昇腾910C ,在FP16精度这个标准下 ,算力能做到800TFLOPS,还带128GHBM内存,性能能到英伟达H100的八成。单张卡比不过没关系 ,华为玩起了“狼群战术”,英伟达最大的NVL72模块能装72张GPU和36个CPU,华为的昇腾384超节点直接装384张GPU和192个CPU ,用数量补了单卡的差距。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

现在国内各大算力中心里,华为 、摩尔线程、沐曦这些厂商都在往里渗透,AI大模型训练和推理这些场景 ,国产GPU的出货量已经不少了 。之前去参观过一个算力中心,工作人员说现在不少训练任务都开始用国产卡了,不是非要依赖英伟达不可。

虽说国产GPU现在拿出了能对标英伟达的产品 ,但老实讲,真要马上追上还没那么容易,人家手里握着几道不好跨的坎。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

想追平英伟达?这三道坎得慢慢迈

第一道坎就是生态体系 ,英伟达的CUDA平台搞了20年 ,配套的库和工具得有好几万种,还跟TensorFlow 、PyTorch这些主流AI框架绑得特别紧 。开发者用了这么多年,早就习惯了 ,上手快还稳定。

国产这边呢,华为有自己的CNN框架,但主流软件的成熟度和易用性还差点儿意思 ,得接着优化。其他厂商大多选了“兼容CUDA”的路子,可这不是直接用人家的代码,那样会侵权 ,只是在API接口和编译器层面兼容,让开发者不用学新规则 。但函数内部怎么运行,还得自己写代码 。生态这东西特别怪 ,得大规模部署才能攒经验,可没经验又没人敢大规模用,这循环绕不开。我问过一个做AI开发的朋友 ,他说现在写代码还是优先考虑CUDA ,不是不想用国产的,主要是怕踩坑,效率低。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

第二道坎是工艺节点 ,英伟达现在都用4纳米工艺了,晶体管密度差不多是国产GPU的两倍 。晶体管密度越高,功耗越低、性能越强 ,这直接影响GPU的算力上限。

现在国产GPU主要还在用7纳米工艺,想跟上就得往5纳米 、3纳米走,虽说5纳米技术咱们有了 ,但产线优先给手机、电脑的SoC用,GPU根本排不上号。这么算下来,工艺上至少落后一到两代 。好在现在高端GPU能搞多die封装 ,比如英伟达B200就是两个die拼的,国产厂商也学着用2个、4个甚至8个die封装,多少能抵消点工艺落后的劣势。但这毕竟是“曲线救国” ,不是从根本上解决问题。

国产GPU的“追平路径”:市场	、政策与技术迭代的三重助力

第三道坎是供应链 ,英伟达能在全球挑最好的供应商,HBM内存都用到HBM3E了,HBM4都开始送样测试了 。国产GPU受半导体管制影响 ,主要还得靠HBM2 、HBM2E,就算HBM3、HBM3E在推进,也至少差一代。HBM内存的速度直接影响大模型训练效率 ,这步跟不上,整体性能就容易被拉开。

长鑫存储今年8月说HBM2量产了,每月能产1万片左右 ,但这点量也就够国内20%的GPU用,HBM3还在测试阶段,预计明年才能量产 ,可英伟达HBM4明年就要正式商用了,差距短期真不好补 。不过也不用太悲观,国产GPU不是没机会 ,咱们有自己的优势能慢慢追。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

中国是全球最大的AI市场 ,今年AI算力需求占了全球三成多,这么大的市场,给国产GPU提供了“试错-优化”的空间。我知道有个头部互联网企业 ,用华为昇腾GPU完成了70B大模型训练,成本比用英伟达H100低了不少 。有这么多实际场景练手,国产GPU的生态和性能都能慢慢优化 。

政策和资金也给力 ,“东数西算”工程明确要求算力中心用国产GPU的比例不能低于三成,今年国家大基金三期给国产GPU领域投了超500亿元,专门支持摩尔线程 、沐曦这些企业搞研发、扩产能。华为今年研发投入里 ,昇腾GPU相关的就占了15%,超180亿元,重点攻生态工具和先进封装技术;寒武纪还拿了地方政府20亿元专项补贴 ,用来搞5纳米GPU芯片研发。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

至于什么时候能追平,行业里大多觉得十年内大致看齐英伟达问题不大,2030年的时候 ,国产GPU单卡性能能到英伟达同期产品的九成 ,生态成熟度超八成,供应链自主化率达七成,这个目标不算离谱 。

中国电子技术标准化研究院有个专家说的挺对 ,国产GPU不用非要“全面复刻英伟达”,可以走“场景定制化”的路子。比如在智能驾驶 、工业AI这些垂直领域,国产GPU已经有成本和适配优势了 ,说不定能靠这个缩短差距。

国产GPU的“追平路径	”:市场、政策与技术迭代的三重助力

总的来说,2025年确实是国产GPU的“觉醒年 ”,消费级和数据中心级都有了能对标英伟达的产品 ,有些场景甚至能直接替代 。但要全面追平,生态、工艺 、供应链这三道坎还得慢慢跨。不过凭着国内庞大的市场和持续的投入,十年内大致看齐英伟达不是不可能。现在咱们已经摆脱了“没英伟达不行”的困境 ,接下来就是给点时间,把每一步的差距慢慢缩小 。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

说实话,黄仁勋说“只差几纳秒 ” ,更像是种恭维 ,英伟达肯定不会停下脚步,咱们现在能做到“可用”,下一步就是往“好用”走 ,把“追平 ”从期待变成真事儿。

本文来自作者[巧奕诺]投稿,不代表视听号立场,如若转载,请注明出处:https://stddy.com/wiki/202510-48815.html

(1)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 巧奕诺
    巧奕诺 2025年10月05日

    我是视听号的签约作者“巧奕诺”!

  • 巧奕诺
    巧奕诺 2025年10月05日

    希望本篇文章《国产GPU的“追平路径”:市场、政策与技术迭代的三重助力》能对你有所帮助!

  • 巧奕诺
    巧奕诺 2025年10月05日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 巧奕诺
    巧奕诺 2025年10月05日

    本文概览:2025年这年,国产GPU算是真醒过来了,之前提起GPU,不管是玩游戏还是搞AI训练,大家脑子里基本就一个英伟达。现在不一样了,摩尔线程、沐曦股份、壁仞科技、燧原科技这“四小龙...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们