OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

在阅读此文之前,辛苦您点击一下“关注” ,既方便您进行讨论和分享 ,又能给您带来不一样的参与感,感谢您的支持!

编辑:欣阅

在人工智能的叙事中,无数算法和模型的名字如雷贯耳 ,但一个神秘的代号“Bob ”,最近却在科技圈中,揭示了这场竞赛的另一个维度 。

据说这位“Bob ”是仅凭一己之力编写出支撑OpenAI每日数万亿次计算量核心代码的神秘人物 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

他写的训练内核,对精度的要求达到了令人发指的地步,因为一个微小的bug就可能让价值连城的算力付诸东流 ,导致整个训练任务回滚到上一个检查点。

当外界还在猜测“Bob”究竟是谁时,OpenAI的内部早已给出了答案。员工们创造了一个名为“Bobmagic”的Slack专属表情包,用来表达对技术难题被瞬间化解的崇敬 。

种种线索 ,最终都指向了一个名字:ScottGray。那为什么一个专注于底层代码、默默无闻的工程师,会被推上神坛,甚至成为科技巨头之间秘而不宣的“战略武器 ”?

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

和芯片讲悄悄话

ScottGray的价值 ,源于他一套近乎偏执的反传统哲学。在大多数开发者还在使用英伟达提供的官方工具链,依赖层层封装好的软件抽象时,他却早已看穿了这套体系的“性能天花板” 。

这个行业标准流程 ,就像一套多重翻译系统。开发者用高级语言CUDAC++写下指令,这些指令先被翻译成中间语言PTX,再由官方汇编器ptxas翻译成GPU能直接执行的底层机器码SASS。每一层翻译 ,都意味着性能的损耗和对硬件控制力的丧失 。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

ScottGray认为,官方的汇编器ptxas在寄存器分配和指令调度这些关键环节上 ,做得并不够好,甚至可以说是低效的。他无法忍受这种隔靴搔痒的沟通方式,他要做的 ,是绕过所有“官方语言”,直接与那块硅基芯片的灵魂对话。

为此,他亲手打造了一件“神器 ”——一个名为maxas的汇编器 。通过maxas ,他对GPU的掌控达到了匪夷所思的程度:寄存器的每一次分配 、内存延迟的精确计算 、指令流水线的完美衔接 ,全部实现了绝对的手动控制。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这听起来像天方夜谭,但他用一个无可辩驳的实验证明了自己。他使用maxas手写了一个SGEMM(单精度通用矩阵乘法)内核 ,在当时的GM204GPU上,这个内核跑出了硬件理论峰值98%的计算效率 。更惊人的是,这个成绩比英伟达自家专家团队呕心沥血优化的官方cuBLAS库 ,还要快上4.8% 。

他用代码证明了一个事实:硬件厂商制定的“黄金标准”,并非不可逾越的物理定律。在NervanaSystems工作的这段时间,他将这套方法论进一步推广 ,开发出名为maxDNN的卷积库。它采用了128位纹理加载、激进双缓冲等一系列汇编级的“黑魔法”,在AlexNet等经典模型上,效率稳定在93-95%的恐怖区间 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

作为对比,当时官方的cuDNN效率则像过山车一样,在32%到57%之间剧烈波动。在某个特定卷积层上 ,maxDNN的效率峰值甚至摸到了96.3%的极限。

正是这些无可辩驳的数据 ,为他赢得了前CEO口中“全球最强GPU程序员 ”的赞誉 。他向业界证明,真正的极致性能,隐藏在被大多数人忽略的硬件底层深处。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

从拧螺丝到画蓝图

2016年加入OpenAI后,ScottGray的角色完成了一次战略性的升维。他不再仅仅是那个追求极致性能的“工匠”,而是成为了公司宏大技术蓝图的“使能者” 。

OpenAI的“ScalingLaws ”理论横空出世 ,它用无可辩驳的数据指出,模型规模的扩张是通往更强人工智能的关键路径。整个行业都为之疯狂,但一个现实的物理墙很快挡在了所有人面前:稠密模型的无限扩张 ,意味着计算量和成本的指数级爆炸。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

就在大家觉得这条路快要走到尽头时,ScottGray的工作为OpenAI开辟了一条全新的航道 。他的工作重心 ,从单纯压榨现有算法的极限,转变为创造一种全新的计算范式,让“更大”成为可能。

2017年 ,他作为第一作者 ,发表了一篇关于块稀疏GPU内核的论文。这篇论文的核心思想简单粗暴:既然模型中有很多权重接近于零,与其一个个跳过这些零值,不如直接将整块整块的权重矩阵置零 ,然后在计算时“无视”这些零值块 。

这种方法带来的效率提升是数量级的 。他亲手编写的高性能内核,在处理这类稀疏模型时,比处理稠密矩阵的cuBLAS或通用稀疏矩阵的cuSPARSE要快上几个数量级。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

这意味着,在同等算力预算下,OpenAI可以构建出参数量远超竞争对手的庞大模型 ,比如一个宽度达到传统模型5倍的LSTM。这不再是简单的性能优化,而是直接将ScalingLaws的理论发现,稳稳地转化为了工程上的巨大优势 。

也正因如此 ,他的名字开始频繁出现在OpenAI那些里程碑式的论文中,从GPT-3到GPT-4的技术报告,无一例外。他不再是那个只追求“更快 ”的工程师 ,而是通过底层的革命性创新 ,为顶层的算法研究者们开辟了“更大 ”、“更高效”的新大陆,重新定义了什么在工程上是“可能的”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

小扎的秘密愿望单

ScottGray的存在 ,已经超越了技术本身,成为硅谷AI人才战争进入白热化的一个生动缩影 。他的价值,由他个人的极端稀缺性和对公司的极端重要性共同定义。

编写高性能训练内核 ,这项技能的门槛高得吓人。它要求一个人必须同时是并行计算专家 、GPU硬件架构大师和深度学习算法的行家 。能够将这三大领域的知识融会贯通,并做到世界顶尖水平的人,据业内估算 ,全球可能不超过一百个。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在OpenAI内部,一位前同事曾感叹 ,自己耗费整整一周都无法解决的性能瓶颈,ScottGray只用了几分钟就定位并解决了。这种降维打击般的能力,让“Bobmagic ”的表情包在公司内部广为流传 ,成为一种图腾 。

这种内部的崇拜 ,不可避免地会外溢,成为外部世界觊觎的目标。一个广为流传的段子是,当“Bob”的故事在网上发酵后 ,Meta的CEO马克·扎克伯格已经将他列入了“暗挖名单”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这并非空穴来风 。在此之前,Meta已经成功从OpenAI挖走了多位核心研究员 ,这场围绕顶尖人才的战争早已硝烟弥漫 。像ScottGray这样的人物,被硅谷的AI公司视为核心机密资产,他们通常不会公开承认自己的具体身份和贡献 ,以避免被对手盯上。

这揭示了当前AI竞赛的本质:囤积再多的GPU显卡,也只是打赢战争的物质基础。真正决定胜负的,是那些能够将这些硬件潜能100%压榨出来的顶尖人才 。一个不可复制的ScottGray ,其战略价值,甚至超过了成百上千块物理显卡。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

结语

在AI时代的聚光灯下 ,我们习惯于为那些发布颠覆性模型的科学家和侃侃而谈的CEO们欢呼。但真正的英雄 ,或许也包括像ScottGray这样的人 。

他们在沉默中,用一行行汇编代码,为摩尔定律“续命 ” ,为人工智能这座摩天大楼,打下了最坚实、最深入地核的地基。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

他代表了AI发展中一个容易被忽视 ,却至关重要的维度——工程的深度,最终决定了理论所能企及的高度。

奥特曼和他的公司能否守住自己的“Bob”,或许将是这场漫长AI长跑中 ,一个值得持续关注的关键变量 。

本文来自作者[怀儿小公主]投稿,不代表视听号立场,如若转载,请注明出处:https://stddy.com/zlan/202510-48776.html

(3)

文章推荐

  • 江苏新增本土无症状35例(江苏新增一例无症状感染者是哪里的)

    五常到阿城的大客是否通车?它出产于五常市,其芳香口感远近闻名,主要得益于黑土,山泉,和超长的生长周期。阿城以前有好多大厂,国家级,省级的都有,现在好多都不行了,涤纶厂已经卖给个人,据说是当地人和煤老板买了,还在维持生产,应该是等地皮生值吧,到时厂子就不存在了。纺织厂早破产了,继电器厂也不行了,百年

    2025年06月23日
    117
  • 【哈尔滨疫情49号公告,哈尔滨疫情49号公告发布】

    2020年哈尔滨疫情封城时间〖壹〗、年哈尔滨共封城5次。1月9号望奎归来,主动报备,隔离及时,没有扩散,此次疫情很快结束。8月3日开始到8月12号结束,没有病历。9月21号开始到10月15号结束。学生线上、密闭场所关闭、同时密接、次密接出现,开始大面积封控小区和单元。10月30号开始到11月18号

    2025年06月26日
    73
  • 玩家必看攻略“九九山城麻将选牌器(专用辅牌神器免安装)

    软件神器超闪!心悦填大坑辅助器免费版(会员会提高胜率吗)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”心悦填大坑辅助器免费版是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要

    2025年09月12日
    32
  • 实测结果“雀神小程序app(助赢神器通用版)

    软件神器超燃!手机打麻将作蔽器具(装挂怎么安装)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”手机打麻将作蔽器具是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年09月16日
    16
  • 实测教程“程序麻将机一套设备多少钱(助赢神器通用版)

    软件神器爆赞!微乐河北麻将胡牌神器(通用挂软件多少钱)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐河北麻将胡牌神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年09月18日
    20
  • 分享辅助“麻将机三方不动只有一方(专用辅牌神器免安装)

    软件神器超猛!欢乐卡五星开挂辅助器(小程序怎么才会赢)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”欢乐卡五星开挂辅助器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年09月23日
    12
  • 教程辅助“微乐家乡麻将斗地主助赢神器(专用辅牌神器免安装)

    软件神器超厉害!白金岛长沙麻将有辅牌器猫腻(怎么才能调胜率)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”白金岛长沙麻将有辅牌器猫腻是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器

    2025年09月27日
    10
  • 玩家实测“程序麻将机自己安装(助赢神器通用版)

    软件神器超厉害!微信小程序微乐麻将如何让系统发好牌(设置提高好牌几率)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序微乐麻将如何让系统发好牌是一款可以让一直输的玩家,快速成为一个“必

    2025年09月29日
    8
  • 实测辅助“手机斗牛作弊骗局(专用辅牌神器免安装)

    软件神器超闪!麻友圈2麻将助赢神器(挂件神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”麻友圈2麻将助赢神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年09月06日
    27
  • 墨西哥战胜中国跳水夺冠!教练是中国人,难怪要返聘周继红

    一个中国教练去了国外。她教了22年。她带的队伍回来打败了中国。一个叫马进的女人。她以前是北京跳水队的教练。2003年,她跟着一个援助团去了墨西哥。她要去那里教跳水。她到了墨西哥。那里的训练地方很差。跳台是水泥的,没有缓冲垫子。跳板又旧又破。她就在这种地方工作。她待了22年。这么长的时间,她把中国那套

    2025年09月28日
    11

发表回复

本站作者后才能评论

评论列表(4条)

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    我是视听号的签约作者“怀儿小公主”!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    希望本篇文章《OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!》能对你有所帮助!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本文概览:在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们