全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

幼琴 • 2025年11月19日 10:59 • 新闻资讯 • 阅读 52

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力 。

谷歌DeepMind研究团队称，这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛围编程模型，能呈现更丰富的可视化效果和更深度的交互体验，且完全构建于最先进的推理技术基础之上。

该模型基于谷歌TPU进行训练，支持100万个token的上下文窗口，适用于需要以下功能的应用：Agent 、高级编程、长上下文、多模态理解、算法开发。

刚一发布，Gemini 3就几乎屠榜所有评测集，以1501 Elo得分位列LMArena大模型竞技场第一 。

OpenAI联合创始人、CEO萨姆·阿尔特曼（Sam Altman）和xAI创始人、CEO埃隆·马斯克（Elon Musk）纷纷向谷歌发来“贺信 ”。阿尔特曼发推评价“Gemini 3看起来很不错”，谷歌CEO桑达尔·皮查伊（Sundar Pichai）用了个表情包回复。

马斯克转发了谷歌DeepMind CEO戴密斯·哈萨比斯（Demis Hassabis）的推文称“干得不错” 。

今天起，谷歌将在以下平台部署Gemini 3：

适用于Gemini应用的所有用户，以及在搜索的AI模式中使用Google AI Pro和Ultra订阅服务的用户；适用于Gemini API中的开发者、谷歌全新Agent开发平台Antigravity的开发者，以及Gemini CLI的开发者；适用于Vertex AI平台与Gemini企业版的企业用户。

此外，谷歌将在未来几周向Google AI Ultra订阅者开放Gemini 3的深度思考模式，目前其还在进行安全评估。

对于Gemini 3的发布，皮查伊认为，这一模型可以让用户的任何想法变为现实。

01. 分分钟造出交互游戏、App

还能帮你学新知识

先来看下Gemini 3 Pro能做什么。

Gemini 3能编写托卡马克装置中等离子体流的可视化代码，并创作捕捉核聚变物理原理的诗歌。

如果用户想学习家族传统烹饪，Gemini 3可以解读并翻译不同语言的手写食谱，制作成可共享的家庭食谱。

如果用户想学习一个新话题，可以给Gemini 3输入学术论文、长视频讲座或教程，它还能生成交互式抽认卡、可视化或其他格式的代码，帮助用户掌握这些内容。

Gemini 3可以分析用户的匹克球比赛视频，找出可以改进的地方，并生成整体动作提升的训练计划。

AI搜索模式下，Gemini 3能学习复杂主题内容，如借助搜索功能中AI模式的生成式用户界面，学习像RNA聚合酶作用机制这类复杂知识点。值得一提的是，这也是谷歌首次在模型发布首日，就将新模型直接集成至AI搜索功能中。

Gemini 3可以编写拥有丰富可视化界面和互动性的复古3D飞船游戏。

该模型通过代码构建、解构和重新创作精细的3D体素艺术，能让用户的想象变为现实。

Gemini 3能使用着色器创建可玩的科幻世界。

其还可以生成更具实用性、元素丰富的互动性网页和App。

02. 屠榜评测集

刷新大模型能力天花板

再来看下Gemini 3 Pro的基准测试结果。

谷歌博客提到，Gemini 3 Pro在一系列基准测试中进行了评估，包括推理、多模态能力、Agent工具使用、多语言性能和长上下文，其在主要的AI基准测试中都远远优于Gemini 2.5 Pro，并以1501 Elo得分位列LMArena大模型竞技场第一 。

该模型展现出博士级推理能力，在“人类终极测试 ”（不使用任何工具情况下得分37.5%）和GPQA钻石级测试中均斩获最高分，在MathArena Apex测试中取得23.4%的最新顶尖成绩。

除了文本，Gemini 3 Pro在MMMU-Pro上获得了81%，在Video-MMMU上获得了87.6%的多模推理，在SimpleQA Verify上也获得了最高的72.1%。

这意味着Gemini 3 Pro能够以高度可靠性解决涵盖科学和数学等广泛主题的复杂问题。

Gemini 3的深度思考和多模态理解能力更新，可以帮助用户解决更复杂的问题。测试中，Gemini 3 Deep Think在“人类终极测试”（未使用工具时为41.0%）和GPQA Diamond（93.8%）中表现优于Gemini 3 Pro。它在ARC-AGI-2（代码执行，ARC奖项认证）上取得了45.1%的成绩，均超过谷歌自家前代模型，以及OpenAI、Anthropic的模型。

编程能力中，Gemini 3是谷歌迄今为止构建过的最佳氛围编程和Agent编程模型。

该模型以1487 Elo得分登顶WebDev竞技场排行榜。它在Terminal-Bench 2.0测试模型工具使用能力上，得分为54.2%，在衡量编程Agent能力的基准测试SWE-bench Verified上表现远超2.5 Pro。

开发者可以在Google AI Studio 、Vertex AI、Gemini CLI以及谷歌全新的代理开发平台Google Antigravity中使用Gemini 3进行构建。它还支持第三方平台，如Cursor、GitHub 、JetBrains、Manus、Replit等。

自Gemini 2以来，谷歌Gemini模型已经在Agent方面取得诸多进展，此次Gemini 3还登顶了Vending-Bench 2排行榜。该基准测试通过模拟自动售货机业务运营来考核模型的长期规划能力，其结果显示，Gemini 3 Pro在一整年的模拟运营中，始终保持稳定的工具使用和决策连贯性，既未偏离任务目标，又实现了更高收益 。

这意味着Gemini 3能帮助用户完成日常生活中的事务，如预约本地服务或整理收件箱等。

03. 全新Agent开发平台亮相

实现端到端软件开发自动化

今天谷歌还发布了全新的Agent开发平台Google Antigravity。

借助Gemini 3的高级推理、工具使用及Agent编程能力，谷歌Antigravity将AI辅助功能从开发者工具包里的一个工具，转变为积极主动的合作伙伴。

尽管谷歌Antigravity的核心仍是AI集成开发环境（AI IDE）体验，但其Agent已升级至专属界面，并能直接访问编辑器、终端和浏览器。如今，这些Agent可以自主规划并同步为开发者执行复杂的端到端软件任务，同时还能对自身代码进行验证。

除了Gemini 3 Pro ，Google Antigravity还将结合谷歌最新的Gemini 2.5 Computer Use模型，以及图像编辑模型Nano Banana。

谷歌Antigravity借助Gemini 3，为航班追踪应用打造了端到端的Agent工作流。该Agent能够自主规划、编写应用代码，并通过基于浏览器的计算机操作来验证其执行效果。

最后谷歌还提到，Gemini 3是其迄今为止最安全的模型，并且经历了谷歌AI模型中最全面的安全评估。模型评测结果显示，其谄媚行为减少，对即时注射的抵抗力增强，并提升了对网络攻击滥用的防护。

从2023年12月Gemini模型发布至今已近两年：Gemini 1在原生多模态和长上下文窗口上的突破，扩展了可处理信息的种类以及处理量；Gemini 2可帮助用户处理更复杂的任务和想法，使Gemini 2.5 Pro的排名在LMArena中领先超过六个月。

如今，谷歌基于Gemini模型的搜索功能AI Overviews月活用户达到20亿，Gemini应用月活用户超过6.5亿，超过70%的云端客户使用谷歌AI功能，1300万开发者用其生成模型构建了作品。

04. 结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

谷歌Gemini 3相比前几代模型性能大幅提升，可以感知用户提示词中的细微线索及复杂问题，还能理解用户请求的背景和背后意图，让用户用更少的提示获得所需信息。谷歌博客提到，在Gemini 3发布的下一个新篇章中，他们将继续突破智能、Agent和个性化的前沿，让AI真正惠及所有人。

随着Gemini 3正式亮相，加之谷歌此次免费开放其使用权限，一场围绕大模型的新一轮行业竞争已全面打响。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：程茜，编辑：心缘，36氪经授权发布。

本文来自作者[幼琴]投稿，不代表视听号立场，如若转载，请注明出处：https://stddy.com/xinwen/202511-58816.html

52 4

本文作者

幼琴签约作者

444 文章

5241885 评论

1 粉丝

我是视听号的签约作者[幼琴],本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》主要讲述了:智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

新闻资讯

伊朗往死里打，中美俄态度分化，美媒：美伊若开战，中国会是输家

对于眼前这场战争，中美俄的态度明显已经出现了分化。而美国媒体《纽约时报》则认为：如果美国和伊朗开战，那中国将会是输家。我们先来说俄罗斯的态度。俄方在观察数日后，终于在6月20日发表了对伊以战争最强硬的言论。俄罗斯总统新闻秘书佩斯科夫表示：“伊朗政权更迭是不可想象的，如果哈梅内伊遭到刺杀，那么俄罗斯将

admin
2025年06月21日
181
科技世界

北京大爷四合院藏“百瓶茅台”，拒行家万元一瓶收购，故宫都不换

北京的于大爷家住在故宫旁边,家里是一套三进两出的四合院,这都是祖上传下来的,于大爷如今也是退休了,没事遛鸟逛公园,闲暇时还喜欢欣赏自己收藏的老酒,在于大爷家里收藏了上百瓶茅台,而且都是年份老款,看着这些茅台老爷子也是感慨万千。这些茅台都是他80年代收藏的,每一瓶都记载着一段回忆,于大爷喜欢怀旧,而且

梦洁
2025年06月21日
130
生活经验

【钱柜手游其实确实有挂(确实是有挂),钱柜手游如何下载】

圣诞节怎样过才有浪漫气氛?制作早餐大多数女生都会比较在意细节，会观察男生在某件事情上有没有真的用心。建议各位男生可以在圣诞节这天早起亲手给女生制作一顿早餐，如爱心鸡蛋，面包牛奶等，之后端在女生面前，相信她一定会感受到你的满满爱意的。圣诞节到游乐园玩在圣诞节期间，游乐园的气氛一定非常浓，迪士尼、欢

安卉
2025年07月23日
112
百科栏目

习近平出席新疆维吾尔自治区成立70周年庆祝大会

25日上午，习近平总书记在乌鲁木齐市出席新疆维吾尔自治区成立70周年庆祝大会，同新疆各族各界干部群众代表一道，热烈庆祝新疆维吾尔自治区成立70周年。（记者：张晓松、朱基钗）

铁艺馨
2025年09月25日
75
新闻资讯

悲观者聪明而乐观者赚钱！高盛交易员：AI争论还要好几个季度才能出结果，别跟资本开支对着干

在一片充斥着“噪音”的市场中，保持乐观往往比听起来聪明的悲观论调更能带来回报。近日，高盛董事总经理兼资深交易员BobbyMolavi撰文称，尽管市场充斥着泡沫迹象，但驱动本轮长牛的核心支柱——尤其是AI引发的巨大资本开支——趋势明确。他认为，在AI的长期叙事落地之前，对抗其带来的资本洪流是徒劳的。

孤蝶
2025年10月08日
76
生活经验

【讲习所·中国与世界】习近平：中汤是历经风雨、患难与共的真朋友

【本期导读】11月25日，中国国家主席习近平在北京会见来华进行国事访问的汤加国王图普六世。习近平指出，中国和汤加是历经风雨、患难与共的真朋友，两国友好源远流长。中国愿同汤加共同践行四大全球倡议，为两国人民创造更加美好的生活，共建中国－太平洋岛国命运共同体，推动构建人类命运共同体。中汤建交以来，在两国

北柠陌寒
2025年11月27日
46
科技世界

唢呐一响治愈全场！青年演奏家刘西站公园首秀引沸腾

刘西站首场户外音乐会：唢呐独奏《挂红灯》。唢呐演奏家答江烟月。特别的感动，我今天也是第一次来户外直播，真的能看到今天就是你们这么热情。今天我要把我这几天所学的所有的曲子都给大家吹走一遍。先试一试好吗？先来一个开场曲试一试，这是我试个伴奏。开始，先来一首开场曲挂红灯。开始了，可以了吗？可以了。

张简子斌
2025年11月30日
37
作者专栏

沈阳一医院开设“浑身不得劲”门诊，名称通俗接地气迅速走红网络

沈阳有家医院出了个新鲜事。中国医科大学附属盛京医院开了个"亚健康（浑身不得劲）专病门诊"，专门看那些觉得累、睡不好、体检没问题的人。这名字让网友炸了锅，有人夸准，有人笑称比"学习困难门诊"还接地气，还有人调侃说医生八成只会说多睡觉。门诊12月22日刚挂出来，就有几十条微博热搜。不少人在评论区晒出挂号

福建云
2025年12月23日
25
生活经验

伊朗证实三处核设施遭美国突袭！国际原子能机构称核安全急剧恶化，胡塞武装：若美攻伊将袭击美舰船

当地时间22日凌晨，伊朗库姆省危机管理总部发言人海达里表示，库姆的防空系统几小时前识别出敌方目标并启动后，福尔多核设施的部分区域遭空袭。此外，总台记者获悉，伊朗伊斯法罕省一安全官员称“目击到”伊斯法罕和纳坦兹核设施遭到攻击。该官员还表示，该省伊斯法罕和卡尚的防空系统约一小时前启动，同时有多次爆炸声传

友蕊
2025年06月22日
131
综合

终于发现了“麻将机真有无需安装解码器吗（专用辅牌神器免安装）

这神器太香了!大宝苏北麻将辅牌器(怎么才可以赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”大宝苏北麻将辅牌器是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加

哀静
2025年09月10日
84

发表回复

本站作者后才能评论

评论列表（4条）

幼琴 2025年11月19日

我是视听号的签约作者“幼琴”！

回复
幼琴 2025年11月19日

希望本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》能对你有所帮助！

回复
幼琴 2025年11月19日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
幼琴 2025年11月19日

本文概览：智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

回复

全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

01.

分分钟造出交互游戏 、App

还能帮你学新知识

02.

屠榜评测集

刷新大模型能力天花板

03.

全新Agent开发平台亮相

实现端到端软件开发自动化

04.

结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们

分分钟造出交互游戏、App