全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好

智东西11月19日报道,今天凌晨,谷歌最强推理模型Gemini 3终于亮相,一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称,这是全球最先进的...

智东西11月19日报道 ,今天凌晨,谷歌最强推理模型Gemini 3终于亮相,一个模型囊括了原生多模态 、推理、Agent多种能力 。

谷歌DeepMind研究团队称 ,这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛围编程模型,能呈现更丰富的可视化效果和更深度的交互体验,且完全构建于最先进的推理技术基础之上。

该模型基于谷歌TPU进行训练 ,支持100万个token的上下文窗口 ,适用于需要以下功能的应用:Agent 、高级编程、长上下文、多模态理解 、算法开发。

刚一发布,Gemini 3就几乎屠榜所有评测集,以1501 Elo得分位列LMArena大模型竞技场第一 。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

OpenAI联合创始人 、CEO萨姆·阿尔特曼(Sam Altman)和xAI创始人、CEO埃隆·马斯克(Elon Musk)纷纷向谷歌发来“贺信 ”。阿尔特曼发推评价“Gemini 3看起来很不错”,谷歌CEO桑达尔·皮查伊(Sundar Pichai)用了个表情包回复。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

马斯克转发了谷歌DeepMind CEO戴密斯·哈萨比斯(Demis Hassabis)的推文称“干得不错” 。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

今天起,谷歌将在以下平台部署Gemini 3:

适用于Gemini应用的所有用户,以及在搜索的AI模式中使用Google AI Pro和Ultra订阅服务的用户;适用于Gemini API中的开发者、谷歌全新Agent开发平台Antigravity的开发者 ,以及Gemini CLI的开发者;适用于Vertex AI平台与Gemini企业版的企业用户 。

此外,谷歌将在未来几周向Google AI Ultra订阅者开放Gemini 3的深度思考模式,目前其还在进行安全评估。

对于Gemini 3的发布 ,皮查伊认为 ,这一模型可以让用户的任何想法变为现实。

01.

分分钟造出交互游戏 、App

还能帮你学新知识

先来看下Gemini 3 Pro能做什么 。

Gemini 3能编写托卡马克装置中等离子体流的可视化代码,并创作捕捉核聚变物理原理的诗歌。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

如果用户想学习家族传统烹饪,Gemini 3可以解读并翻译不同语言的手写食谱,制作成可共享的家庭食谱。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

如果用户想学习一个新话题,可以给Gemini 3输入学术论文、长视频讲座或教程 ,它还能生成交互式抽认卡、可视化或其他格式的代码,帮助用户掌握这些内容 。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

Gemini 3可以分析用户的匹克球比赛视频,找出可以改进的地方,并生成整体动作提升的训练计划。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

AI搜索模式下,Gemini 3能学习复杂主题内容,如借助搜索功能中AI模式的生成式用户界面 ,学习像RNA聚合酶作用机制这类复杂知识点。值得一提的是,这也是谷歌首次在模型发布首日,就将新模型直接集成至AI搜索功能中 。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

Gemini 3可以编写拥有丰富可视化界面和互动性的复古3D飞船游戏。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

该模型通过代码构建 、解构和重新创作精细的3D体素艺术,能让用户的想象变为现实。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

Gemini 3能使用着色器创建可玩的科幻世界 。

全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好

其还可以生成更具实用性、元素丰富的互动性网页和App。

全世界在等的Gemini 3终于来了	,强到断崖领先,连马斯克OpenAI都夸好

02.

屠榜评测集

刷新大模型能力天花板

再来看下Gemini 3 Pro的基准测试结果。

谷歌博客提到,Gemini 3 Pro在一系列基准测试中进行了评估,包括推理、多模态能力 、Agent工具使用、多语言性能和长上下文 ,其在主要的AI基准测试中都远远优于Gemini 2.5 Pro,并以1501 Elo得分位列LMArena大模型竞技场第一 。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

该模型展现出博士级推理能力,在“人类终极测试 ”(不使用任何工具情况下得分37.5%)和GPQA钻石级测试中均斩获最高分,在MathArena Apex测试中取得23.4%的最新顶尖成绩 。

除了文本 ,Gemini 3 Pro在MMMU-Pro上获得了81%,在Video-MMMU上获得了87.6%的多模推理,在SimpleQA Verify上也获得了最高的72.1%。

这意味着Gemini 3 Pro能够以高度可靠性解决涵盖科学和数学等广泛主题的复杂问题。

Gemini 3的深度思考和多模态理解能力更新 ,可以帮助用户解决更复杂的问题 。测试中,Gemini 3 Deep Think在“人类终极测试”(未使用工具时为41.0%)和GPQA Diamond(93.8%)中表现优于Gemini 3 Pro。它在ARC-AGI-2(代码执行,ARC奖项认证)上取得了45.1%的成绩 ,均超过谷歌自家前代模型 ,以及OpenAI、Anthropic的模型。

全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好

编程能力中 ,Gemini 3是谷歌迄今为止构建过的最佳氛围编程和Agent编程模型 。

该模型以1487 Elo得分登顶WebDev竞技场排行榜。它在Terminal-Bench 2.0测试模型工具使用能力上,得分为54.2%,在衡量编程Agent能力的基准测试SWE-bench Verified上表现远超2.5 Pro。

开发者可以在Google AI Studio 、Vertex AI、Gemini CLI以及谷歌全新的代理开发平台Google Antigravity中使用Gemini 3进行构建 。它还支持第三方平台 ,如Cursor、GitHub 、JetBrains 、Manus、Replit等。

自Gemini 2以来,谷歌Gemini模型已经在Agent方面取得诸多进展,此次Gemini 3还登顶了Vending-Bench 2排行榜。该基准测试通过模拟自动售货机业务运营来考核模型的长期规划能力 ,其结果显示,Gemini 3 Pro在一整年的模拟运营中,始终保持稳定的工具使用和决策连贯性 ,既未偏离任务目标,又实现了更高收益 。

全世界在等的Gemini 3终于来了,强到断崖领先	,连马斯克OpenAI都夸好

这意味着Gemini 3能帮助用户完成日常生活中的事务 ,如预约本地服务或整理收件箱等。

全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好

03.

全新Agent开发平台亮相

实现端到端软件开发自动化

今天谷歌还发布了全新的Agent开发平台Google Antigravity。

借助Gemini 3的高级推理、工具使用及Agent编程能力 ,谷歌Antigravity将AI辅助功能从开发者工具包里的一个工具,转变为积极主动的合作伙伴 。

尽管谷歌Antigravity的核心仍是AI集成开发环境(AI IDE)体验,但其Agent已升级至专属界面 ,并能直接访问编辑器 、终端和浏览器 。如今,这些Agent可以自主规划并同步为开发者执行复杂的端到端软件任务,同时还能对自身代码进行验证。

除了Gemini 3 Pro ,Google Antigravity还将结合谷歌最新的Gemini 2.5 Computer Use模型,以及图像编辑模型Nano Banana。

谷歌Antigravity借助Gemini 3,为航班追踪应用打造了端到端的Agent工作流 。该Agent能够自主规划、编写应用代码 ,并通过基于浏览器的计算机操作来验证其执行效果。

全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好

最后谷歌还提到 ,Gemini 3是其迄今为止最安全的模型 ,并且经历了谷歌AI模型中最全面的安全评估。模型评测结果显示,其谄媚行为减少,对即时注射的抵抗力增强 ,并提升了对网络攻击滥用的防护 。

从2023年12月Gemini模型发布至今已近两年:Gemini 1在原生多模态和长上下文窗口上的突破,扩展了可处理信息的种类以及处理量;Gemini 2可帮助用户处理更复杂的任务和想法,使Gemini 2.5 Pro的排名在LMArena中领先超过六个月。

如今 ,谷歌基于Gemini模型的搜索功能AI Overviews月活用户达到20亿,Gemini应用月活用户超过6.5亿,超过70%的云端客户使用谷歌AI功能 ,1300万开发者用其生成模型构建了作品。

04.

结语:免费开放+性能飙升!

Gemini 3搅动大模型竞争格局

谷歌Gemini 3相比前几代模型性能大幅提升,可以感知用户提示词中的细微线索及复杂问题,还能理解用户请求的背景和背后意图 ,让用户用更少的提示获得所需信息 。谷歌博客提到,在Gemini 3发布的下一个新篇章中,他们将继续突破智能、Agent和个性化的前沿 ,让AI真正惠及所有人。

随着Gemini 3正式亮相 ,加之谷歌此次免费开放其使用权限,一场围绕大模型的新一轮行业竞争已全面打响。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜 ,编辑:心缘,36氪经授权发布 。

本文来自作者[幼琴]投稿,不代表视听号立场,如若转载,请注明出处:https://stddy.com/xinwen/202511-58816.html

(3)

文章推荐

  • 真被中国预测准了:特朗普撒弥天大谎,话音刚落,以色列又挨揍了

    本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源,请知悉。引言:停火还不到48个小时,中东下一场冲突又突然“爆发”。特朗普刚夸口“完美解决”伊朗问题,谎言就被直接拆穿,算是让中国精准说中了。以色列要“算账”开辟新战线,没想到却遭到打击。中东的局势为什么会越来越复杂?美以这下可是“颜面扫

    2025年06月27日
    104
  • 战斗在凌晨打响!以色列不宣而战攻击另一个国家,西方保持沉默

    2025年6月25日凌晨,约旦河西岸的拉姆安拉突然被以色列战机的轰鸣声打破平静。这次袭击来得毫无征兆,造成3人死亡,7人受伤。更让人意外的是,就在前一天,以色列刚跟伊朗签了停战协议,结束了12天的激烈冲突。这事儿一出,立马引发了国际上的热议,但西方国家却跟没看见似的,一声不吭。2025年6月25日凌

    2025年06月30日
    101
  • 上海:不再实施落地检、三天三检(上海三天十二人确诊)

    上海最新返沪政策上海近来非必要不离沪,进出上海有最新规定。离沪规定:市民非必要不离沪,确需离沪的人员须持有48小时内核酸检测阴性报告。来沪返沪规定:来沪返沪的人员须持有抵沪前48小时内核酸检测阴性报告。交通信息:为配合疫情防控工作,上海全部客运站自3月14日起暂停营运,对已购票旅客全额退款。请密切

    2025年07月04日
    103
  • 北京昨日新增本土确诊1例/北京昨日新增本土确诊40例

    北京昨日新增本土1+1例保险保单黄色文件打不开是怎么回事北京市2022年10月26日新增12例本土确证病例、保险保单黄色文件打不开是因为电子保单的格式不对。通过查询相关公开信息显示截止于2022年10月27日,北京市现在确诊病例15例。电子保单的格式分为word文档、PPT格式和PDF格式,如果手

    2025年08月27日
    75
  • 教程辅助“陕麻圈辅助软件(助赢神器通用版)

    这软件超厉害啦!天天贵阳麻将竟然有挂(专用神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”天天贵阳麻将竟然有挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以

    2025年09月06日
    63
  • 玩家必看攻略“麻将不装程序最新科技”(详细透视教程)-今日头条

    软件神器超绝!369互娱麻将其实有插件挂(是否能开挂)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”369互娱麻将其实有插件挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需

    2025年09月12日
    51
  • 教程辅助“广东雀神外挂是假的吗(专用辅牌神器免安装)

    软件神器超优!白金岛邵阳字牌是否能开挂(外辅工具)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”白金岛邵阳字牌是否能开挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年09月16日
    49
  • 跑步3个月,体重降了,骨头却变脆了?这3个坑很多人都踩过

    北京三甲医院运动医学科今年把“跑者骨质疏松”四个字贴在了诊室门口,25岁到45岁的人排队排到走廊尽头,他们月跑量都超过200公里,却连一碗米饭都不敢吃。医生一句话把真相拍在桌上:骨头不是被跑坏的,是被饿坏的。骨头靠两种细胞过日子,成骨细胞盖房子,破骨细胞拆房子。跑步时脚底砸向地面,拆房子的

    2025年10月25日
    31
  • 人民领袖|总书记为何说“不谈新发展理念不行”

    “江苏的发展,有一段时间,苏南、苏北不对称。”2023年一次两会“下团组”,习近平总书记讲起江苏发展曾经走过的一段弯路:苏北在发展冲动下,一度引进一些低端产业。响水,一声暴雷,就是当时埋下的恶果。当时GDP上去了,但为若干年以后的灾害性事件埋下了根。总书记的叮嘱鞭辟入里:“任何时候我们都不能走那种急

    2025年10月28日
    41
  • 就在今天!9月18日上午,游泳队传来傅园慧、全红婵、苏炳添消息

    傅园慧退役后入职浙江大学傅园慧在2023年退役后,正式入职浙江大学,成为公共体育与艺术部的一名教师。她曾在2016年里约奥运会女子100米仰泳半决赛中以“洪荒之力”一战成名,成为家喻户晓的“洪荒少女”。退役后,傅园慧在浙江大学开启新生活,负责游泳教学。她表示,现在的学生更关注她的教学能力,而不是名气

    2025年09月18日
    52

发表回复

本站作者后才能评论

评论列表(4条)

  • 幼琴
    幼琴 2025年11月19日

    我是视听号的签约作者“幼琴”!

  • 幼琴
    幼琴 2025年11月19日

    希望本篇文章《全世界在等的Gemini 3终于来了,强到断崖领先,连马斯克OpenAI都夸好》能对你有所帮助!

  • 幼琴
    幼琴 2025年11月19日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 幼琴
    幼琴 2025年11月19日

    本文概览:智东西11月19日报道,今天凌晨,谷歌最强推理模型Gemini 3终于亮相,一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称,这是全球最先进的...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们