科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

当你读到一个关于狗的故事,然后在公园看到一只真狗时,大脑会立刻建立连接。这看似简单的跨越,对人工智能来说曾经是一道鸿沟。视觉模型在图像中认识狗,语言模型在文本里理解狗,但它们对...

科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

当你读到一个关于狗的故事,然后在公园看到一只真狗时 ,大脑会立刻建立连接 。这看似简单的跨越,对人工智能来说曾经是一道鸿沟。视觉模型在图像中认识狗,语言模型在文本里理解狗 ,但它们对狗的内部表征是完全不同的数学对象。

然而麻省理工学院的四位研究人员在2024年提出了一个大胆的假说:随着AI模型变得越来越强大,它们正在趋向于一种共享的世界表征方式,就像柏拉图洞穴寓言中的囚徒 ,虽然看到的只是影子,但所有囚徒最终会意识到影子背后有一个共同的现实世界 。

这个被称为柏拉图式表征假说的理论在AI研究界引发了激烈争论。支持者认为这揭示了智能的本质,批评者则质疑研究方法的局限性。但无论立场如何 ,一个现象已经难以忽视:在不同数据集上训练的不同架构模型 ,正在学会用越来越相似的方式编码概念 。

从文字到图像:神经网络的数学共识

理解这个假说需要先了解AI模型如何表征信息。现代神经网络将每个输入转化为一串数字,这串数字被称为激活向量,代表网络中数千个人工神经元的激活程度。

在抽象的高维空间中 ,这些向量指向不同方向 。相似的概念通常对应相似方向的向量 。例如在语言模型中,狗的向量会靠近宠物 、吠叫和毛茸茸,而远离柏拉图和糖蜜。这正是英国语言学家弗斯60年前提出的洞见的数学实现:词义取决于它与哪些词同时出现。

科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

所有人工智能模型对“猫 ”的表示方式都一样吗? 马克·贝兰/ 《量子杂志》

问题在于不同模型的向量空间无法直接比较 。就像两个人用不同语言描述同一幅画 ,你不能逐字对比,但可以判断他们是否在描述相同的场景。研究人员开发了测量相似性的相似性的方法。纽约大学研究员苏霍卢茨基这样形容这种间接测量 。

具体做法是准备一组输入,比如一系列动物词汇:狗、猫、狼 、水母。将它们分别输入两个模型 ,记录各自产生的向量集合。然后比较这两个向量集合的整体几何形状是否相似 。如果在两个模型中,猫都与狗接近,水母都远离陆生动物 ,那么说明它们对动物王国的表征结构有共识。

2010年代中期,研究人员开始系统探索这种表征相似性,发现功能更强的模型往往表现出更高的相似度。2021年的一篇论文将这种现象称为安娜·卡列尼娜情境 ,借用托尔斯泰小说开篇的名句 。幸福的家庭都是相似的,不幸的家庭各有各的不幸。或许成功的AI模型都是相似的 ,而每个失败的模型都有其独特的失败方式。

跨越数据类型的收敛证据

ChatGPT在2023年初的爆红让整个AI研究界陷入生存危机 。当时在OpenAI工作的研究员许敏英回忆说,每个人都在思考为什么简单地扩大模型规模就能让它们在各种任务上表现更好 。

她开始与麻省理工学院的菲利普·伊索拉及同事定期会面,探讨规模如何影响内部表征。他们意识到,如果只是用相同数据训练的大模型学到相似表征,这可能只是过拟合训练数据的特殊性。但如果用不同数据类型训练的模型也趋同,那就更有说服力了 。

科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

最近一篇关于人工智能系统的论文受到了希腊哲学家柏拉图的一则寓言的启发。 卡比托利欧博物馆的西拉尼翁

许敏英进行了一项关键实验。他使用维基百科的图片描述数据集,测试了五种视觉模型和十一种不同规模的语言模型 。

图片输入视觉模型,文字描述输入语言模型,然后比较两类模型产生的向量聚类模式。结果令人震撼:随着模型能力增强,跨模态的表征相似性稳步上升。一个只见过文字的模型和一个只见过图像的模型,竟然在以越来越相似的方式理解世界 。

伊索拉将这个现象与柏拉图2400年前的洞穴寓言联系起来。在那个寓言中,囚徒被困在洞穴里,只能通过墙上的影子认识外部世界。

柏拉图认为我们都是这样的囚徒,感官世界只是理想形式的影子 。在AI的语境中,真实世界投射出不同的数据流,有些是图像,有些是文本,有些是声音。每个模型都是只能接触单一数据流的囚徒。但随着模型变得更强大,它们正在透过各自的数据影子,逐渐接近对共同现实的表征 。

争议与未来:通往单一模型的道路

并非所有研究者都买账 。加州大学伯克利分校的阿列克谢·埃弗罗斯曾指导过麻省理工团队四人中的三人,但他对这个假说持保留态度。他指出许敏英使用的维基百科数据集中图像和文字高度匹配是有意为之,但现实世界的大多数数据具有难以翻译的特征。这就是为什么你会去美术馆而不是只读图录,埃弗罗斯说 。视觉体验包含文字无法捕捉的信息维度。

科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

从右上角顺时针方向:Minyoung Huh、Brian Cheung、Tongzhou Wang 和 Phillip Isola 提出,不同的 AI 模型正在趋向于对其训练数据背后的世界进行共享的“柏拉图式表征”。

从右上角起:Anna Decker;@by.h_official;陈嘉熙;Kris Brewer

实验设计的选择也影响结论 。应该关注神经网络的哪一层?从众多数学方法中选择哪种来比较向量集合?测量哪些表征才具有代表性?芝加哥大学的克里斯托弗·沃尔夫拉姆警告说,如果只测试一个数据集,你不知道结果的普适性如何。谁知道使用更奇怪的数据集会发生什么呢?

伊索拉承认这个问题不可能由单篇论文解决。原则上你可以测量模型对任何图片或任何句子的表征,这是个无穷的搜索空间 。但他认为寻找普遍规律是科学的本质。我们可以研究模型之间的差异,但这在某种程度上不如找出共同点更有解释力,他说。研究界现在分成两派:一半人认为收敛现象显而易见,另一半认为这显然是错误的 。

科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致

阿列克谢·埃弗罗斯认为 ,人工智能模型之间的差异比相似之处更能说明问题。 Peter DaSilva 为 Quanta 杂志撰稿

这场争论已经催生了实际应用。去年夏天研究人员开发出将句子表征从一个语言模型转换到另一个的方法 。如果不同模型的表征在某种程度上可互换,就能找到新方法训练能从多种数据类型学习的模型 。伊索拉团队最近的论文探索了这样的训练方案,利用表征的共性来加速多模态学习。

不列颠哥伦比亚大学的杰夫·克伦提供了更谨慎的视角。你不可能用简单的解释来概括一个拥有万亿参数的系统,他说 。答案将会很复杂。现代AI模型是人类创造的最复杂的人工系统之一,它们的行为可能同时展现出收敛和分歧的模式,取决于你观察的角度和层面。柏拉图式表征假说提供了一个引人入胜的叙事,但AI的真相可能比任何单一理论都更加微妙和多维 。当研究者继续在培养皿里解剖这些数字大脑时,他们正在接近一个更深刻的问题:智能本身是否有一种最优的表征形式,还是存在通往智能的多条平行道路?

本文来自作者[友蕊]投稿,不代表视听号立场,如若转载,请注明出处:https://stddy.com/keji/202601-71078.html

(3)

文章推荐

  • 在华间谍老巢被捣毁,美国沉默一周后,宣布逮捕中国公民报复

    不久前,美国在华间谍网遭到中国致命打击,CIA战斗力近年来直线下降,业务能力差多了。间谍网被连锅端后,美国咽不下这口气,以间谍罪逮捕两名中国公民。据福克斯新闻网报道,美国司法部称,当局以间谍罪逮捕了两名中国公民。当局认为,他们在收集有关美国海军人员和基地的机密信息,还招募美国军事人员为其服务。若是间

    2025年07月03日
    128
  • 【必备攻略天天贵阳手机麻将究竟到底有挂吗(到底是否有挂),天天贵阳麻将在哪儿下载】

    天天爱钦州麻将有挂吗天天爱钦州麻将官方游戏简介游戏中有着很多的福利活动,每天玩家都能够在这领取到丰富的奖励,并且游戏对局环境非常的公平公正,在这里对局全靠玩家的个人实力,只有你的水平越高,你才能够在这赢得海量的金币。天天爱钦州麻将安卓版游戏优势地道麻将玩法,真人玩家实时语音交流。安全稳定的服务器,

    2025年07月16日
    121
  • 途游四川麻将创建房间怎么赢(究竟是否有挂)(途游四川麻将怎样才能多赢)

    四川途游麻将为什么总是一个人赢游戏商在玩家初期匹配机器人对手,让玩家觉得游戏简单易赢,以吸引玩家持续游戏。当玩家开始投入真实货币,游戏商便将玩家匹配给真人玩家,此时玩家往往会遭遇输局,从而消费更多以尝试翻盘。这样的机制设计让玩家产生赌博式的上瘾心理,这是游戏行业中常见的营销策略。因为技术好或者

    2025年08月16日
    109
  • 微信小程序麻将有胜利诀窍吗(揭秘手机上怎么容易赢).微信小程序麻将怎样才能赢?

    微信小程序里面的麻将怎样可以赢话费在麻将游戏中,赢得话费的方式主要有两种:自摸和对方点炮。在微信小程序中的麻将小游戏,如果游戏界面标注了可以赢取话费,那么玩家就有机会通过游戏赢得话费。如果游戏界面没有标注可以赢取话费,那么玩家就无法通过该游戏赢得话费。赢得话费的途径通常是玩家自摸或者等待对方

    2025年09月05日
    77
  • 实测教程“微友麻将有挂吗(助赢神器通用版)

    超带感的神器!小程序财神十三张是怎么控制胜率(专用神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”小程序财神十三张是怎么控制胜率是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器

    2025年09月16日
    70
  • 美以炸核设施,欧盟27国再下狠手!伊朗这次能扛住吗?

    2025年9月30号这天,欧盟27国一起对伊朗出手了,搞了个被外界叫“金融核打击”的全面限制措施。而且这事儿不是突然冒出来的,头几天联合国刚先一步恢复了对伊朗的全面制裁,等于西方这边是“联手行动”,目标就是伊朗的核计划。其实,这次欧盟的动作跟联合国是“无缝衔接”。之前英、法、德三个国家,作为2015

    2025年10月03日
    78
  • 普京会惊慌吗?美国军舰“压境”,或即将抵达俄罗斯前线?

    随着越来越多的西方武器涌入乌克兰,形势急剧变化。尤其是美制直升机的传闻更是让俄罗斯坐卧不安,这背后暗藏的,是美国不断强化对乌克兰的支持,也标志着西方和俄罗斯之间日益紧张的对抗升级。美国与乌克兰的军事合作一直密切,但这一次,似乎更有力度。最近,有报道称,乌克兰即将获得两款美国制造的直升机,AH-1Z“

    2025年12月07日
    38
  • 荣耀 WIN/WIN RT 双机齐发,12 月 26 日发布

    爱否科技2025-12-1721:04:07今天上午,荣耀手机官方正式宣布,旗下荣耀WIN系列手机将于12月26日正式发布。不同于标准版与Pro版的命名规则,此代荣耀WIN系列两款机型分别命名为荣耀WIN和荣耀WINRT。两款机型均采用横向大面积镜组造型,其中荣耀WI

    2025年12月18日
    27
  • 关晓彤晒饺子火了,网友吵翻了,这碗家常饭藏着多少门道

    昨天冬至,关晓彤发了一个视频,没有加美颜效果,也没有特意摆拍,只是在家里包饺子,她妈妈系着围裙揉面,她自己蘸点醋笑起来,背景是老北京四合院的厨房,饺子皮厚薄不太匀,馅儿还漏出来一些,就这短短17秒的视频,一下子冲上热搜,一天之内有380万人参与互动,大家觉得这才是真实的生活,不是刻意演出来的。她家并

    2025年12月23日
    20
  • 山姆·奥特曼的炒作史

    (图源:MITTR)本文为《麻省理工科技评论》“纠偏热潮”(HypeCorrection)专题系列的一部分,该系列旨在重置人们对AI的预期:AI是什么、它能带来什么、以及我们接下来该走向何处。每当你听到一种近乎离奇的说法,描述AI将来能做什么,最后往往都会发现,即便山姆·奥特曼不是第一

    2025年12月25日
    20

发表回复

本站作者后才能评论

评论列表(4条)

  • 友蕊
    友蕊 2026年01月09日

    我是视听号的签约作者“友蕊”!

  • 友蕊
    友蕊 2026年01月09日

    希望本篇文章《科学家惊讶发现不同的AI模型似乎在如何编码现实方面趋于一致》能对你有所帮助!

  • 友蕊
    友蕊 2026年01月09日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 友蕊
    友蕊 2026年01月09日

    本文概览:当你读到一个关于狗的故事,然后在公园看到一只真狗时,大脑会立刻建立连接。这看似简单的跨越,对人工智能来说曾经是一道鸿沟。视觉模型在图像中认识狗,语言模型在文本里理解狗,但它们对...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们