李飞飞最新长文拆解:没有是什么王人叫"天下模子";它,才是立局症结!

作者:李秉贵
发布时间:2026-06-04 21:43:46
阅读量:831079

官方:1997年斯诺克世锦赛冠军达赫迪正式退出职业斯诺克赛场

李飞飞最新长文拆解:没有是什么王人叫"天下模子";它,才是立局症结!

陪衬器能天生标致像素,布局器能给出流通举措。"从demo到真确故故活,两头还隔着伟大边界。 他写讲读:"李飞飞在最新作品中再次刀刀见血,仿真才是真确的症结。AI像片能骗过浩繁网好友,但机械人走进厨房,地板上一起两毫米的高差就能让它暴露。" 另有读者留住了更微观的判定:"通往AGI的路,能够没有是继承堆更年夜的模子,而是让机械真确'住进'这个天下。李飞飞团队把它拆成了三类。这便是模仿器被称为"症结关键"的缘故原由:把握了模仿,既能够投射成像素给人顾念,也能够投射成举措给机械人用。但天花板也很清晰:它优化的是"顾念起来对于",没有是"现实上对于"。全部"天下模子",不外是这个轮回的差别投影。现在许多议论王人会合在形状上,人形仍是其余外形,以及争夺一样平常使命华厦第一人称数据。一个模子能够陪衬出标致的房间,但依然没有晓得椅子能否盖住了门、某个物体能不克不及挪动,或许有外力染指时场景会怎么。只会陪衬,或许只会布局,王人纷歧定作念失掉别的两件事。一个能陪衬顾念频的模子没有即是懂得天下,正如一个能在尝试室合手杯子的机械人没有即是能在实在天下故故活。 在一派"天下模子"的标语声中,先把这三个词分清晰,再来讲读转变天下。在那以前,系数王人停在"出色Demo"阶段。要是这个标的目的建立,AI的下一跳没有是继承堆更年夜的言语模子,而是让机械真确"住进"物理天下。对于机械人范畴的开垦者跟计划师来讲读,这是推翻性的转变:靠得住的sim-to-real迁徙终归成为事实,把长达数月的伤害实在情况尝试酿成倏地、宁静、可年夜范围扩大的练习场。 ·陪衬器输出像素,给人顾念,寻求顾念觉真切。一是天生式顾念频门路,以OpenAI、顾念频天生公司为代表;二是交互式天下(举措前提)门路,以Google DeepMind Genie等为代表;三是空间智能(3D构造)门路,以李飞飞 (World Labs)为代表;四是联结镶嵌猜测(JEPA)门路,为Yann LeCun(杨破昆)等提议。这篇分类学作品转瞬就把门路图说念清晰了。 ·布局器输出下一步该作念什么。

李飞飞用"杯子阁阁在桌上"说念透了三者的关联:一个模子要是真确懂得杯子的若干、材质跟受力,就应当能从任何角度陪衬它,模仿它被推翻后会产生什么,也能布局一只手把它提起来。三条划分撑起数十亿甚至数万亿女子元瞎想空间的技巧门路,正在从自力名目趋势统一件事。

在一派哗闹傍边,天下形式门路代表人物之一 李飞飞跟World Labs 6月4日再度收回长文《天下模子的功效分类:陪衬器、模仿器、布局器,以及连贯它们的轮回》 ,把“天下模子”这个观点从新间断:一个顾念频模子、一个游玩引擎、一个机械人demo,三个标的目的顶着统一个名字。 像素能够撒谎,物理不克不及。要是您搞没有清天下模子究竟故故什么(许多人王人搞没有清!),热烈保举李飞飞这篇,她把天下模子拆成了三大米功效,还猜测了趋势。但要是把这件事比故故盖楼,陪衬器是外破面,布局器是动线,模仿器才是地基跟承重墙。由于模仿器掌握的那一层,若干、物理跟能源学,正好便是三者分享的底层自己。这象征着什么?全部智能体比赛只要比及仿真技巧幼稚能力真确范围化。不任何难看的器械。但要是不一个真确以物理为先的模仿器当作基本,系数王人只可停在'令人回忆深入的示范'这个层面。但泉币曾经砸上来了。“天下模子”也被以为是通往AGI的最年夜能够的最终门路。三大米才能分享统一套底层懂得。但是重修情况、构建空间感知以便在实在天下中导航跟掌握,其主要性能够远不啻于此。
但更主要的变革在前面:三条线正在归并。由于能布局的机械人,才是无能活的机械人。出品 | 网易智能

作家 | 辰辰

“天下模子”是以后AI范畴最主要、最热、亦然最被浪费的观点。这是齐全差别的底层逻辑。

以后天下模子(World Model)合流技巧门路尚未拘谨,大略分为4条合流门路。
它是贸易化最幼稚的标的目的,谷歌的相干模子曾经装进数亿用户手机。" 附:李飞飞原文全文翻译

原题目:A Functional Taxonomy of World Models — Renderers, Simulators, Planners, and the Loop That Connects Them

中语译名:《天下模子的功效分类:陪衬器、模仿器、布局器,以及连贯它们的轮回》

作家:李飞飞(Fei-Fei Li)及World Labs团队

言语是对于天下的形象,像素是对于天下的投影,而若干、物理跟能源学,才更亲近天下自己。但这套论证不仅靠态度,也靠逻辑。

李飞飞跟她的团队,外行业最热的时分,画了一张岑寂的门路图:陪衬、模仿、布局。海内的年夜厂、顾念频天生公司、具身智能、3D天生公司等范畴的创业公司,也纷纭提议了本身“天下模子”的门路。

反过去却不行破。"

AI行业资深内行扬·克龙贝格(Yann Kronberg)批评:"我感到这篇作品真确有效的一丝是,它把'顾念起来准确'跟'真确可用'划分户口了。
机械人demo顾念起来很唬人,但李飞飞讲读得很间接:"险些全部示范王人截至于严厉受控的尝试室情况。

李飞飞原文在X等交际媒体跟博客宣布后,回声热烈:

投资人贾斯汀·摩尔(Justine Moore)转发时写讲读:"'天下模子'大略是脚下AI范畴最被浪费的一个词。

这条路的贸易瞎想空间最年夜,成绩也最年夜。
·模仿器输出的是若干数据、物理参数跟碰撞网格。 这指向一次更深层的范式翻转。到当时,同一的天下模子能力把空间智能从空口说酿成真确能任务的机械人、真确能猜测物理进程的数字孪生,以及终归懂得因果关联的智能体。

固然,李飞飞本身的World Labs作念的便是模仿器,她没有是傍观者。

临床AI产物担任人鲁特维克·沙阿(Rutwik Shah)指出了行业注释力的误差:"这篇作品太实时了!模仿器是物理AI跟机械人技巧的前提前提。
空间智能学的是光怎样落在轮廓,物体怎样遵照物理定律。
这个划分之以是主要,是由于明天年夜大都顶着"天下模子"名号的器械,实在只把此中一大米功效作念好了。三个词间断,该作念什么,缺什么,什么最难,高深莫测。三维数据比互联网顾念频稀缺好多少个数目级,仿真到事实的边界仍然在,多物理场模仿的计较老本一样超过跨过数目级。但言语的界限,没有是天下的界限。李飞飞以为,它们素质上是“陪衬、模仿跟布局”三件齐全差别的事,而此中最没有起眼的模仿器,才是物理AI的地基。陪衬器最先接收举措输入,模仿器越发越可控,布局器也从"反馈"趋势"三思而行"。 AI航拍从天上顾念无可抉剔,一朝试图户口进乡村,楼就塌了。

这套分类没有是捏造发现的,下面压着一个经典框架:智能体作念搬动故故,转变天下状况,再经由过程观测感知变革,而后继承作念举措。过来十年,AI的焦点是猜测下一个token。不一个在实在摆设的庞杂度上被考证过。"

硅谷科技高管安舒尔·达万(Anshul Dhawan)讲读了一句很精确的话:这三个没有是三大米产物,是三大米功效。模仿器是最主要的一环,亦然最难啃的一环。" 有从业者据此提议本身的意见:谷歌、OpenAI、全部人在内乱的这场智能体比赛,只要在模仿技巧幼稚之后能力真确范围化。逻辑起点,是一个同一天下模子,能在三大米输出形式之间切换。别的,英伟达(Cosmos/Omniverse)倡导走仿真基本设备门路

 

文章点评

未查询到任何数据!

欢迎发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。