允中 发自 凹非寺
量子位 | 公众号 QbitAI
还得是咱国产世界模型牛!
极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。
而且还是唯一一个综合得分突破60分大关的具身世界模型。
什么概念呢?就以三大核心维度为例,几乎是断层式领先:
也就是说,GigaWorld-1是真正的全能型具身世界模型,不仅视觉真实,而且几何精准、物理准确。
这意味着,极佳视界这家由清华系领衔,汇聚了阿里、百度、地平线等一众顶尖大厂核心骨干的中国团队,已经率先完成了一次教科书式的技术超车。
众所周知,WorldArena是世界模型领域公认的“试金石”。
它由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学以及中国科学技术大学等8所国内外顶尖高校及科研机构共同打造。
其摒弃了单一维度的片面测试,转而构建包含16项细分核心指标和3大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的压力测试。
也正因如此,WorldArena吸引了全球几乎所有头部世界模型团队同台竞技,首批参评名单包括谷歌、英伟达等。
最终的结果也出乎所有人意料,不是科技巨头,而是这家低调耕耘的技术扫地僧——极佳视界。
其旗下最新的GigaWorld-1凭借硬核实力,成功摘得桂冠!
那么为何GigaWorld-1能取得如此傲人的成绩呢?
首先从技术路线看,GigaWorld-1是一款专为具身场景打造的AC-WM(Action-Conditioned World Model,动作控制世界模型) 。
相较于传统的世界模型,GigaWorld-1深度继承并发展了极佳视界在去年7月发布的EmbodieDreamer核心架构。
该方案不仅引入了显式的动作建模机制,从根本上保证了视频生成过程中的几何一致性;更创新性地融入了可微分物理引擎,从而获取精准的机械臂物理参数,以实现对复杂物理交互过程的真实模拟与严格遵循。
在此前沿架构的基础上,极佳视界进一步引入了团队长期积累的上万小时高质量真实机器人操作视频数据进行训练,极大地增强了模型在开放场景下的泛化能力与高精度的动作遵循表现。
目前,GigaWorld-1的核心代码与部分数据集已开源。
仅开源后的短短半个月内,GigaWorld-1在HuggingFace平台的下载量便火速突破16000次,足见学术界与工业界对其技术实力的高度认可,以及在开发者社区中的巨大影响力。
同时GigaWorld-1还将作为官方Baseline,强力支持即将于3个月后在美国举办的GigaBrain Challenge@CVPR 2026国际挑战赛,为全球开发者积极赋能,共同推动具身智能生态的繁荣发展。
(比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/)
于是这就引出了一个关键问题——
极佳视界是谁?
在业内,极佳视界是少有的产投双栖玩家,一边闷头做技术,一边又能拿下巨额融资。
在本月初,极佳视界刚刚宣布完成近10亿元Pre-B轮融资,投资方阵容堪称豪华——
中芯聚源、上海半导体产投基金、临芯资本、星源资本、万林国际等顶尖芯片和汽车产业资本领投,中金资本、苏创投、华强资本等重磅国资平台和知名财务机构跟投。
而这,也并非极佳视界首次获得资本追捧。
早在2025年11月,华为旗下的哈勃投资就已联合华控基金,完成了对极佳视界的亿元级A1轮战略投资。
其实华为对世界模型关注已久,此前就将世界模型列为未来智能世界2035年十大技术趋势之首。
但它没有像谷歌、英伟达、特斯拉这些全球科技巨头那样直接布局世界模型,而是通过哈勃投资,先在中国市场找到了最具潜力的标的——极佳视界。
极佳视界是国内第一家布局世界模型的公司,在世界模型的模型架构和数据引擎两方面都拥有行业领先的深入积累。
公司定位相当清晰,就是聚焦物理AI,致力于世界模型驱动的物理世界通用智能。其技术护城河建立在“世界模型×具身大脑”的双轮驱动战略上,并在世界级权威测评榜单中,成功拿下具身大脑和世界模型的双料冠军。
产品矩阵包括世界模型平台GigaWorld、具身基础模型GigaBrain、通用具身本体Maker等物理AI全栈软硬件产品。
GigaWorld:物理世界的“数字沙盒”
GigaWorld是极佳视界自研的世界模型平台,能模拟物理世界运行规律,生成高保真合成数据。
与传统仿真器相比,GigaWorld能通过几何一致、物理准确的世界模型建模,生成高保真、可控、多样化的具身交互数据,实现数据放大。
这使得所训练的VLA模型在新纹理、新视角、新物体位置三大泛化维度上均实现近300%的性能提升。
更关键的是,GigaWorld能带来10-100倍的效率提升。
在具身方向,GigaWorld-0是全球首次让具身世界模型在高水平具身基模上发挥核心价值,其GitHub开源代码斩获1.5k+ Star,奠定了技术验证的基础。
本次登顶WorldArena的GigaWorld-1,也是当前全球最领先的AC-WM。
在驾驶方向,DriveDreamer系列是全球范围内最早将世界模型用在物理世界的系列开创工作。
此外,GigaWorld-Policy也是全球首次实现世界-动作模型WA实时性、成功率、训练效率全面突破,实现了对主流WAM推理效率和性能的全面碾压,让世界-动作模型真正开始进入大规模Scaling阶段。
实测数据显示,GigaWorld-Policy实现了10倍推理速度与10倍训练效率的跨越式提升,同时任务成功率大幅上涨30%,标志着具身智能正式迈入由世界模型驱动的新纪元。
GigaBrain:机器人的“通用大脑”
GigaBrain是极佳视界开发的端到端视觉-语言-动作基础模型,在全球目前规模最大的真机评测比赛中,极佳视界的开源模型GigaBrain-0.1超越Pi0.5等众多模型,获得全球第一。
后续发布的GigaBrain-0.5M*则是全球首个基于世界模型的强化学习实现高效学习和自我进化的具身基模。
它提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程。
在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain‑0.5M*均实现接近100%的任务成功率,并可稳定复现,充分彰显出卓越的策略鲁棒性。
除了技术和融资,极佳视界更亮眼的莫过于其核心团队:
创始人兼CEO黄冠,清华大学自动化系创新领军工程博士。
曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人&算法副总裁,并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。
他完整经历了过去十年物理AI的技术和产业发展历程,多次带领团队获得全球权威AI比赛世界冠军,并发布多个全球知名AI成果。
联合创始人兼首席科学家朱政,智源青年学者,发表顶级论文70余篇,引用近2万次。
多篇著作影响力巨大,连续4年入选全球前2%顶尖科学家榜单,多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF 杰出论文奖等荣誉,也是多个顶会领域主席、多项竞赛冠军。
联合创始人孙韶言,曾担任阿里云总监,地平线数据闭环产品线总经理,在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。
他主导了业内首个智能驾驶数据闭环系统的落地,有效提升了数据的处理效率,为智能驾驶技术的发展提供了重要的基础设施支持。
合伙人兼工程副总裁毛继明,拥有超过16年的仿真/工程/数据/分布式架构方向的经验。
曾担任百度Apollo仿真和工程负责人,以及曾担任百度、赢彻等T10级别架构师,主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。
另外,极佳视界模型核心团队还包括博士期间超10篇顶会一作的世界模型顶尖科学家、超过10年物理AI全栈量产经验的产业专家、华为天才少年获得者、万卡集群线性加速的顶尖算法和infra专家等,是行业少有的同时拥有顶尖的新一代物理AI全面技术前沿创新能力和传统物理AI全栈系统量产经验的全栈团队。
可以说,这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程,并在每个阶段都做出了行业领先的世界级成果。
当他们聚集在一起,就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。
从数据引擎(Data Engine),到闭环仿真器(AC-WM),再到世界动作模型(WAM),极佳视界一直走在前列。
无论是当前世界模型和具身智能基础设施的迭代,还是未来的AGI,极佳视界都将持续打造最坚实的技术基石。
比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/
开源代码:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track
开源模型和数据:https://huggingface.co/collections/open-gigaai/cvpr-2026-worldmodel-track