对话大晓机器人董事长王晓刚,解码具身智能落地“三部曲”
迪丽瓦拉
2026-01-14 08:56:16
0

过去一年,具身智能及人形机器人领域,既有草根团队投身其中,也有商汤科技这样的头部玩家强势下场。不管哪种力量入局,都绕不开规模化量产与体系化运营的支撑。

“我们的团队并非尽善尽美,仍有诸多短板亟待补强,要想在这一领域站稳脚跟,需要多维度的综合能力。”商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚在大晓机器人首场品牌发布会期间,接受《汽车观察》等媒体采访时说道。

这份对综合能力的深耕,正转化为大晓机器人实打实的技术突破与产品落地:率先发布行业首创的ACE具身研发范式、发布首个开源且商业化应用的世界模型——开悟世界模型3.0、发布具身超级大脑模组A1……

每一项成果都精准锚定具身智能核心痛点,得益于大晓机器人构建了一套从“环境式数据采集-开悟世界模型3.0-具身交互”的全链路技术体系,有效解决行业数据荒、常识差、泛化难和通用性不足等问题。

产学研天团坐镇,11年积淀赋能

去年12月,王晓刚正式入选工信部人形机器人标准化技术委员会,牵头推进我国人形机器人行业标准体系建设。目前看来,具身智能标准体系建设存在哪些难点?从企业视角转向国家顶层设计视角,看待行业发展有何不同?

王晓刚对《汽车观察》强调,人形机器人产业仍处于发展早期,亟需提供标准指导,同时标准化建设也需要全行业协同推进,目前难点主要集中在三方面。

一是数据共享标准缺失,企业间数据无法互通,造成大量重复工作;二是安全责任与法规空白,机器人进入家庭后可能会存在安全隐患,但相关责任界定、法律法规尚未明确,需要通过技术手段和质量要求规避风险;三是质量标准亟待完善,当前多数机器人难以实现两年保质期。

在王晓刚看来,具身智能是一条需要长期投入、持续创新的赛道,并非依靠单点突破就能成功。为此,在组建团队时,王晓刚特意融合了由高校教授领衔的科研团队,以及具备丰富产业化落地经验的执行团队。

尤其是大晓机器人首席科学家陶大程,兼具顶尖学术造诣与深厚产业实践积淀。在学术领域,作为澳大利亚科学院院士与欧洲科学院外籍院士“双院士”,陶大程持续推动人工智能基础研究的边界拓展;在产业实践中,陶大程曾出任京东探索研究院创始院长、优必选人工智能首席科学家,深度参与过科技公司技术战略布局与产品落地实践。

除世界级AI科学家陶大程外,大晓机器人还汇集了一批全球稀缺的AI领域前沿科学家:吕健勤、李鸿升、刘子纬、潘新钢、赵恒爽、刘希慧,这些来自南洋理工大学、香港大学和香港中文大学的科技人才,均是环境智能、世界模型、具身模型领域的开拓者,同时也是全球顶尖AI实验室MMLab的核心成员,助力大晓机器人抢占技术制高点。

“客户得知我们入局具身智能赛道后,普遍抱有较高期待,因为他们认可我们对应用痛点的把握能力。”王晓刚表示,商汤科技深耕人工智能领域11年,具备独特优势,对行业应用场景的理解足够深入;并提前布局具身智能领域,涵盖本体、零部件和触觉传感器等,为大晓机器人供应链奠定良好基础。

以方舟平台为例,十年前商汤科技就积累了丰富的场景运营经验。如今,机器人成为移动终端,本质上的应用需求痛点并未改变。入局具身智能赛道后,可以快速捕捉核心需求,将机器人与方舟平台深度融合,而这正是商汤科技区别于其他参与者的显著优势。

三代AI跃迁,倒逼ACE范式革命

AI 1.0人工标注时代,包含1400万张图像、覆盖数万个类别ImageNet数据集,若由单人全职完成全部标注,需长达10.5年。

AI 2.0大语言模型时代,数据规模实现指数级跃升,以Common Crawl为代表的互联网文本数据集,让单人全职进行原创撰写需超过12万年才能完成。

AI 3.0具身智能时代,行业面临数据量级的断崖式缺口。以智能驾驶为例,特斯拉FSD V14在世界模型仿真器的加持下,每日训练量相当于人类驾驶员400万小时,约等于500年的驾驶经验,但当前具身智能领域的真机数据量级仅为10万小时。

悬殊差距表明:具身智能研发无法延续传统路径,必须实现范式上的根本性革新,才能突破发展瓶颈。

而“以机器为中心”的研发范式,根本局限性在于将机器人本体及其硬件参数置于研发流程的核心,本质上是用极高的资源消耗换取有限且僵化的智能,实则是让人去适配和迁就机器的多样性。

这一路径导致数据采集成本高昂、效率低下,且产出的技能模型严重绑定于特定硬件,相当于把“智能”禁锢在单一躯壳内,无法形成通用的认知与适应能力,成为行业向规模化、通用化发展的关键障碍。

基于以上原因,特斯拉和Figure AI放弃了此前依赖的真机遥操路径,转而探索纯视觉学习方案,希望机器人通过观看海量视频,直接学习人类动作与智慧。但这种学习方式缺乏对三维物理世界力学规律、物理属性和动作意图的理解,难以逾越现实鸿沟。

上述两种路径,均无法理解人类所处世界的物理规律和人类行为的因果一致性,前者是“为难人”,后者是“为难机器”。困局面前,大晓机器人彻底颠覆传统逻辑,率先发布了“以人为中心(Human-centric)”的行业首创ACE具身研发范式,为具身智能行业带来四大核心数据价值。

其一,数据维度更全面,现已完成超10个视角、8种模态和4大类物品属性的多模态数据升级,实现全要素覆盖;其二,任务覆盖更长程,支撑分钟级、数百种原子动作的复杂任务;其三,交互精度更高,达到亚像素级标准,可精准追踪人手精细化操作等复杂动作;其四,采集效率更具规模化,能快速完成从十万小时到千万小时的海量数据积累。

填平数据鸿沟:环境式采集VS遥操采集

相较于遥操采集,环境式数据采集能降低多少成本?数据质量能提升多少?据悉,ACE具身研发范式中环境式数据采集可实现一年千万小时的数据收集,加之开悟世界模型3.0不断放大的真实数据价值,能够使其达到上亿小时数据规模。

首先,环境式数据采集成本更低、效率更高。遥操采集需采购单价数十万元的机器人,硬件投入成本较高,同时还需投入专人开展实验室采集工作,人力成本也不低;而环境式数据采集无需额外硬件与专职人力,即可完成数据采集,实现数倍效率提升。

且随着数据采集规模的扩大,环境式数据采集所用的传感器、AI眼镜等设备均为成熟量产产品,成本具备下降空间;而遥操采集所依赖的机器人,目前尚未形成规模化量产,成本很难降低。

其次,环境式数据采集具备更强的可复制性。以闪购仓场景为例,工作人员只需佩戴采集设备,正常作业即可完成数据采集,无需额外搭建实验室或配备专职团队,这种模式可快速进行规模化复制,为行业带来根本性技术革新。

“正因如此,我们的数据采集规模才能实现两个数量级的跨越,从原本的十万小时突破至千万小时。”王晓刚在总结环境式数据采集优势时指出,更多人员能便捷参与采集过程,是规模化的核心前提。这一点与自动驾驶领域的特斯拉类似:特斯拉依托数百万辆量产车,通过司机日常驾驶同步完成数据反馈与采集,若依赖自建采集车队,绝无可能达到如此庞大的数据规模。

开源并非降低收益,而是促成技术适配

世界模型较早应用于智能驾驶领域,如今又延伸至机器人领域,如何看待世界模型与强化学习在机器人领域的作用?实际上,强化学习与世界模型的结合在自动驾驶领域已有实践,特斯拉最新自动驾驶研发路线就是引入了世界模型与强化学习的融合方案。

“二者并不矛盾。强化学习需要高度逼真、场景丰富的仿真环境,而世界模型正是一个强大的仿真器。”王晓刚强调,这一逻辑在机器人领域同样成立,谁拥有优质的世界模型,谁就能更好地发挥强化学习的作用。

在此背景下,大晓机器人发布首个开源且商业化应用的世界模型——开悟世界模型3.0,并形成了跨本体的统一世界理解框架,现已面向全行业开源。

开放API,意味着所有企业都可以使用开悟世界模型3.0工具链,一方面推动了各类具身智能产品的快速涌现,但另一方面也意味着收益降低,如何平衡生态开放与商业化收益问题?王晓刚给出答案:依托云服务平台和开源生态两大板块协同布局。

首先,打造集创作、分享于一体的云服务产品平台。用户使用该平台算力与存储资源,会产生相应的付费,凭借成熟的产品化能力,定能吸引大量用户,使其成为商业化收益的核心来源之一。目前,大晓机器人已与商汤大装置、腾讯云、火山引擎、商汤方舟、算丰信息等平台构建全流程支持体系,借助云服务商的算力调度能力,降低中小厂商的研发成本。

其次,开源并非与商业化相悖,而是为了推动技术适配与生态共建。开源可以让开发者更便捷地开展软硬件适配工作,就像DeepSeek开源后极大便利了国产芯片适配度一样,开悟世界模型3.0也能从中收获诸多反馈与合作机会。更重要的是,开源所带来的广泛用户参与,有助于获取海量的数据反馈、积累丰富的场景数据,最终反哺开悟世界模型3.0快速迭代。

英伟达芯片时代,模型无需过多适配就能流畅运行;但随着国产芯片的发展,亟须有影响力的模型来做适配支撑。在与芯片公司合作过程中,王晓刚发现各家顶层架构及配套软件差异显著,形成了很高的技术壁垒,导致优化工作效率低下。如果依托开源生态联合开发,就能大幅提升联合优化的效率,从而降低技术壁垒。

所以,大晓机器人选择开放模型,目前开悟世界模型3.0已与沐曦股份、壁仞科技、中科曙光、辉曦智能、影微创新等多款国产芯片完成适配。相比模型与底层架构均不开源的模式,这样的做法能极大改善技术沟通与迭代演进的效率。

“一款有广泛影响力的开源模型,对芯片企业的价值不言而喻,尤其在国产化芯片成为未来主流趋势的背景下,开源的价值会进一步凸显。”王晓刚表示,很多国产芯片公司上市后估值大涨,背后正是优质模型的支撑作用,而大晓机器人的开源策略正是瞄准这一产业机遇,通过生态影响力反哺商业化价值。

世界模型进化方向:从理解、生成到预测

在已积累海量数据的当下,世界模型的能力边界在哪里?未来的拓展方向又是什么?“目前还只是起点,能够提供的数据和可触达的场景都十分有限,而这正是大晓机器人推出开悟世界模型3.0并将其开源的原因。”王晓刚如是说道。

作为行业首个“多模态理解-生成-预测”的世界模型,开悟世界模型3.0集成文生世界、像驱世界、迹塑世界等多模态生成能力,内置支持11个大类、54个细类,共计328个标签,覆盖115个垂类具身场景,不仅能理解物理世界因果规律,还能生成长时动静态交互场景,进而预测万千可能。

“覆盖更多场景与人类动作,恰恰是我们的目标,这一目标能否实现,关键在于技术范式是否具备可拓展性。”王晓刚指出,用户的使用过程其实就是持续丰富场景库的过程,必然会推动世界模型的能力边界与实际应用场景的迭代式协同拓展。

随着世界模型的演进,机器人的能力进化将经历哪些关键阶段?王晓刚总结了两点:首要变化是世界模型将显著提升机器人对物理世界的理解能力,实现此前VLA架构难以完成的复杂长程任务;其次变化是机器人的任务泛化性也将迎来突破。

但训练通用大脑所用的数据来自不同人类与场景,要想将这些数据适配到机器人身上,存在明显的跨本体鸿沟,如何弥合这一技术鸿沟?王晓刚解释道:“世界模型分为多个层次,并非一开始就单纯依赖人类行为数据,而是在底层注入大量物理规律。正因如此,模型才具备了思维链能力,若不依托物理规律,仅靠传统VLA方式是无法完成的。”

如何看待具身智能对于算力的需求?王晓刚认为,如果该领域数据积累量仍非常有限,远未达到大语言模型的数据规模,算力则并非现阶段制约其发展的最大障碍,但随着环境式数据采集的推进,将使具身智能的算力需求远超语言模型。

整体来看,具身智能算力需求将呈现螺旋式上升特征:在数据价值未被充分挖掘时,扩大算力规模能够带来显著收益;当数据价值触顶后,继续增加算力的收益会大幅递减,这一瓶颈将倒逼行业通过新方式生成新数据,从而开启新一轮的“规模化法则”(Scaling Law)。

统一架构成刚需,锚定端侧通用平台

此前,英伟达凭借CUDA生态在AI通算领域率先领跑。在未来端侧领域,是否也需要搭建类似的通用平台来支撑软硬件的开发?“的确如此,随着大量中端应用机会的涌现,大家会愈发意识到:一个开源或统一的架构,必将为产业生态的发展提供有力支撑。”王晓刚肯定道。

基于此,大晓机器人发布了具身超级大脑模组A1,应用场景聚焦低速复杂场景,让具身智能真正具备了走进产业一线的实用价值。例如,搭载具身超级大脑模组A1的机器狗,无需预采高精地图,即可适应复杂动态与陌生环境,并能完成自主巡检、跟随、避障等多样任务。

与此同时,具身超级大脑模组A1还结合Insta360全景感知方案与商汤方舟通用视觉平台,构建了全方位、高精度的环境感知体系,不仅覆盖超10个行业,还可实现超150个智能化应用场景适配。

这不禁令人好奇,开悟世界模型3.0与具身超级大脑模组A1之间是否存在联动?“前者可加载至后者中,但相关能力需分步落地,现阶段仅具备空间智能自主能力,后续会逐步叠加操作能力,两类能力会在演进中不断融合。”王晓刚进一步解释道,方舟属于后台应用,并非具身智能组成部分,其核心作用是将具身智能采集的数据转化为实际应用价值。

可以看出,具身超级大脑模组A1集成了传感器、通讯模块及芯片等多元组件,而非像友商一样聚焦芯片这类更轻量化的硬件产品。这是因其在采购过现有机器人进行测试后发现,硬件存在诸多缺陷,如传感器视野狭窄、机器狗搭载后看不清路况、无法识别红绿灯、跟随功能仅能覆盖120°范围等。

而大晓机器人要实现的是360°UWB信号覆盖,让机器人在任何场景下都能精准跟随。所以,其打造“大体积”硬件的出发点是想让产品更贴合场景需求,赋予机器人空间自主移动的能力,后续还会持续迭代优化:一是降低成本,二是降低设备功耗。

巨头联手,破局全链路生态协同

在整个具身智能产业生态中,大晓机器人扮演着怎样的角色?偏软还是偏硬?是以提供模组为主,还是以提供完整机器人为主?“这需要结合行业发展阶段来做判断,长期来看,我们的方向是软硬一体,核心目标是输出成本更低、能切实解决用户痛点的最优产品。”王晓刚回答道。

在具身智能加速落地的关键阶段,大晓机器人搭建了全链路自主可控的具身智能生态,分别与顶尖具身厂商、硬件厂商、芯片厂商、云服务商、数据厂商达成战略合作,共同打通“模型-硬件-场景”产业闭环,推动技术从单点突破走向场景化落地。

在具身本体领域,大晓机器人已与智元机器人、银河通用、钛虎机器人、国地中心等多家头部企业合作;在硬件领域,已与Insta360、卧龙电驱、帕西尼等伙伴深度绑定。其中,与银河通用的合作最为典型。

作为全球头部具身智能机器人公司,银河通用拥有全球最大规模百亿级具身数据集,其自主研发的具身智能大模型已在多任务泛化操作、人形机器人全身运动控制、跨本体自主导航和灵巧手精密操作等方面开创多项全球第一。然而,同样拥有世界模型及开放平台,大晓机器人与银河通用的合作,是互补关系还是竞合关系?

王晓刚坦言,大晓机器人才刚刚起步,不会独立完成所有工作,而是会联合生态伙伴协同研发生产,共同攻克关键零部件技术难题。一方面,大晓机器人凭借开悟世界模型3.0的技术积淀,构建起了全面领先的平台架构;另一方面,银河通用凭借智能硬件量产经验,让大晓机器人技术落地具备了更为扎实的产业基础。

伴随行业发展,具身智能对算力、模型适配性和全栈国产化能力提出更高要求。创新一体化解决方案,首当其冲成为具身智能规模化落地的核心突破口。基于此,大晓机器人与壁仞科技达成战略合作,共同打造面向机器人厂商的具身智能研发全栈解决方案。

目前,开悟世界模型3.0与壁砺™系列通用GPU产品已实现“Day 0”适配。此次战略合作将整合大晓机器人在世界模型与空间智能领域的技术积淀,发挥壁仞科技AI芯片与超节点算力优势,共同打造“算力-模型-应用”全链路国产化交付能力。

头部格局尚未形成

大晓机器人入局具身智能领域后,将聚焦哪些场景与方向?未来3-5年,哪些场景有望实现规模化落地?“家庭场景规模化落地需等五年以后,商业化与工业场景规模化落地值得重点关注。”王晓刚举例道,如商业服务领域的前置仓、闪购仓等,标准化程度高且增长迅速,具备规模化推广的条件,若机器人能实现该场景的替代,将催生十万级的市场规模。

相比之下,工业场景的可复制性较难。由于不同工厂的产线数据敏感度高、企业开放意愿低,这给通用型机器人的规模化落地带来较大阻碍,即便在单一工厂验证成功,也难以横向拓展,商业价值有限。而搭载空间智能自主能力模组的四足机器人,凭借稳定的硬件基础,能够突破工业应用的门槛,未来将在多个垂直领域具备大规模落地潜力。

对此,王晓刚规划了大晓机器人3个市场目标:其一,核心目标是推动商业化落地,超级模组搭配机器人后实现空间自主能力;其二,2026年起,四足机器人有望大规模落地,核心优势在于具备空间智能、可自主运行;其三,未来两三年将重点发力前置仓、零售仓储等场景,这类场景标准化程度高,处于快速增长阶段,具备规模化拓展潜力,而工业机器人因产线更换后可复制性较弱,暂不作为核心发力方向。

未来,具身智能机器人赛道是否会出现覆盖全应用场景、赢家通吃的超强通用大模型机器人?王晓刚认为,真正意义上能包揽所有任务的“通用大脑”还需时间打磨,市场对于机器人的期待是实现更高通用性,但这是一个渐进的过程。不过,这并不影响不同机器人共享底层的能力,这些能力可以赋能所有垂直领域。

随着技术的发展,具身智能机器人是否会取代现有工业机器人?“工业机器人是基于多年积累的物理模型与规则构建的,专为特定任务设计,通用性较弱,但优势在于可靠性已达百分之百。”王晓刚表示,现阶段具身智能机器人与工业机器人之间是互补关系,前者的通用化能力适合柔性产线等场景,后者凭借成熟的稳定性持续发挥作用。

至于智能汽车产业与机器人产业之间存在哪些共通点?王晓刚总结道,二者共通之处主要集中在体系化建设与供应链管理层面,但机器人产业的成熟度远不及智能汽车产业。所以,在行业生态尚未完善的阶段,必须通过端到端的全链路打通,才能有效控制成本,否则产业链各环节的成本都会居高不下。

在王晓刚眼中,具身智能赛道尚未形成头部格局,原因之一就是大量机器人聚焦导览类工作。虽然导览机器人的产品形态和市场规模相对有限,但在行业发展初期作用十分关键,起到市场普及的效果。这与人工智能的早期发展路径相似——起初依靠工业领域的应用完成市场教育,后续才逐步考量成本与效率。

“任何新技术的落地,往往都是先通过小范围验证让市场先熟悉起来,待价值得到充分验证后,再推进规模化量产,最终实现可量化的投入产出比。”王晓刚如是说道。

相关内容

热门资讯

神宇股份涨3.85%,成交额2... 5月6日,神宇股份涨3.85%,成交额2.29亿元,换手率5.11%,总市值65.05亿元。 异动分...
广发基金宣布增加瑞银证券为云计... 广发基金管理有限公司近日发布公告,宣布增加瑞银证券为旗下部分ETF的一级交易商。此次新增的一级交易商...
特斯拉一季度净利锐减71%!马... 当地时间4月22日,特斯拉首席执行官埃隆·马斯克表示,他计划在5月“大幅”减少为特朗普政府工作,以专...
湖北国资:一年收了4家上市公司... 你好,我是涛哥,专注于并购重组投资。这是涛哥的第69篇原创文章。 2024年,湖北国资收了4家上市公...
红利策略进化论:从防御盾牌到现... 当前市场对贸易摩擦的敏感度明显降低,近期各类关税消息虽然层出不穷,但A股基本走出脱敏行情,相关板块波...
紫燕食品发布2024年年报:创... 4月17日晚,上海紫燕食品股份有限公司(简称:紫燕食品,603057.SH)发布2024年年度报告。...
原创 腾... 海内外大厂大模型研发正在进入新升级周期,为了加速补齐技术短板,腾讯混元近日进行了大幅架构调整,重构研...
钧达股份通过港股IPO聆讯:光... 瑞财经 吴文婷 4月21日,海南钧达新能源科技股份有限公司(以下简称“钧达股份”)通过港交所聆讯,华...
鲁东红:提振消费政策落到实处,... 编者按:提振消费、扩大内需是促进经济持续回升向好的关键之举。近日,中国人民大学重阳金融研究院 宏观研...
我市加快建设水利基础设施持续增... 我市加快建设水利基础设施持续增强水利支撑能力 ■ 截至目前,全市136个项目已开工建设,累计完成投资...