人民财讯5月15日电,“自动驾驶是具身智能的上半场,通用人形机器人是具身智能的下半场。”2026年5月,理想汽车(02015.HK)董事长兼CEO李想在发布全新旗舰车型之际,抛出了这一被业界视为"产业阶段论"的核心判断,为具身智能赛道的演进逻辑描绘出清晰的时间轴。

上下半场的演进时间轴

李想给出的具身智能演进阶段,划分清晰且时间节点明确。上半场是自动驾驶,分为三个阶段——2018至2023年的L2级辅助驾驶、2023至2028年的L3级自动驾驶、2028至2033年的L4级无人驾驶。下半场是通用人形机器人,同样分为三个阶段——2030至2035年达到6岁泛化能力、2035至2040年达到12岁泛化能力,2040年前后接近通用人工智能(AGI)水平的18岁泛化能力。

这一判断的关键意义,在于把汽车产业与人形机器人产业从赛道分离推向时间轴合流。它不再把两者视为彼此独立的赛道,而是同一产业演进路径上的上下游——上半场决定下半场的入场资格。

为什么说自动驾驶为通用人形机器人铺路?答案藏在李想对具身智能的定义里。

按照李想的定义,具身智能远不止“人形机器人”——物理世界中的机器,被赋予传感器(眼睛)、模型(大脑)与处理器(心脏)之后能够自主工作,就构成具身智能。在这一定义下,能自主驾驶的汽车与能自主行动的通用人形机器人,本质上属于同一类物种。

二者的连接关系,体现在五项核心能力的共用:感知(眼睛)、决策(大脑)、计算(心脏)、控制(手脚)、操作系统(神经系统)。上半场(自动驾驶)积累的这五项能力,将直接成为下半场(人形机器人)的技术底座。换言之,过去十年自动驾驶产业沉淀的感知模型、决策大模型、车规级芯片、线控底盘与车载操作系统,并不会随着上半场的结束而过时——它们会以人形机器人的形态继续延续产品生命力。

这也解释了一个被市场广泛观察到的现象:近两年人形机器人公司频繁从自动驾驶团队挖人。这不是简单的人才流动,而是产业上下游之间的能力迁移。

历史窗口正在打开

明确的市场坐标是投资者关心的话题,更是企业发展的路书。自动驾驶汽车与通用人形机器人作为具身智能最大的两个产品形态,各自具备五万亿美金量级的市场规模。通用人形机器人将在2030年前后进入市场化初期,节奏类似于2015年前后的电动汽车——彼时电动车被主流市场视为小众选项,十年后却成为全球汽车产业的主线。这意味着2026年至2030年这一区间,是人形机器人从研发周期走向市场化的关键过渡期。

据国务院发展研究中心的数据预测,中国具身智能产业市场规模有望在2030年达到4000亿元,2035年突破万亿元。

更值得关注的是用户层面的重合。李想给出的判断是:未来购买L4自动驾驶车的用户与购买通用人形机器人的用户重合度高达90%。这意味着上半场培育的用户基础,将自然延伸到下半场——上下半场不只是技术合流,也是用户合流。对资本市场而言,这构成一个清晰的判断:现在不是“上下半场都遥远”的观望期,而是“上半场加速、下半场酝酿”的产业拐点。

理想汽车的具身智能实践

要看懂上下半场的产业逻辑如何在真实的企业里落地,理想汽车提供了一个可被观察的样本。

研发投入是第一份证据。2025年,理想汽车研发投入达113亿元,其中AI相关投入约占50%;2026年研发投入维持在120亿元左右,AI相关占比保持五成。

组织重构是第二份证据。2026年1月,理想汽车进行了一次研发体系变革:把研发组织从按软硬件功能划分部门,重组为“造硅基人”的方式运转——感知是眼睛、模型是大脑、芯片是心脏、操作系统是神经系统、控制是手脚。变革效果已经显现:智能辅助驾驶模型的训练迭代周期从两周缩短至一天。

产品兑现是第三份证据。5月15日上市的全新理想L9 Livis,搭载了五项具身智能核心技术。

第一,自研5纳米马赫M100芯片,双颗算力2560TOPS,是全球首款基于数据流架构的大算力端侧推理芯片,相关论文已被国际计算机体系结构领域最具影响力的会议ISCA 2026收录,理想汽车由此成为该会议工业分区论文录用的全球首家汽车企业。

第二,3D ViT感知模型把前向感知距离提升至300米、等效分辨率达到1080线,能够像人一样看世界。

第三,马赫VLA模型引入多模态思考能力,可以像人一样预测风险,做出防御性驾驶的动作。

第四,800V主动悬架和全球首发的“完全体”线控底盘,在执行层面响应速度更快,为未来自动驾驶奠定硬件基础;自研星环OS操作系统将端到端延迟压缩至300毫秒左右,让车辆的反应速度超越人类。

从能力底座角度,理想L9 Livis搭载的核心技术已经在硬件性能与软件架构上为L3级甚至L4级阶段做好准备,也将延展到下半场的通用人形机器人。

下半场的预演已经启动。 理想汽车已立项两款机器人产品:一款轮式机器人定位工厂与商业场景,另一款人形机器人主攻硬件控制精度与耐久性。李想坦言,“这是一个15到20年的过程”,但已经开始。

观察坐标的切换

资本市场过去观察一家车企,更多看销量、毛利与产能;面对一家具身智能企业,观察坐标需要切换到能力底座的可迁移性——它在上半场积累的核心技术,能否成为下半场的入场资格。

具身智能“上下半场”的历史窗口正在打开。这不再是一家车企能不能造出更好一辆SUV的问题,而是一类企业能否在汽车与机器人的合流处,把上半场的技术能力延展为下半场的产业入场券。“自动驾驶为人形机器人铺路”——这条路上谁能跑通,决定了万亿赛道未来十年的格局。(人民财讯)