【小哈划重点:深度仿生意味着可以从人身动作中获取大量的运动数据,能够明显降低深度强化学习等训练方法的难度和所需的训练时间。特斯拉人形机器人Optimus坚持仿人结构。Optimus机器人身高1.73米,在执行器连接中使用模仿肌腱的弹簧设计,手部形态上模仿人类手掌,从而实现高灵敏度以抓取重物和轻薄物体。】
人形机器人在单一任务的泛化能力方面取得较好进展,但是多任务、跨任务的泛化能力仍然相对较弱,影响人形机器人落地应用场景表现
在刚刚落幕的2025年度世界人工智能大会(下称“WAIC”)上,具身智能机器人展厅人气最火爆,满地跑的机器狗、形态各异的机器人引来观众驻足。
据介绍,本届WAIC上共有超150台人形机器人同台竞技,是国内人形机器人有史以来最大规模的一次集体展出。且不同于去年机器人多偏向于静态陈列,今年展出的机器人都主打展示在真实场景里干活的能力。
智元机器人展台面积达300平方米,也是本次参会具身智能企业中的最大展台。该公司在展台设立了工业物流、商业服务、家居、科研教育、文娱表演等五大商业场景,“指派”不同的机器人秀实力:作为主打交互服务的通用人形机器人远征A2负责展台讲解,全程自主导览无人工参与;精灵G1则化身展台“全能助手”为观众递物品、盖纪念章;另一款机器人远征A2-W在勤奋地进行拆垛搬运作业,精准抓取不同规格的周转箱。
银河通用搭建了1∶1还原的真实商超场景,由银河通用机器人Galbot进行全天候值守。
星动纪元模拟物流仓储场景,展示机器人进行智能分拣、扫码、服务等“真干活”的能力。
高盛研究预测,到2035年,全球人形机器人市场规模有望达到1540亿美元。摩根士丹利在研报中称,中国作为全球最大的机器人市场和制造中心,2024年机器人市场规模已达470亿美元,占全球总量的40%,预计到2028年将增至1080亿美元,年复合增长率达23%。
中信智库7月27日在WAIC上发布《AI新纪元:砥砺开疆·智火燎原》AI+产业发展深度研究报告。报告指出,目前机器人大模型训练方式已经开始向端到端大模型+世界模型(物理规则建模)发展,同时模态能力也越来越丰富,但受制于机器人“大脑”泛化能力有限、数据集获取难度高、结构设计待优化、供应链成本居高不下等痛点,人形机器人短期内仍难以实现大规模商用。
为什么是人形机器人
人形机器人被普遍认为是AI最有前景的落地方向之一,未来在工业、商业、家庭、外太空探索等领域具有广阔应用场景,将人类从低级和高危行业中解放出来,提升人类生产力水平和工作效率。
需要指出的是,人形机器人只是具身智能的一种典型载体,但具身智能的范畴远不止于人形机器人。具身智能核心在于“通过身体与环境的动态交互产生智能”,而“身体”的形态可以是多样的,只要具备感知、行动能力并能与环境互动,都可成为具身智能的载体。
中信智库在报告中指出,采用人形设计出于多种因素考量。
其一,更能适应环境。现实中许多场景,如楼梯、工具等均是根据人体工学设计的,机器人如果是人形就能够在这些场景中直接应用。
其二,更好的任务通用性。人体具备较高灵活度,模仿人类的关节、感官系统可让人形机器人更加灵活,可执行多样化任务。
其三,类人外观降低人机交互的心理隔阂,与其他类型相比,未来人形机器人在情感沟通上面临的壁垒更低。
其四,数据可得性更高。深度仿生意味着可以从人身动作中获取大量的运动数据,能够明显降低深度强化学习等训练方法的难度和所需的训练时间。
特斯拉人形机器人Optimus坚持仿人结构。Optimus机器人身高1.73米,在执行器连接中使用模仿肌腱的弹簧设计,手部形态上模仿人类手掌,从而实现高灵敏度以抓取重物和轻薄物体。
根据特斯拉在今年1月公布的规划,Optimus计划在2025年量产数千台,并在特斯拉工厂进行初步测试;2026年量产5万-10万台,2027年再增加10倍。
今年初开始,车厂纷纷入局人形机器人成为一大趋势。《财经》根据官方公告不完全统计得出,当前国内已有广汽、上汽、比亚迪、小鹏、奇瑞、小米等15家车企,以及华为、地平线、禾赛科技等供应链企业,相继投入人形机器人赛道。在海外,特斯拉、宝马、奔驰、本田、丰田、现代等6家车企也提出了自己的人形机器人思路。全球主流车企基本已入局人形机器人赛道。
在国内,人形机器人也成为今年资本市场热度最高的领域之一。7月18日,中国证监会官网信息显示,宇树科技开启上市辅导,估值超120亿元。宇树科技成立于2016年,研究机器狗起家,2023年开始发布人形机器人产品,是国内最受关注的人形机器人创业公司之一。人形机器人公司它石智航已经开启第三轮融资。今年3月,机器人公司维他动力宣布完成2亿元融资,这家公司成立100天,已经完成两轮融资。
按照估值,目前中国人形机器人创业公司已经形成了鲜明的梯队,第一梯队的公司有三家:宇树科技、智元机器人和银河通用,估值均超过70亿元。第二梯队的公司则包括它石智航、自变量机器人、逐际动力、千寻智能等十多家,估值在20亿元-50亿元之间。
商用难点
尽管人形机器人行业热度高涨,但仍然面临着短期内难以大规模商用的行业难题,中信智库在报告中指出,阻力主要来自以下四个方面。
首先,机器人“大脑”,即具身智能机器人大模型泛化能力有限,导致当前应用场景受限。
具身智能大模型指通过海量多模态数据(视觉、语言、动作)预训练,具备环境感知→任务理解→动作生成能力的通用智能体模型,逐步实现从“单一指令执行”到“自主决策演进”的跃迁,其核心是让机器人像人类一样“看懂世界,听懂指令,做出行动”,在工业、医疗、家庭服务等场景推动智能化升级。
机器人大模型L1-L5的典型场景
资料来源:中信智库。制表:颜斌
中信智库认为,机器人大模型大致可以参照自动驾驶的技术发展,也划分为L1-L5阶段。目前处于L4阶段,该阶段特点是实现真实交互反馈,代表模型为谷歌DeepMind于今年3月推出的Gemini Robotics,实现了视觉-语言-动作(VLA)三模态深度融合,具备极强的空间推理。
目前具身智能大模型快速迭代,但仍面临数据集不够、思考跟不上运动、缺乏生态等主要痛点,从效果上看,人形机器人在单一任务的泛化能力方面取得较好进展,但是多任务、跨任务的泛化能力仍然相对较弱,影响人形机器人落地应用场景表现。
数据是具身智能的“认知基石”,目前通用机器人大模型所需数据量极为庞大、且数据获取难度高,导致短期内通用机器人难以采集足够数量的真机数据用于大模型训练。
与语言大模型可以直接学习大量互联网、书籍知识不同,仅靠观看互联网视频或者人类动作视频是很难快速提高机器人的运动和规划能力。
物理AI仿真系统开发商松应科技首席执行官聂凯旋告诉《财经》,人形机器人则需要在真实物理环境中进行大量交互操作的数据来训练其决策和行动能力,物理世界操作数据的短缺限制了人形机器人的发展。
机器人结构设计仍需优化,零部件可靠性、电池续航等问题亟待解决。
2025年4月,北京举办人机共跑半程马拉松。半马挑战机器人综合性能,是对其关节结构设计、热管理、电池续航、控制算法、通信干扰、软硬件耦合等方面的综合性考验。
比赛途中多数机器人选手出现运动失衡、摔倒等现象,稳定性较差;同时,不少机器人暴露出散热问题,需不断喷洒冷却液进行降温。这是因为,机器人的高功率电机、密集的电子元件在持续工作时会产生大量热量,尤其是在高速持续运动或重载工况下,热量积累速度很快。而由于人形机器人设计为仿人结构,其内部空间紧凑,热量难以快速散发。
人形机器人目前续航能力有限,大多数人形机器人续航能力集中在2小时-5小时,难以满足家庭服务、工业协作等场景的持续作业需求,仍有待进一步提升。
目前,人形机器人的供应链成本较高,硬件价格仍需进一步下降。由于人形机器人量产产业规模有限,相关的零部件需求暂未完全释放,而部分零部件如精密传感器、行星滚柱丝杠等由于应用场景有限价格较为昂贵,未来产业规模进一步扩大也有赖于供应链环节的进一步降本。
(本刊记者刘以秦、研究员黄思韵、特约撰稿人顾翎羽对此文亦有贡献)
(文/《财经》研究员 周源 编辑/谢丽容)