五大顶流人形机器人团队谈:冠军机器人,如何进家庭?

article/2025/6/7 17:20:17

作者 | 山竹

出品 | 锌产业

机器人马拉松、机器人足球赛、机器人技能大赛,乃至机器人格斗大赛……

过去这半年,称得上是中国人形机器人史上最高光的半年。

尽管人形机器人不断被质疑落地问题——

高盛在年初调研宇树后指出,“人形机器人的转折点尚未到来”;

特斯拉前机器人项目负责人近日也表示,“Optimus这样的人形机器人并不适合在工厂中工作”;

我们在各类机器人大赛中,更是直观的看到了人形机器人频频摔倒和罢工……

但这些似乎并没有影响人形机器人作为未来科技产业被重资押注。

从地方政府的投入来看,全国核心省市几乎都已经成立了人形机器人创新中心。

就在本周,湖北人形机器人创新中心官宣投用,目前这一创新中心已经有9家机器人企业入驻,拟签约和意向入驻企业17家,7000平米的创新中心涵盖动作训练、数据采集、应用实践、人才培训几个基地。

从商业化情况来看,已经成为中国人形机器人企业最具代表性的存在的宇树科技,此前曾官方回应,宇树在2020年就实现了盈利,公司的四足机器人、人形机器人也已经卖到了全球不少高校、研究所和机器人团队。

近日,宇树更是传出了更名、或将上市的消息,宇树科技90后创始人王兴兴也成了杭州具身智能产业联盟首任轮值董事长。

就“当下发展势头正猛,但未来商业化不明朗”的人形机器人,在2025北京智源大会上,宇树科技创始人王兴兴、北京人形机器人创新中心总经理熊友军、银河通用创始人王鹤、穹彻智能联合创始人卢策吾,以及Physical Intelligence联合创始人Karol Hausman——

这几位产业派、学术派,以及创新中心的代表人物进行了一场人形机器人主题对话,谈了各家机器人的最新进展,各类机器人大赛带来的行业影响,以及VLA的价值和边界。

就此次对话,我们就关键内容整理如下:

01 冠军机器人,也难进家庭

问:前几天在CMG世界机器人大赛机甲格斗擂台赛中,宇树的机器人获得了冠军,请介绍一下这个冠军机器人?

王兴兴:冠军机器人是我们去年发布的G1。

无论是今年春晚上的机器人表演,还是近期的机器人格斗赛,我们是希望真正给大家展示一下当前全球人形机器人发展情况,并且带动整个机器人行业发展。

目前,机器人还不能直接在家里或工厂里干活,这是全球机器人产业面临的挑战。

当然,我们是希望机器人可以真正去干活,但在机器人能够真正干活之前,我们希望可以通过已经达到的一些技术成果进行商业化拓展。

我相信机器人格斗大赛在未来一两年会成为比较受欢迎的体育赛事,我觉得这是一件激动人心的事。

问:两个月前,在北京首个人形机器人半程马拉松比赛中,天工机器人夺冠,请介绍一下夺冠的天工和天工2.0的升级?

熊友军:天工1.0在半程马拉松比赛中跑出2小时40分的成绩,被证明是最能跑的机器人。

天工2.0在1.0版本基础上做了升级,我们希望它能更好用、做更多事,所以我们的升级重点在上肢——在机器人上肢增加了自由度和灵巧手,提升了负重能力。

北京人形机器人创新中心成立于2023年11月2日,是全国首个省级人形机器人创新中心,2024年10月升级为国家地方共建具身智能机器人创新中心。

我们天工2.0的升级是系统性的,具体有四个方面升级:

一是硬件平台,之前1.0版本主打适应草地、沙地、丘陵等多种复杂地形,现在的2.0版本可用于工厂或危险环境完成任务;

二是软件平台,今年3月我们发布了第一个通用具身智能体“慧思开物”,一脑多机、一脑多能平台,包括具身智能大脑和小脑,大脑负责人机交互、环境感知、意图识别、任务规划,小脑负责运动和执行,并将执行结果反馈给大脑,实现闭环;

三是数据平台,我们围绕训练具身智能体构建了一个大型数据采集和机器人训练中心,我们构建了20多个虚实结合采集场景;

四是可靠性平台,我们牵头建设了北京的测试平台。

问:银河通用机器人的模型有何新进展?

王鹤:去年我们展示了人形机器人吸取盒状物体,今年我们基于VLA技术打造了更贴近一般商超货架场景的应用。

我们轮式底盘的人形机器人基于自研端到端大模型,不依赖轨迹生成就可以从密集货架上抓取物品,目前可以处理瓶装、袋装、薯片等多样商品。

这个模型是闭环的,支持动态交互,我们的技术特点是使用低成本合成数据训练的机器人模型。

问:穹彻智能目前有何新进展?

卢策吾:从产品角度来看,去年我们发布了穹彻大脑V1版本,我们今年7月马上将会发布V2版本,这里体现了对物理世界的理解和交互。

力反馈对复杂、动态接触、鲁棒性极高的模仿人类下意识场景很关键,例如刮胡子需要持续接触,力度要恰到好处,否则会刮伤或刮不干净。

我们的技术已经批量在食品加工行业落地,例如制作冰淇淋要求动作控制要精确到每毫秒,还要模仿人类手感。

我们的力反馈结合位置反馈的模型适用于高密度接触场景,未来也可以拓展到生活场景,如照顾老人、帮人类擦脸等。

问:Physical Intelligence的具身智能机器人和模型有哪些最新进展?

Karol:π 0.5是我们引以为傲的模型,目前对于具身智能机器人来说,最大的挑战是如何在从未见过的环境中执行任务。

我们最终选择了极具多样性的家庭环境作为机器人的训练环境,在家庭环境中,每个房间都和另一个房间都是完全不一样的。

从实验结果来看,我们的机器人只需在100个房间中完成训练,就能泛化到第101个房间中,尽管成功率还不完美。

这表明具身智能机器人训练对于数据需求已经不高,泛化前景也很乐观,但目前我们仍处于早期阶段。

02 大赛的意义:科普、训练、产业化

问:今年具身智能很火,也出现了很多机器人赛事,如何看机器人赛事活动的意义?

王兴兴:从春晚上表演节目到打格斗比赛,我认为这些赛事是向大众展示机器人一个很好的平台,可以让大众更早接触到机器人。

我们现在让机器人跳舞、打格斗赛,其实是希望通过AI技术让机器人实现各种全身动作,跳舞、格斗只是其中的一部分,我们是希望机器人最终可以执行端茶倒水、洗衣做饭等任务。

我一直相信,当具身智能发展到一定阶段后,一个足够智能的家用机器人一定可以跳舞,也可以打格斗比赛。

我们公司的终极目标是希望机器人能干活,但目前直接让机器人进入家庭或工厂干活还不现实。

在这个终极目标没有实现之前,我们可以通过表演和比赛展示机器人,让大众更了解机器人,并产生一些商业价值。

例如人形机器人租赁市场已经很火爆,本身已经带来一些产业价值。

熊友军:机器人比赛很有意义,尤其是北京即将在鸟巢举办世界人形机器人运动会,我认为它的意义体现在三个方面:

第一,它是机器人知识普及的盛会,通过比赛我们可以让大众对机器人发展状况有一个全面的了解。

据我们所知,这次在鸟巢的机器人比赛会有短跑、长跑、障碍赛、接力赛、足球、舞蹈等大家喜闻乐见的项目,大家愿意看,看的过程中就会对机器人知识和发展状况有比较深的了解,做了科技普及。

第二,它也是一个很好的技术训练场,很多比赛场景源自于人类真实生活场景,如物流搬运、医药分拣、酒店服务场景,这些都是企业或行业提出的需求,对提升机器人技术有很大帮助。

第三,它是机器人企业与潜在客户沟通的桥梁,通过这类比赛会加速机器人产业化。

Karol:国外的机器人比赛没有中国这样火爆,海外也有如Robot Cup机器人比赛,不过更多还是学术性比赛,我很期待看到这些赛事未来的发展。

问:人形机器人这些大赛与产业落地有怎样的联系?

王鹤:具身智能一个当下目标是——推动具身智能产业化。

虽然我们看到了很多炫酷的技能,但是要反思这样的技能在新的环境里、新的目标物体下,以及挑剔的用户和高成功率场景下能否成功执行任务。

银河通用和智源共同的思考是:一定要先将一些最重要的技能打通,我们这里主要关注移动、抓取、放置三项技能。

无论是在生活超市、工厂料库,还是在外卖前置仓中,如果我们可以用人形机器人进行24小时服务,这样就可以形成具身智能走向产业化、服务人类、创造生产力的开始,推动人形机器人生产力时刻的到来。

一个好消息是,银河通用的机器人在北京已经开了7家无人药店,机器人可以24小时分拣药品并对接骑手,解决夜间急需用药的需求,我们年底将会在北京、上海、深圳开100家药店。

未来我们希望超市下订单、车厂配料这些场景可以由机器人来实现,我们也希望可以和后续赛事进行对接,通过赛事推动可落地的技能形成。

卢策吾:同意王鹤老师的观点。

赛事是很好的起点,能看到机器人的性能,但下一步要让机器人产生价值,能干活儿,需要进行技能比赛。

我们正在逐步将机器人的技能性提高,我们穹彻智能正在逐步将物理世界中持续接触所需的力位反馈模型应用到食品加工等场景中,未来我们希望可以看到更多关于机器人技能的比赛。

03 人形机器人,是不是最佳形态?

问:张拔院士指出,人形机器人不是具身智能和AGI的最佳路径,通用机器人需要有硬件多样性和软件通用性。你如何看人形机器人的形态?

王兴兴:我并不坚持必须要做人形机器人。我们之前是做四足机器人的,从四足机器人到做人形机器人是顺理成章的事。

就机器人的腿部而言,轮式底盘非常实用,那为什么现在大家还要做人形?

这是因为现在的AI大部分是基于人的数据采集和训练,尤其是机器人的上半身保持与人类动作一致,便于AI数据采集和训练。

此外,就跳舞、格斗等任务而言,如果机器人做成别的样子,也就没办法执行这些任务。

未来在AGI、通用AI出现后,会出现千奇百怪的机器人形态,工厂、医疗等领域出现的机器人形态会是现在的百倍不止。

不过,目前的AI都是数据驱动的,长的像人的人形机器人在训练和落地过程中会有很大优势。

熊友军:具身智能载体多样,不一定局限于人形,人形只是其中一种形态,但从未来市场容量开看,我认为人形机器人是具身智能的最佳载体,具体可以从以下几个方面来考虑:

首先,今天机器人不一定像人,但从市场应用来看,商用服务和家庭市场会是一个很大的市场,今天走入工厂只是“开胃小菜”,人形机器人市场体量未来会很大。

其次,人形机器人便于人机交互,未来机器人走入家庭成为我们的伙伴、朋友,人形更容易让人接受。

最后,人类环境是为人而设计的,人形机器人在部署和适应环境过程中,更便于使用工具,也不需要过多环境改造。

虽然短期来看,人形机器人成本和技术不占优势,但长期来看,人形将会是最佳形态。

04 VLA:泛化可用数据改善,性能需要算法创新

问:VLA已经成为自动驾驶的主流方案,但机器人操作空间更复杂,如何看VLA的泛化性?

王鹤:自动驾驶验证了端到端方案有更好的扩展性,能够通过数据驱动模型而非规则驱动,现在进入道路的自动驾驶车辆采用的就是这种端到端方法。

VLA的意义在于可以直接通过视觉观察,通过自然语言下达命令,最终模型会不经过任何中间环节、端到端的输出动作。

从端到端角度来看,VLA模型可以充分吸收数据背后的知识并发挥出最大性能,不用受制于模块化方案中间的错误和即连误差,也不需要写无穷无尽规则兜底的问题。

现在的VLA是研究热点,但究竟要突破什么,大家想法各有不同。

有人希望可以将人类能够做的所有事在VLA中快速实现,然后形成基座模型,从这个角度来讲,我们还是太着急了。

人类除了有视觉外,还有力觉、触觉、嗅觉、味觉等,VLA只是起点,要想真正做到人类级别的具身智能,需要不断融合新的模态。

VLA现在最适合做的是移动、抓取、放置,这几个技能是以视觉为主,末端加一个触觉或力觉传感器就能执行的很好,在工业、商业领域的很多场景可以得到广泛应用。

如果我们能将这样的VLA先做好,在任何场景中不需要微调就能实现部署落地,这将会是见证具身智能高潮到来的起点。

卢策吾:VLA的本质是:通过视觉理解世界,通过语言与人类沟通,通过动作改变世界。

VLA要做到通用,就需要压缩它的不确定性,VLA相当于是个“火锅底料”,现在只能“清汤寡水”,只能服务一部分人,要服务更多人的话,就需要不断往里面加“东西”,需要不断加入额外的信息,使得它能执行更多任务。

例如,我们可以加入力反馈,很多时候人的下意识动作是不用动脑的,人擦桌子的时候不用每毫秒计算,有了力反馈后稳定性和鲁棒性会很高。

此外,我们如果能够更好地理解物理世界,就可以进一步压缩空间,所以我们在穹彻V2版本大脑里加入了“数字基因”——可以将世界产生的无穷无尽的数据资产加入其中,力反馈也带来了新的训练模型,使得数据量需求逐渐下降。

只要找到好的模态不断压缩空间,找到聪明的方式融到模型中,就可以将VLA一步一步往前推进。

问:跨本体的VLA在实践中有何瓶颈?是数据规模问题还是算法问题?

Karol:目前最大的瓶颈是成功率不足,尤其在复杂、长时序、灵巧任务中。即使有无限数据,现有算法也难以达到100%成功率,需新算法再突破。

几个月前我认为泛化性是瓶颈,但π 0.5显示泛化可通过数据改善,而性能更需算法创新。

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/wWNLZxXkwI

    相关文章

    马上评丨AI时代,为什么还要自己动手写高考作文

    每年高考首日,作文题目都是社会共同关注的话题。也因此,澎湃评论连续第九年邀请评论员、大学生同写高考作文,并请语文名师加以专业点评。在这个讲究效率、变化的时代,一件事坚持做九年,是很不容易的。事实上,一些朋友看到活动策划的海报后,就发来私信:都进入AI时代了,…

    百年张园有机更新:地上“行走”,地下“生长”

    整体移动的华严里。本文图片 上海建工二建集团供图6月7日,建设中的上海张园东区工地上,重达7500吨、总建筑面积约4000平方米的石库门建筑群“华严里”实现了整体归位。这是目前国内体量最大的组团式石库门建筑群活化利用工程。早在2023年末,硕大的华严里整体“迈步出走”94米…

    俄乌双方称在多地拦截对方无人机

    当地时间2025年6月7日,乌克兰哈尔科夫,一架沙赫德型无人机飞过哈尔科夫上空。视觉中国 图俄罗斯国防部当地时间7日通报称,自当地时间7日0时起,俄军防空系统在库尔斯克州、布良斯克州、卡卢加州、斯摩棱斯克州和莫斯科州上空共拦截和击落了36架乌克兰无人机。乌克兰空军7日通…

    孙远富当选中国田径协会主席

    ​​ 6月5日,中国田径协会第十届执委会八次会议在京召开,田径中心中国田径协会联合党委书记、协会副主席、执委等28人参会,联合纪委书记、部分部门负责人列席会议。会议审议通过了《中国田径协会会员注册管理办法》、单位会员入会议案、中国田径协会日常办事机构设置方案等事…

    沙龙|中国文学“到世界去”

    文学的引进与输出是重要的话题。6月5日,“文学是人与人之间最短的距离——文学引进与输出对话沙龙”举办,活动由北京十月文艺出版社与安德鲁纳伯格联合国际有限公司北京代表处联合举办。研讨会从版权引进与输出中最需要注意的地方谈起,英国安德鲁纳伯格联合国际有限公司北京…

    北京人艺新作《一日顶流》,编剧署名“本院集体创作”

    碳基生命能否与硅基生命共存?人工智能大爆发后,人之为人该如何自处?6月6日,北京人艺新排小剧场话剧《一日顶流》登上北京国际戏剧中心人艺小剧场的舞台,以创新的精神、勇敢的尝试,以及独特的舞台呈现,与观众共同探讨属于数字时代的新鲜话题。首轮演出将持续至6月27日。演…

    共享单车上的非法小广告层出不穷?上海徐汇城管开展专项治理

    你是否注意到各色共享单车上的小广告?6月7日,澎湃新闻记者从上海市城管执法局获悉,今年5月,上海市徐汇公安根据前期属地城管执法中队移交的涉“医保套现”小卡片相关线索,追踪到工作在静安区中兴路中宝大厦的朱某。徐汇城管执法人员检查共享单车上的小广告。本文图片均为 …

    亚振家居:实控人吴涛拟要约收购公司21%股份,进一步巩固对公司的控制权

    6月6日,亚振家居(603389.SH)公告,公司实控人吴涛发起要约收购,收购的对象为收购人及其一致行动人以外的公司全体股东,预定要约收购上市公司股份数量为5517.792万股,占上市公司总股本的 21.00%,要约收购价格为 5.68 元/股。今年4月,吴涛和其一致行动人范伟浩通过股权转…

    长三角首次发布一体化最佳案例,组建区域轨交运营公司等入选

    第七届长三角一体化发展高层论坛6月7日在南京举行,首次发布了长三角一体化发展最佳实践十大案例,组建长三角轨道交通运营公司、跨省共建“水乡客厅”等入选。发布现场。澎湃新闻记者 邱海鸿 图近年来,长三角轨道交通基础设施互联互通取得积极成效,但跨省协同运营的管理体制…

    价格周报|本周猪价持续下滑,需求欠佳预计整体仍将承压运行

    据农业农村部监测,6月6日,全国农产品批发市场猪肉平均价格为20.46元/公斤,与上周五(5月30日)的20.66元/公斤相比,下降1%。本周的平均价格为20.63元/公斤,与上周20.74元/公斤的均价相比,下降0.5%。本周国内生猪价格持续下滑,周均价环比下跌。据中国养猪网的数据,6月6日…

    读图|两百多古玉新展,先看一只玉润而呆萌的小熊

    在近万年的中华文明传承发展中,玉文化从未间断过,“守礼”“慕古”“开新”的精神脉络贯穿始终。6月7日,“玉叙尊古——中国古代玉器中的崇古与创新”特展在山西青铜博物馆2F对外展出。从礼器到艺术品,230多件古玉一次性看够,解锁华夏玉雕的古今密码。此次展览选取山西博物…

    罗志田:从“士变”认识典范转移的中国近代

    2025年5月14日下午,四川大学杰出教授罗志田在复旦大学进行了讲座。讲座开始前,主持人复旦历史系高晞教授介绍道,“朱维铮学术讲座”自2022年开办,迄今已举办四届。1987年,朱维铮先生和庞朴先生主编的“中国文化史丛书”收录了余英时先生的《士与中国文化》,这是余先生在大…

    保利发展:前5个月销售额约1161亿元,5月斥资百亿拿地

    6月6日晚间,保利发展(600048.SH)披露5月份销售情况。数据显示,5月份公司实现签约面积130.41万平方米,同比减少32.88%;签约金额285.12亿元,同比减少19.26%。2025 年1-5 月,公司实现签约面积561.20万平方米,同比减少24.96%;签约金额1161.61亿元,同比减少11.54%。土地项…

    特斯拉股价收涨超3%:特朗普无意沟通,马斯克父亲劝儿子低头

    特朗普与马斯克的“分手大战”走向扑朔迷离。从市场来看,情绪有所降温。当地时间6月6日收盘,特斯拉(Nasdaq: TSLA)涨3.67%,报收于295.14美元/股,总市值9506亿美元。一日前,因特斯拉CEO埃隆马斯克与美国总统特朗普“骂战”升级,特斯拉暴跌逾14%,蒸发了超1500亿美元市值…

    赣州中院二审宣判“人在ICU咋借钱”案:撤销一审错误判决

    6月6日,就上游新闻独家刊发的《人在ICU昏迷,如何能做到借钱打欠条?一审法院判他:还钱 》报道,江西赣州中院做出(2025)赣07民终2740号判决书:撤销赣州经开法院做出的(2025)赣0791民初2691号民事判决。错误判决已被撤销。图片来源/受访者供图上游新闻此前报道显示,4月…

    游客重庆吃烧烤遇“阴阳价”3人花780元,媒体:别让“价格刺客”刺伤城市口碑

    近日,一名上海游客发视频称,三人在重庆吃烧烤消费780元,实际签子数量比账单少了三分之一,还遭遇“阴阳价格”。6月6日,重庆市江北区市场监督管理局回应,执法人员正积极处理此事,消费者与商家正在协商中。(据6月7日上观新闻)烧烤账单(图源:当事人社交媒体)据游客邱先…

    广汽传祺车机服务“终身免费”陷质疑:在线导航使用5年后失灵,客服称需充值

    近日,广州车主任先生向澎湃公众互动平台“服务湃”(https://tousu.thepaper.cn)投诉称,其2020年9月购买的广汽传祺GS4车型,在购买时被告知智能车机系统的在线导航、升级、远程控制等基础功能“终身免费”。然而,车辆使用近5年后,车机导航功能突然无法正常联网使用,咨询…

    斯诺克名将尼尔·罗伯逊宣布成为香港居民

    6月6日,澳大利亚籍斯诺克名将尼尔罗伯逊在社交平台宣布,他已与家人一同成功取得香港身份证,并形容这是个人重要时刻,更是全家的荣耀。罗伯逊表示,香港一直是他的福地,他在此屡创佳绩,与这座城市结下深厚情谊。他透露,未来将在港开展更多商业和职业计划。据悉,罗伯逊是…

    上海观众提前同赏!《酱园弄·悬案》将进行500场特别放映

    第二十七届上海国际电影节开幕影片《酱园弄悬案》特别放映将于6月7日12:00在猫眼、淘票票平台正式开票。该片由陈可辛执导,改编自民国四大奇案之一的酱园弄杀夫案,真实再现了上世纪四十年代的上海市井城市风貌和历史记忆,带领观众一步步揭露悬案真相。《酱园弄悬案》剧照首创…

    古镇再生产|古镇、怀旧与拟像:从旅游经济学到古镇游乐场

    世缘一念,便等闲、游戏人间——宋代 京镗《汉宫春(寿李都大)》今天讨论的主题是古镇生产,所针对的是如今全国各地大同小异的古镇旅游以及同质化的古镇商业街。这一话题首先唤起的是我对曾经生活过的环境的记忆。在安徽芜湖市的青弋江河畔有一座因沿河水运码头而兴盛的集镇,…