澎湃科技聊天室|从炫技到进场打工,机器人是真能干还是看着酷?

article/2025/8/11 23:51:47

从“看着酷”到“真能干”,如今人形机器人正在加速“进场打工”。从2025年上半年开始,它们陆续经历了马拉松比赛、格斗擂台赛等运动赛事。如今,随着具身智能技术的蓬勃发展,机器人已经开始走向真实的工厂流水线。在本次2025世界人工智能大会(WAIC)期间,澎湃科技(www.thepaper.cn)与蚂蚁灵波科技技术副总裁、资深技术专家王志勇、智元机器人通用业务部副总裁王闯、上汽通用动力科技有限公司智能设备高级技术经理徐啸顺,深入探讨具身智能机器人如何实现从表演到落地的跨越。

以下是对谈实录:

整体技术水平提升,尤其遥操作和运动能力

澎湃科技:和去年相比,大家觉得今年大会有哪些亮点?

徐啸顺:去年大会人形机器人品牌众多,但不像今年蓬勃发展,特别令我惊讶和欣喜。今年整体展厅非常充实,比如智元把整个工厂产线搬到现场。以前这些机器人可能只会走路、挥挥手,但现在搭载上好的大模型和视觉能力,不仅会走路,还会做一些复杂动作。

王志勇:今年有一个特别明显的感受,去年的人形机器人只有18家左右,而今年整个H3展馆几乎被人形机器人“占领”,产业的发展速度确实让人非常惊喜。另外,作为人形机器人行业多年的观察者,可以明显感觉到技术水平整体提升,尤其在遥操作相关技术和运动能力。去年不少机器人还需要外部支架辅助,现在大部分已经可以自主行走了。

 澎湃科技:回顾上半年人形机器人的表现,你们给它的表现打多少分?

徐啸顺:要分不同应用场景,在娱乐和运动场景,人形机器人的表现8到9分(满分10分)。像马拉松项目,已经创下了世界纪录,基本只需要一两次充电或更换电池,就能跑完整个全程,这在以前是难以想象的。整体来看,进步非常显著。在工业物流等其他应用场景,我给到7分甚至以上。

王志勇:从提供情绪价值视角来看,从宇树机器人上春晚开始到现在,进步非常明显。但从另外一个角度,进场打工或执行具体任务角度来讲,可能打7分有点乐观,整体还比较早期。

王闯:我认为站在未来看,可能是60分。但在今天看,首次工厂常态化作业直播,我可以打100分。

这次在人工智能大会上的直播,我们有两个关键词,一是具身智能,二是常态化。为什么两者同时达到会这么难?人形机器人厂商做了这么多年,从来没有具身智能进入工厂常态化作业。

以前我们看到很多机器人进厂打工演示,周围都贴满了二维码,而且是改造的环境,并不是真正意义上的工厂,机器人其实并不具备真正进入工厂生产线的能力。越复杂的系统出错的可能性就越多,要实现长时间稳定运行的。难度也就越大。

澎湃科技:机器人在车间工作时具体会面临哪些实际挑战?

徐啸顺:我们车间主要从事新能源汽车的生产。整体来看,工厂布局非常工整、产线和工艺流程都经过明确的规划,这其实为机器人提供了比较理想的工作环境。但即使这样,还是会有一些挑战和变化点。

像智元这类机器人产品已经具备了一定程度的适应能力,例如能处理箱子摆放位置和规格的变化,这些都已经在它们的程序中被考虑进去。

我们认为近期应该会出现一些试运行成功的案例,未来人形机器人实现更大规模落地推广,是可预见的趋势。据我了解,今年年底或明年初,就会有一批不同场景的试用项目陆续落地,包括在车企和物流企业的多个工位中正式运行。

“具身智能行业还处于早期阶段”

澎湃科技:今年蚂蚁集团开始官宣入局布局聚生智能,请王总来透露一下目前的进展。

王志勇:简单说一下我们的进展,我们计划在今年9月会有机器人产品面世,我们研发节奏比较快,整个行业大势也在这里,我们不能等。

 澎湃科技:我也很想问问智元的王总,您感觉到现在具身智能的竞争已经开始进入白热化的阶段了吗?

王闯:现在还不到白热化的阶段,现在是万物生长的阶段。所有的从业者我都不想称为竞争对手,现在是一起去探索航道的时期。如果这个航道已经完全被挖掘出来了,只有存量竞争的时候,那时可能才是白热化。

现在还处于非常早期的阶段,还没有哪个公司敢说我的技术范式是以后永远不变的,我们只是稍微在量产和商业化的地方走得靠前,但我不认为现在到了竞争白热化的程度。

澎湃科技:你接下来会期待看到哪些应用场景的出现?

王闯:从我内心深处,包括身边很多亲朋好友问得最多的是养老。养老产品是大家最值得期待的。但我们也同时在思考,机器人真正走进家庭,对机器人的泛化性技术、执行任务的成功率、 安全性、成本要求都特别高。

我们希望机器人能先在有限场景里把任务“做好做透”。我们的目标是把机器人执行任务的成功率提升至99.9%。我们设想的技术路线是先易后难,把机器人本体规模化和成本优化好,为机器人进入家庭做准备,这一定是一个巨大的市场。

重点突破两个方向:交互智能和作业智能

澎湃科技:各位认为,对于人形机器人行业内是看热闹更多,还是应用更多一些?

徐啸顺:专业用户还是在意人形机器人的应用落地。大家可能会掐着时间节点,比如今年年底或者到明年年初先把一些应用试运行跑起来,总结问题去更好地实现技术迭代。

看热闹的话,可能会把注意力都放在大型活动上,人形机器人去表演、互动,这也有好处,可以增加产品硬件打磨。毕竟只有人形机器人出货量大了,才有可能实现降本和产业链的优化发展。

王志勇:首先,人形机器人“表演秀”为观众提供情绪价值,肯定有价值。但在我们研发路径上,还是会更关注具体落地。我们现在大部分的精力也集中在把机器人的本体技术打磨好、做扎实,然后在一些特定的场景下让它跑起来,之后在逐步泛化。这个市场很热闹,我认为行业内的人要冷静。

王闯:情绪价值和注意力经济也有价值,机器人有一部分场景是为情绪价值服务的。现在机器人的能力是在持续增长的。我们把它定义为一个本体加三个智能。

本体的成熟度现在进步非常快,运动智能也取得不错的进展。在展台上,机器人可以在现场巡馆巡展、跳舞等互动,这些都说明它的运动智能逐步完善。

但要真正让产品开发出用户价值,还需要重点突破两个方向:交互智能和作业智能。

作业智能即让机器人“干活”的能力,这是一条更长的路,而交互智能相对见效更快,能更快地让大家感受到人形机器人的价值,这只是第一步;在我看来,在机器人发展初期阶段,只要是客户愿意买单,有实际价值的功能,都值得去做。

机器人遥控操作可做业务兜底

澎湃科技:徐总你们作为应用方,你们会比较看重机器人哪方面的作业智能?

徐啸顺:对应到机器人,一方面是稳定性,不能突然有意想不到的动作和程序有突发状况;另一方面是机器人对整体的场景适配程度。

现在我们很多工作集中在消除用户或使用人员对机器人产品的理解差距。这个过程可能还有点困难。

从效率来看,现在人形机器人的效率可能会比人稍微弱也很合理。随着后续产品持续优化,机器人最终是可以达到甚至超越人工效率的。在一些高风险工位,机器人已经体现出明显优势。比如一些涉及带电作业的零部件,人形机器人上岗后,可以有效消除操作人员触电的风险。

王志勇:机器人参与表演秀提供情绪价值和机器人具体干活,这两者可以对应到人有两种激素,内啡肽和荷尔蒙。情绪价值像荷尔蒙,比较短暂。对人来讲,产生长久的价值还是内啡肽的价值,即能真正帮助人去解决具体问题,提供生产力。

传统的工业机器人在特定场景下做一个高精度的工作,已经比人都高效,具身智能的重点还是在于多任务、多场景的泛化能力。这点来讲,行业内还有很多挑战。

看落地,我反而认为遥操作的技术,可以做业务兜底,另外从获取数据的角度来看,遥操作也非常有用。短期来看,遥操作技术可能是对获取数据和在真实场景落地都非常重要的一个技术。长期来看,还是把智能的能力提高。 澎湃科技:其实包括现在其他品牌的机器人在展示具体操作能力时,往往仍离不开人工遥操作。很多网友也会质疑,既然还要人来操作,那这算什么智能?什么时候才能真正摆脱遥操作?王闯:我们的机器人在工厂三小时的直播,全程都是机器人自主完成,后台没有任何人工干预。当然,我们也设计了兜底措施以应对极端情况。但兜底的措施并不完全依赖遥控操作。

遥控操作有两点价值:一是训练阶段对真实场景数据的要求。我们在训练环节,是需要操作数据,有一些场景需要数据驱动,需要人类教机器人怎么做,这个过程包括模仿学习和强化学习。越是精细复杂的任务,越需要更多的数据去训练。如组装类作业,仍需要真实场景中的操作数据,包括模仿学习和强化学习的过程。传感器数据的丰富度也会影响模型学习效果。

二是保障任务的稳定性。哪怕机器出错的概率只有万分之一,也不能让整条产线停摆,这个时候需要人远程遥控操作恢复。我们也想过,在某些商业场景里,遥控操作本身也有实际价值,比如在较为荒凉的地方开小卖部,以坐在办公室远程操控卖产品。

具身智能数据极度缺乏,包括触觉、深度识别

澎湃科技:经过半年的发展,机器人现在大脑和小脑成熟度分别怎么样?

王闯:我们小脑并没有用到大模型。现在我们机器人的小脑例如下肢的控制,我们用的强化学习都直接是端侧部署,并不依赖于云端的大模型。

另外,我们上肢系统也不依赖云端大模型。上肢“小脑”的运动规划也都在端侧完成。我认为目前大模型对机器人产业最大的赋能,主要体现在对环境的理解能力上。

让我惊艳的是多模态大模型的出现,它对现实世界中各种物体具备一定的理解能力,甚至有些它没见过的,也能分析。但现在大模型技术还不够成熟,机器人还做不到“看一眼就知道干什么”,也难以通过简单语言指令高效完成复杂任务。目前,带动作执行的大模型还没有出现,还没有形成既具泛化性又高成功率的通用方案。

王志勇:我认为一是模态,二是模型。

所谓模态即大模型就像人一样,有视觉、听觉、触觉、嗅觉等不同的感知能力。让具身智能有感知,传感器一定要足够多,尽可能多获取有3D深度的视觉、触觉、电子皮肤。

更关键的问题是,当模型拿到这些信息后,是否真的能驾驭好,做出好决策。有些国产车因为接收了更多模态的信息,导致内部的两套决策系统可能“打架”。比如拿到雷达信号,但没有实现有效融合,反而影响了最终判断。换句话说,模态信息越多,不一定是好事,关键是决策系统能否协同处理。

目前,从模型角度看,获得具身智能相关数据仍有很大挑战。这不像自动驾驶那样相对成熟。现在连视觉都还只是初步应用,更别说触觉和其他感知,这些数据极度缺乏。

从算法技术路线来讲,其实也没有收敛。现在VLA(视觉语言动作)这条路上有好几家在探索,但不像大模型已形成共识。所以有很多难点,路还比较长。

澎湃科技:好像多家都开始探索VLA模型路径,您能否给大家科普一下VLA模型到底是什么?

王志勇:VLA其实强调像人一样,从感知环境到自主决策并采取一定的行动。在自动驾驶领域已发展得相当不错,机器人本身VLA的模型能力还处于早期阶段。

王闯:VLA模型关键在于泛化性要求非常强。即使从未见过的场景,也能迅速做出正确的反应。它依赖大量数据构建基座能力,确保在千差万别的任务中也有成功率。

目前VLA模型的难点在于,行业内现在到底需要什么样的数据并没有形成共识,导致大家采集数据不一,此外数据量是否足够现在未有定论。这些新的数据会对VLA模型有什么影响,也暂时未知。另外从VLA模型效果来看,它与人类的泛化能力仍然有显著的差距,要实现强泛化、高成功率,这非常不容易。

还有一点必须考虑的是部署问题,模型不能无限大。真正落地时,也必须注重端侧运行能力,不能完全依赖云端。最好模型大小也是可控的,在端测功耗算力都可负担时,它最终价值才会非常大。

徐啸顺:在我们工厂环境中,质量和安全是首要考虑因素。但非专业用户很难理解模型的决策机制。这个行业里也一直在强调模型的可解释可信任可负责,包括自动驾驶也是要让模型达到可负责的程度才能完全交付。目前多模态VLA模型(视觉、语言、动作)技术尚未完全收敛,在现场部署中仍然存在一定风险。在现阶段,“能跑起来”已经很不错了,但要做到可信任可负责,可能还需要一段时间。

所以我个人认为,工业场景中更适合采用小模型或传统神经网络小模型去处理动作任务。而大模型要经历验证和完善,行业也需建立一整套评估和管理机制。

希望明年真正能做到客户直接签单

澎湃科技:这几天我注意到特斯拉在美国洛杉矶已经落地了一个无人化的服务场景,展望未来,如果我们以半年为单位来看,这类的场景会有在国内落地的可能性吗?半年之后又会有哪些变化或发展趋势? 

徐啸顺:前不久,我们也和智元机器人合作,做了一些机器人的场景测试,比如用户抽盲盒、机器人递交盲盒。这个动作本身并不复杂,但如果每台机器人都能稳定地重复执行,就具备构建“汽车餐厅”这类场景的基础。这样的流程可以被拆解为一系列可控的步骤。只要产业各方共同推进,我相信在中国类似场景很快就会实现落地。

王志勇:我不太好预测明年的进展,从更长远的角度来看问题,我们在场景上希望未来机器人能够走进家庭。

王闯:特斯拉一直擅长向公众传递信息,善于制造能抓住大家眼球的内容。我们看到它宣传最多的其实是机器人倒爆米花的场景,咖啡反而较少。而在今年WAIC智元机器人的展台上,我们也展示了多台机器人为观众递送可乐、饮料等互动体验。

我们希望明年,机器人能在服务场景、作业场景中展现给大家更多价值,比如提供一些吃的,或具备更复杂的作业能力。我们把2025年定义为商业化元年,很重要的任务是跟客户一起去思考哪些场景真正有价值,而不是只放演示,我希望明年客户看上了可以直接签单。

    责任编辑:宦艳红
    图片编辑:施佳慧

    http://news.xdnf.cn/nuvPAYLjPY

    相关文章

    创明日之星佳绩,剑指全运金牌!上海队这一点令马赛教练赞叹

    “看球!回接!往右边!”8月3日上午10点,在浦东足球场外场进行的上海队与马赛队之间的五六名争夺战率先打响,看台上的上海队主教练成耀东和场边的上海队助教王贇的呼喊声此起彼伏。在这样一场雨过天晴、闷热异常的苦战中,上海队最终凭借队长李秋甫在比赛尾声的头球接力破门…

    云南会泽一高中教师被指对学生行为逾矩:学校已解除其人事关系

    针对云南会泽县第一中学高一化学教师马某某被指在教室内对女生有触摸敏感部位、搂抱等行为一事,该校相关人士8月4日向澎湃新闻表示,学校初步认定马某某存在师德师风失范问题,已解除其与学校的人事关系,并作出其他相应处分。目前,暂无证据表明马某某涉嫌违法,警方仍在进一…

    林徽因英文书信结集出版,此前由费正清夫人整理保存

    近日,中国现代著名诗人、建筑学家林徽因写于1935年至1940年的大批英文书信由人民文学出版社出版,该部分书信由林徽因外孙女、梁再冰之女于葵编注,以中英文对照的形式,收录于《林徽因全集英文书信卷(一九三五—一九四〇)》之中。这批珍贵的书信绝大多数从未发表。主体部分…

    体坛联播|吴艳妮100米栏折桂,中国男篮官宣亚洲杯大名单

    吴艳妮女子100米栏折桂2025年全国田径锦标赛4日在浙江衢州落幕。当晚最后一个比赛单元中,吴艳妮以13秒15的成绩获得女子100米栏冠军。上海小将陈圆将在男子110米栏中以13秒18的成绩夺冠,成功达标东京田径世锦赛。女子100米栏决赛中,广东队的刘景扬前半程势头强劲,一度处于领…

    建筑瞭望|黑川纪章与胶囊建筑的乌托邦

    纽约现代艺术博物馆(MoMA)正在举办一场以日本建筑师黑川纪章设计的中银胶囊塔为主题的展览,展览名为《中银胶囊塔的多样生命》。中银胶囊塔于1972年在东京银座建成,2022年被拆除。这个建筑由140个胶囊单元的“微型公寓”组成,每个单元内部大约有10平方米的空间,电视机、冰…

    建了20年的大埃及博物馆:一切就绪,只等图坦卡蒙

    上海博物馆古埃及文明大展即将进入尾声,而在埃及,原定于7月正式开幕的大埃及博物馆(GEM)再次延期,全面开幕将推迟至今年第四季度。澎湃新闻获悉,大埃及博物馆作为埃及最大的文化工程,于2002年选址,2005年开工建设,保护修复工作室自2010年起就已运行,博物馆去年秋天开…

    河南7月平均气温破64年最高纪录,旱情如何?何时缓解?

    连日来,河南遭遇持续高温天气。7月份河南全省平均气温达30.5℃,较常年异常偏高3.2℃,这是1961年以来同期最高值。高温所导致的河南旱情如何?给农业和百姓生活带来怎样影响?如何应对?河南近期的高温干旱天气有怎样的特点?未来将如何发展?河南省气象台8月4日发布高温橙色…

    85后“博士哥”钟林履新湖北红安县代县长

    据湖北省黄冈市红安县融媒体中心微信公众号“最红安”消息,8月1日,红安泛家居产业重点项目——金牌家居红安生产基地一期试投产与“德韬泛家居产业园”启动活动在红安高新区举行。红安县委副书记、代县长钟林致辞。红安县委副书记、代县长钟林。微信公众号“最红安” 图稍早前…

    蓝思科技:今年承接智元机器人全系列多款人形机器人业务

    8月4日,蓝思科技(300433)在接受调研时披露公司在人形机器人领域的最新进展。蓝思科技表示,2024年起已为合作伙伴交付数百台整机,今年则承接了智元机器人全系列多款人形机器人业务。蓝思科技表示,公司在2016年成立智能机器人公司,研发和大规模量产工业机器人、机械臂、灵…

    AI让供应链“活”了起来

    前不久,我在做某数字化平台的调研时,与他们的创始人谈到了一个耐人寻味的话题——“为什么中国拥有全球最完整的工业体系,却仍有无数中小工厂困于‘代工边缘’?”对方提到,“其实只用产业链集群来描述中国制造业的供应链能力是不准确的,至少还包括工艺协同、企业协同、行…

    十字路口的古镇|江西瑶里古镇:高人气与低收益之困

    【编者按】小桥流水、青砖黛瓦,熙熙攘攘的古镇曾是几代人的集体旅行记忆。随着时代变迁,年轻人旅行观念和旅行方式急剧转变,越来越多的古镇都身处“十字路口”,是继续忍受门可罗雀还是破釜沉舟升级改造,古镇转型势在必行。更有甚者,不少古镇更被指为“假古镇”、“人造古…

    煤都“美白”记:鄂尔多斯的科技与狠活

    “家里有矿”的鄂尔多斯,未止步于“天资”。这座中国煤炭大市,坐拥2500多亿吨煤炭储量,占全国的1/6,每天产煤200多万吨,源源不断地输送至25个省区市,以一市之力温暖千座城、点亮万家灯。近年来,煤炭,从“燃料”过渡向“原料”,推动着鄂尔多斯从几十年前粗放式的挖煤卖…

    究竟|理想与重卡非撞不可吗:测试有无必要?结果能否证明车辆安全?

    当8吨重卡与理想i8家用SUV正面对撞,卡车车轮腾空、驾驶室前倾——这场碰撞测试,因其合理性引发持续质疑。自7月29日测试视频上线以来,理想汽车、乘龙卡车、中国汽研三方先后多次表态,强调测试非标准车对车碰撞试验、不针对卡车品牌质量等问题。随着争议升温,一系列追问也浮…

    癌还能脑转移?比中风还可怕

    原创 赵峻 小大夫漫画 北京版权声明 以上图文为熊猫医学原创 版权归熊猫医学所有 未经允许,谢绝商业转载 原标题:《癌还能脑转移?比中风还可怕!但只要早发现,90%可以救回来!》 阅读原文特别声明本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,…

    高温天“药”当心,夏季用药有讲究

    原创 张严娇 常笑健康 ▼本文作者▼夏天一到,高温多湿的天气成了常态。不光人难受,药也“难受”。这时候用药不小心,药没效果、浪费钱还是小事,让人头晕、呕吐、加重副作用,甚至危害生命才是大事! 降温避光 药品储存要当心 夏天存药,温度是个难题。人怕中暑,药也怕…

    日本派阀残影笼罩:自民党原派阀势力运作“倒石破”,长老再度活跃

    当地时间2025年8月4日,日本东京,日本首相石破茂在首相官邸回应记者提问。 视觉中国 图“石破首相,您什么时候辞职?”在8月4日举行的日本众议院预算委员会上,在野党令和新选组议员大石晃子眼神犀利地注视着石破茂。石破立即起身来到发言台的话筒前做出应答,语速飞快:“不…

    再遇见|中国欧盟商会上海分会主席代开乐:意大利愿做中欧的“桥”

    【编者按】五十年春风化雨,中欧从相识到相知,走过了半个世纪的合作之路。“志合者,不以山海为远”,这段跨越山海与制度差异的关系,如今已不仅是一份经贸数据的增长图谱,更是两大力量、两大市场、两大文明之间思想互鉴、理念交汇的深层对话。在中欧建交50周年之际,澎湃新…

    Hinton能重新坐下了,什么时候开始的?

    原创 关注前沿科技 量子位 邓思邈 发自 凹非寺 量子位 | 公众号 QbitAI AI教父Geoffrey Hinton来上海了。 他腰杆挺直,神情专注。这一坐,就是很久。 对于77岁高龄的诺贝尔奖+图灵奖双奖得主来说,这个再平常不过的动作,却是他人生中最奢侈的体验。因为过去有近18年,他…

    八旬“老兵”又一次勇救落水者,所在街道将为其申报见义勇为表彰

    时隔十六年,退伍老兵孙灶立又一次在危急时刻跃入水中。尽管已经81岁高龄,但他毫不犹豫,奋力游向落水者,并成功将其救上岸。这是7月31日上午8时许发生在上海杨浦公园内的惊险一幕。当时,一名年约八旬的阿婆在桥上行走,不慎滑入水中,桥面距离水面约两米,阿婆在水中挣扎,…

    巴西最高法院下令软禁前总统博索纳罗

    当地时间4日,巴西联邦最高法院法官亚历山大德莫赖斯宣布,前总统雅伊尔博索纳罗违规使用其三个儿子及其他国会议员盟友的社交媒体账号传播信息,“内容明显鼓励和煽动攻击最高联邦法院,并公开支持外国干预巴西司法系统”,因此下令将其软禁在家,禁止外出。莫赖斯认为,博索纳…