用大白话,讲一下人形机器人背后的大棋

用大白话,讲一下人形机器人背后的大棋

admin 2025-03-27 广州软文合集 1 次浏览 0个评论

用大白话,讲一下人形机器人背后的大棋

在春晚上跳秧歌的宇树机器人不会想到,仅仅过了一个多月,自己就已经在 " 节目效果 " 上落后了。

击败它的,是一台来自深圳的 " 众擎机器人 " ——丝滑流畅的斧头帮舞蹈过于完美,以至于让很多质疑中国科技发展水平的人表示这肯定是 CG 合成或者 AI 生成。

用大白话,讲一下人形机器人背后的大棋

他们不得不面对这样的一个艰难的选择:要么承认中国机器人技术先进,要么承认中国 AI 技术先进,要么承认中国 CG 制作先进。

用大白话,讲一下人形机器人背后的大棋

后来为了应对这些质疑,众擎专门拿出了第三视角的录像画面和训练花絮。结果却更令人感到惊艳——众擎的这款机器人对舞蹈动作的学习,似乎并不是依靠手动输入的程序指令,而是像人类一样,一边看着舞蹈老师的示范,一边自己模仿。

这是什么?

这就是 " 端到端 " 啊!

今天能跟着舞蹈老师学跳舞,明天就能跟着工人师傅学着打螺丝,后天就能跟着特种兵学战术动作。

这背后的想象空间,哎呀,过瘾呐!过瘾!

实际上,从 2024 年底开始,中国的机器人企业便开始了密集的新款机器人产品的宣发——云深处的轮足机器狗可以在崎岖的南方山地中随意穿梭," 华为天才少年 " 彭志晖的智元机器人已经开始在进行家务劳动训练。

这么一看,宇树机器人单纯的扭秧歌,确实在节目效果上就落后太多了。

不过,人家宇树也没闲着,你们爱怎么跳舞就怎么跳舞,人家一个机器人侧空翻视频,就又一次证明了自己的实力——这动作对于机器人的动作算法、机械性能、平衡能力的要求是相当高的。

用大白话,讲一下人形机器人背后的大棋

虽然 2025 年到现在才过去了不到三个月,但再往后的九个月时间里,关于机器人的新闻一定不会少。

更细思极恐的是:这一切,其实都已经被计划好了——早在 2021 年 12 月的《" 十四五 " 机器人产业发展规划》里就已经提出了 " 到 2025 年,我国要成为全球机器人技术创新策源地 ",在 2023 年工信部的《人形机器人创新发展指导意见》中,也提出 " 到 2025 年,人形机器人创新体系初步建立,‘大脑’‘小脑’‘肢体’等一批关键技术取得突破,确保核心部组件安全有效供给。"

只能说,出来混,说要搞出来,那就要搞出来。非如此,就显不出咱们的手段。

今天,我们就来彻底聊聊中国的人形机器人产业。

一、人形机器人的价值有多大?

人形机器人的地位,浓缩成一句话就是:这是一个官方认证的 " 颠覆性产品 "。

不要低估了 " 颠覆性产品 " 这个词,虽然最近这几年," 颠覆性产品 " 这个词已经被很多企业给玩儿坏了,搞得随便什么一个产品的发布会都要说几声 " 颠覆 "、道几句 " 炸裂 ",好像不用这些大词就不足以表达产品的先进一样。

但是,在严谨且克制的官方话语体系中," 颠覆性产品 " 这个词的含金量并没有打丝毫折扣——在 2023 年的那份,《人形机器人创新发展指导意见》中工信部一共列出了四类 " 颠覆性产品 " ——前三个分别是电脑、智能手机、新能源汽车,第四个就是人形机器人。

用大白话,讲一下人形机器人背后的大棋

官方口径里的 " 颠覆性产品 ",那就一定是颠覆性的产品。因为想达到工信部的 " 颠覆性产品 " 标准,要求是相当高的,从电脑、智能手机、新能源汽车的发展历程来看,它们无一例外都满足以下三条标准:

这款产品,必须能深刻地改变整个中国社会。

这款产品,必须能拉动万亿人民币的市场。

这款产品,必须能培养出至少五家千亿元市值的头部大厂。

言下之意就是:这款产品的普及程度一定极高、销量一定极为巨大,高到社会上大多数人都会用到,否则谈不上深刻改变整个社会。而超高的销量,也就意味着背后有漫长的产业链,不仅是几个龙头集成商的事儿,更是背后成百上千家供应商的事业。

用大白话,讲一下人形机器人背后的大棋

回想一下电脑、智能手机、新能源汽车这些年带来的变化,我们就能感受到工信部所说 " 颠覆性产品 " 的含金量——人形机器人是一个能培育出像华为、小米、比亚迪这样的超级大厂的赛道,是一个能让现在本就如日中天的大厂们更上一个台阶的赛道,是一个能够养活包括软件、硬件、应用在内各种配套产业的赛道。

也只有这样的赛道,才配得上 " 科技竞争新高地、未来产业新赛道、经济发展新引擎 " 的描述。

二、为什么一定要做成人形?

那么,人形机器人凭什么能有这么大能量呢?

凭什么可以被安上如此高的价值呢?

很简单,因为 " 人形 "。

" 人形 " 并不是一个简单的外观问题,背后的含义那是相当深刻。

" 人形 " 的真正含义是:不论在工业生产场景还是在日常生活场景,都能提供超强的通用性。

用大白话,讲一下人形机器人背后的大棋

以工业生产场景为例,人形机器人几乎是实现 " 智能制造 "" 柔性制造 " 的必要条件。

众所周知,人是最精密的机器,因为人的行动是 " 三维 " 的。

假设你现在有一个生产筷子的工厂,生产工序的最后一步就是把十根筷子塞进一个圆筒里并拧上盖子。

如果是人工操作,那么这道工序就非常容易——点出来十根筷子、一把抓起、在桌面上怼一下对齐、塞进圆筒、拧好盖子——这就是人工操作的优势,简单直白、清楚明确,干就完了。

这种简单到极致、高效到极致的操作,就是人类三维动作的优势。

不过,虽然人类的动作兼具了简洁和高效,但人类实在太脆弱了—— " 整理筷子 " 这个动作,做一次两次不算个事儿,那如果要做 1000 次 2000 次呢,要是每天连续不停做好几个小时呢?人类的小胳膊小腿儿,还能扛住吗?

这个时候,就要选择 " 自动化流水线 " 了。

自动化流水线的优势很好理解。它是机器,可以 24 小时不间断运行,不知疲倦,而且速度比人类快得多。但劣势则在于,它是 " 二维 " 的——一个人类可以轻松完成的动作,机器想做到往往需要拆分为多个步骤。

还是以 " 整理筷子 " 为例,一个自动化流水线想完成这个在人类看来非常简单的动作可能需要如下流程:

用振动盘整理散乱的筷子,用计数器点出十根筷子, 用夹具抓取 10 根筷子、同时将圆筒固定好,筷子和圆筒对齐后,把筷子塞进圆筒里,最后用伺服电机配合夹具拧紧盖子。

虽然一个动作拆成好几个步骤看上去不怎么优雅,但这样做的效率也可以很高。只是,这种把 " 简单的事情变复杂 " 的行为却有一个相当大的弊端——自动化流水线是高度定制化的,整理筷子的流水线是没办法用在整理盘子上的,想用来生产新产品,很多时候就需要重新设计、建造生产线。

你工厂的 SKU 但凡多一点,牵连的生产线升级费用那就是一大笔钱。

而这种弊端,和 " 柔性制造 "" 智能制造 " 的大趋势完全矛盾。

说到底,传统的自动流水线,它还是 " 结构化 " 的——哪怕现在有不少企业生产的 " 柔性制造 " 能力很强,本质上也不过就是把好几套动作、好几种硬件融合在一起而已。

它可能真的学了不少姿势,但其实身体并不灵活。

写到这里,我们就能知道 " 人形机器人 " 的价值了。因为人形,所以它的动作也是三维的、是不需要展开成为多个二维动作的——面对生产不同产品的任务,人形机器人只需要在软件层面改变动作方式即可,不需要像传统自动流水线那样完全另起炉灶。

相比起传统流水线,人形机器人是 " 非结构化 " 的。

理论上来说,只要算法、硬件足够强大,人形机器人就能做到和人一样的灵活——别看它现在没学几种姿势,但它身段足够灵活,以后总是能学会的。

那么,对于制造业企业来说这意味着什么呢?

首先就是响应速度可以很快,可以非常快地适应市场需要。

其次就是极大程度降低改造和升级的成本。

传统自动流水线的建设流程是相当长的,非标自动化这个行业主打的就是一个卷,你得亲身去工厂和工厂老板谈,知道人家到底想要的是什么,然后展开设计、建造、调试,后期还有维护和修理在等着你 ...... 总之整个周期可以说是相当长,也相当死板。

而且传统自动流水线的设计往往也都是 " 一次性 " 的,很多流水线在设计的时候没有什么模块化的概念,遇到升级改造就得推翻重来,旧有设计不能重复使用,设计成本和出错的概率大大增加。

最终结果就是:一旦市场有变,需要在产品上加点什么新功能、新部件,那原来设计好的东西很可能就废了。

以杭州某企业为例,2023 年底的时候,这家企业曾经开发过一种 AI 摄像机。本来风平浪静的,结果正好迎头赶上了 AI 行业火爆,市场对 AI 算力的需求提高,产品的性能需要翻倍。但遗憾的是,这家企业的生产线依旧是传统的自动流水线,改造时间极为漫长,企业不得不推迟发布时间,被对手抢了先机,原本的市场份额丢了许多。

而如果是成熟的人形机器人,这种事情就很好处理——因为三维的人形机器人是没必要展开那么多二维动作的,改造生产线的必要性也就没有那么高。

甚至,对于人形机器人来说,生产流程改造什么的,很大程度上在软件层面上就可以解决——几个程序员就能搞定的事儿,没必要停机。

基于上述种种优势,我们有理由认为:对于未来的制造业而言,人形机器人是不可缺少的一环。

三、人形机器人的成本,阻碍了推进

虽然人形机器人的前景远大,可眼前的问题简单却又难以跨越:

三个字,不赚钱。

说 " 不赚钱 " 其实有点不全面,现在靠人形机器人赚钱的路子倒也有,只是匹配不了这么高的价值——在当下这个阶段,出租机器人,让这些机器人去参加展览、演出、当吉祥物,远比让他们进工厂打螺丝赚得多——官方定价 9.9 万元的宇树 G1 机器人,在二手交易平台的租赁价格最高一度达到每天 1.5 万元,目前依旧稳定在 8000 元左右,并且供不应求。

某种程度上,这种 " 提供情绪价值 " 的吉祥物表演阶段也是机器人发展的必经之路了—— 1973 年日本早稻田大学就已经开发出了全尺寸的人形机器人 Wabot-1,本田也在 1986 年开始研发机器人的双足结构,后期更是推出了 Asimo 机器人。日本人虽然起了个大早,但最终也没有攻克成本问题—— Asimo 的租金每年高达 2000 万日元,提供情绪价值都太贵了,只能让本田自己放在展会上秀一下肌肉。

用大白话,讲一下人形机器人背后的大棋

而后面波士顿动力的阿特拉斯、特斯拉的擎天柱也是一样,虽然技术上都有不小突破,但连大规模商用的边都摸不到。

由此可见,成本降不下来,人形机器人就没有普及的可能。

对于人形机器人来说,其发展规律一定是先进厂打工,再到寻常百姓家里干活儿。原因很简单,1000 万砸在工厂里很多时候也就是听个响,甚至不够建一条产线,但对消费者来说这就是天文数字。而且工业场景比起家里还是简单、单调太多了,短期内更适合还没有进化到完全体的人形机器人发挥作用。

只不过,以目前的情况来看,今天的机器人哪怕是进厂,成本也过于高昂了些。

一家工厂购买机器人,大概率是要求人形机器人的购买、折旧、维护等综合成本小于雇佣人类工人。但当下人形机器人的价格比起用工成本还是太高了——能上产线的机器人,价格在几十万到数百万,不把这个价格打下来,机器人进厂打工就只能存在于 PPT 上。

用大白话,讲一下人形机器人背后的大棋

人形机器人这么高的成本是怎么来的?

制造成本是一方面,但真正阻挡人形机器人进一步发展的,终究还是训练成本。

2013 年波士顿动力的阿特拉斯就已经在机械性能上做到了相当高的程度,足以完成许多高难度动作。但在软件层上,阿特拉斯只能根据预先设定的 " 行为库 " 里的动作进行运动。

强如阿特拉斯,也只会那么几种姿势而已。

阻挡阿特拉斯更进一步的,表面上看是动作的灵活与丰富,本质上其实是数据和算法——人形机器人想要学会和人一样做事情,数据和算法是相当重要的。我们能看到的是机器人在前台的表演,看不到的是背后的数据和训练。

随便一个简单的动作,哪怕只是捡起一个东西,背后就需要采集上百条高质量的数据。如果想让机器人在工厂里发挥作用,那数据条数是千亿起步。

以特斯拉的 Optimus(擎天柱)机器人训练为例——为了训练它,特斯拉专门聘请了几十位动作捕捉人员,要求他们每天都要走七个小时,以保证能给机器人喂足够多的数据。但这其实远远不够,因为如果想让机器人能在工厂里干活儿,训练数据的时长在百万小时,总成本五亿美元起步且不保证 100% 成功。

要注意,这还只是机器人厂商自己组织的训练,某种程度上只能说是 " 基础课 "。而最终投入实用,不同工厂、不同岗位的行动自然也不同,机器人还得在补修 " 专业课 "。而更进阶的 " 专业课 " 学费,那就要购买机器人的工厂来自己支付了。

用大白话,讲一下人形机器人背后的大棋

不难想象,面对现阶段如此高昂的机器人训练成本,工厂们大概率是不愿意买单的。

毕竟,人形机器人的自动控制可比自动驾驶难太多了,不仅需要考虑水平面上的运动轨迹,还需要考虑三维空间里的物体运动。如果只是依靠人类的遥控和动作捕捉,根本就没办法提供足够的数据。

谷歌当初在一个厨房的场景里死磕了 17 个月,最后也就采集了 13 万条数据,机器人在这个熟悉的环境里表现得非常优秀,但只要换个环境,立刻就崩盘了——成功率从 97% 暴跌到了 30%。

过少的数据,导致现在人形机器人的功能不能 " 泛化 ",不能适应场景的切换。

所以,对于当前阶段人形机器人的发展来说,最急需解决的就是训练成本问题——如何找到一种高效的训练方法,使得人形机器人可以低成本、快速掌握岗位所需的诸多技能。

而这,恰好就撞到了各大企业的枪口上。

四、大厂们正在大力投入机器人

人形机器人的核心系统,大概可以分成 " 大脑 "" 小脑 "" 肢体 " 三部分," 大脑 " 负责的是让机器人理解指令、规划行动;" 小脑 " 负责根据规划控制动作;" 肢体 " 则是各种机械结构来具体执行动作。

或者,你也可以把大脑小脑统一归结为上半身,肢体运动什么的统一归结为下半身。

宇树、众擎这些新锐的机器人企业,有一个算一个,其实研究的都是 " 下半身 "。

而真正能让机器人发挥出强大威力的,还得是 " 上半身 "。

而不论是 " 大脑 "" 小脑 ",其实最后归根结底,都还是要靠 AI 实现的——这恰恰就是中国科技企业的优势领域了。

实际上,中国的科技企业,从阿里、腾讯到京东、美团,从华为、小米到大疆、比亚迪、塞力斯 ...... 有一个算一个,都已经在布局人形机器人了,区别只在于具体以什么样的形式进行布局。

像阿里、百度、腾讯这些大公司,虽然都开始布局这个领域,但基本上没有自己动手造机器人的身体,而是更愿意掏钱投资相关企业,或者利用自己擅长的数据技术,专门研究机器人的 " 大脑 " ——也就是那些复杂的算法和模型。

说白了,这些互联网公司更看重的是机器人的 " 软件 " 部分,而不是 " 硬件 " 部分。他们觉得,与其费劲去造机器人的外壳和零件,不如专注于让机器人变得更聪明、更智能。这些互联网公司现在就开始布局,为未来做准备。不过,他们的做法更像是 " 幕后军师 ",而不是 " 前线战士 "。

不过,值得一提的是,当前互联网巨头们在人形机器人领域的目光主要还是聚焦于通用的大模型上。现在技术还不能让机器人像人类一样直接感知周围环境并自主做出决策和行动,它们更多是依赖外部设备来获取信息。

国内几大互联网公司,比如百度、阿里、腾讯,都推出了自己的多模态大模型,比如百度的 " 文心 "、阿里的 " 通义 "、腾讯的 " 混元 "。这些模型虽然能处理多种类型的数据,但还做不到让机器人 " 活 " 起来,真正与环境互动。

不过,国内企业也在努力向 " 具身智能 " 方向发展,也就是让机器人拥有更接近人类的感知和行动能力。

以字节为例,字节跳动在机器人领域的探索从 2020 年就开始了,他们利用自己在互联网行业积累的数据优势,开发了各种大模型。2024 年,字节还发布了 GR-2 具身大模型—— GR-2 具身大模型的亮点在于它像婴儿一样学习复杂任务。

预训练阶段,它 " 观看 " 了 3800 万个互联网视频和 500 亿个 tokens,涵盖家庭、户外等场景,具备多任务学习和环境适应能力。微调阶段,通过机器人轨迹优化视频生成和动作预测,展现出强大的多任务学习能力,在 100 多个任务中平均成功率高达 97.7%。

阿里通过 " 通义千问 " 大模型成功将 AI 技术应用于工业机器人,Qwen2 系列模型开源后下载量超 4000 万,衍生模型达 5 万,并达成千万级商业订单。阿里积极投资 AI 大模型企业,覆盖月之暗面、MiniMax 等头部项目。2024 年 5 月,阿里通过 " 杭州灏月 " 增持人形机器人企业逐际动力,成为其第二大股东,强调技术落地与盈利性。

小米则不走寻常路,自主研发人形机器人。2022 年推出首款全栈仿生机器人 Cyber One,标志着小米进军人形机器人领域。

用大白话,讲一下人形机器人背后的大棋

虽未量产,但 Cyber One 已逐步融入小米自有制造系统。2024 年 6 月,小米机器人公司迁至亦庄工厂,Cyber One 开始分阶段落地,向特斯拉那样的工业制造路线靠拢。

野心最大的,也许就是腾讯了。

用大白话,讲一下人形机器人背后的大棋

别说这些互联网企业了,车企甚至都开始入局了。

2024 年,车企纷纷进军人形机器人领域,广汽推出 Go Mate,小鹏发布 Iron,小米有 Cyber One,奇瑞有 Mornine,比亚迪有 " 尧舜禹 "。就在这两天,靠着问界火起来的塞力斯也加入了战局,布局方式包括但不限于投资(如吉利)、自研(小鹏、小米、广汽)和合作开发(奇瑞)。

其实这也很好理解,车企在人形机器人领域具有天然优势,因其与自动驾驶技术相似,涉及 " 感知 + 决策 + 执行 "。AI 芯片、电机、传感器等技术可直接复用,自有工厂则为机器人落地提供了理想场景。跨界角逐已成必然趋势。

就在今天,3 月 26 日,一汽奥迪宣布国产机器人开始进厂打工,vivo 也官宣成立机器人实验室。

总而言之就是,人形机器人已经成功勾引到了中国几乎所有上台面的大型科技企业。

结尾:人形机器人依旧是中美之间的竞赛

科技的发展,是有规律可循的。

这就像是游戏里的科技树,你必须点亮前置科技,才能点亮后面的科技。

人形机器人的前置科技是 AI,AI 的前置科技是互联网。

日本虽然是最先开始人形机器人探索的国家,但很遗憾,日本的人形机器人从始至终就没有和智能化沾边——因为日本人没有点亮互联网和 AI 的科技树,只能在机电领域死磕。

但中美两国则不同,互联网、AI 都是中美两国的优势领域,所以人形机器人最终的竞争,也一定是中美两国企业之间的对轰。

美国那边有波士顿动力、有特斯拉、有 FigureAI,我们这边有宇树、智元、众擎、优必选 ...... 实际上,全球 150 多家机器人企业,超过 80 家都在国内,剩下的 70 几家不用想,基本也在北美了。

用大白话,讲一下人形机器人背后的大棋

今年往后的几个月,中美两国的人形机器人企业一定都会整出来各种狠活儿,因为融资规模摆在这,各路资本都已经开始投资人形机器人了。

在我看来,中国一定会率先在人形机器人上做出实质性的突破——原因无他,因为论起工业数据,论起工业场景,谁又能和世界第一工业国一较高下呢?

本文来自微信公众号:星海情报局,作者:星海老局

转载请注明来自亚星官网-亚星开户-亚星会员开户,本文标题:《用大白话,讲一下人形机器人背后的大棋》

每一天,每一秒,你所做的决定都会改变你的人生!