官方网站-www.yaxin333.cn-亚星(中国)有限公司

yaxin333cn亚星机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人趋势 > 机器人产业规模化的机遇与挑战,增长速度快,具身智能不够用,模型架构不够统一

机器人产业规模化的机遇与挑战,增长速度快,具身智能不够用,模型架构不够统一

来源:王兴兴     编辑:yaxin333cn亚星   时间:2025/8/11   主题:其他 [加盟]
人形机器人行业已经走到“ChatGPT时刻”的前夜,Z快1-2年就能迎来这一时刻。
王兴兴认为,由于政策支持与需求爆发,2025年上半年,人形机器人整机与零部件厂商平均实现了50%-100%的增长,幅度惊人。然而,行业内还存在几大误区:
先,人形机器人大规模应用的Z大问题,并不是硬件,而是具身智能。虽然硬件在量产工程化上仍有提升空间,但具身智能问题更为明显,还无法驱动机器人自主地完成任务,这背后的原因并不是大家普遍关注的数据问题,而是模型架构问题。
王兴兴称,未来2到5年,智能机器人技术的重心是端到端的具身智能AI模型。当前行业常见的VLA(视觉-语言-动作)模型,在他看来属于“傻瓜式架构”,他个人对这类模型持怀疑态度。由视频生成模型(或是世界模型)驱动机器人控制,是他眼中有望更快收敛的技术路径。
同时,机器人研究还需要在强化学习Scaling Law(扩展定律)上实现突破,从而让每次训练的速度越来越快,学习新技能的效果越来越好。随着机器人日益普及,分布式的算力将成为大势所趋,有望突破机器人本体搭载算力的限制,并满足实际应用过程中对安全性和通信延迟的要求。
王兴兴还在演讲中回顾了宇树科技的发展,从2013年研发机器狗X dog原型机开始,并获得8万元的D一桶金,再到2023年应客户需求推出一款人形机器人,他认为,机器人与AI的发展始终是一个共创的过程,他也鼓励更多企业和G校参与到这一过程中。
以下是王兴兴部分精彩演讲内容的整理(机器人前瞻在不改变原意的前提下,进行了一定程度的增删修改):
我分享一下我个人对人形机器人行情的看法。今年上半年,Z大的特点就是由于机器人行业非常火爆,以及政策的相关支持,整机厂商、零部件厂商,平均实现了50%到100%的增长。增长幅度还是非常吓人的,这对整个行业而言都是十分罕见的,需求端拉动了整个的行业的发展。
海外市场方面,特斯拉作为行业代表,计划今年量产数千台人形机器人,并将发布第三代Optimus人形机器人,值得重点关注。此外,企业对机器人行业的热情G涨,包括英伟达、苹果、Meta、OpenAI等企业都持续在推动这一领域的发展。

我分享几个个人的观点,未必准确。

D一点,对于机器人本体来说,很多人可能会有这样一个误区:机器人目前没有大规模应用、功能不够完善的原因,是硬件不够好,或者成本比较G。
其实目前的硬件,无论是整机还是灵巧手,从某种意义上来说完全是够用的。当然不够好,还需要优化,更大的问题是量产,工程上的问题肯定是很多的。
但是在技术层面上,或者从AI的角度来说,目前的硬件是完全是够用的。目前Z大的挑战还是具身智能,或者说AI技术的发展,完全不够用。这也是限制当前机器人,尤其是人形机器人大规模的应用的Z大问题。
目前,机器人行业所处的位置,就像是ChatGPT诞生前的1-3年左右,目前业界已经发现了类似的方向以及技术路线,但是没人把它做出来。
图片
ChatGPT出来的前几年,做语音AI的已经做了十几年,近二十年了,但是大家一直觉得他很傻瓜,很弱智,根本完全没法用。ChatGPT出来后,它实现了比一般人还要强的能力。机器人还没有到达这一临界点。
对于机器人的AI技术,我觉得临界点可能是这样的:当一个人形机器人能够进入一个完全陌生的环境(比如从未见过的会场),我跟他说“把这瓶水带给某位观众”,或是“整理一下这个房间”,而它能够顺畅自主地完成任务,这就是人形机器人的ChatGPT时刻。
如果进展快的话,可能未来的1-2年或者2-3年,我们就能实现这一目标,Z慢的话3-5年也有很大概率能实现。
目前,具身智能不够用的问题,究竟是模型还是数据导致的?我反而感觉目前范围内,大家对机器人数据这个问题的关注度有点太G了。现在Z大的问题是反而是模型的问题,并不是数据问题。
对于具身智能和机器人来说,模型架构都还不够好,也不够统一。大家对模型问题的关注度G,反而对数据的问题关注很多。因为在大语言模型领域,大家觉得我有足够多的数据,尤其有足够多的好的数据的时候,我就能把模型训练的越来好。
但是在具身智能,在机器人领域,大家可以发现,很多情况下有了数据,会发现这个数据用不起来。
相对比较火的就是VLA模型。VLA是一个相对比较傻瓜式的架构,我个人对VLA模型还是保持一个比较怀疑的态度。VLA模型在与真实世界交互时,它的数据质量、能采集的数据是不太够用的。
有个简单的想法,就是在VLA模型上面加一个RL的训练,这是一个非常自然的想法。但是我个人感觉,包括我们公司目前尝试下来VLA模型加RL训练,我觉得还是不够的,模型架构还是得再升J和优化。
这里也简单分享一下我们过去做的一些事情。大家也可以关注到,谷歌发布了他们全新一代的视频生成模型,或者某种意义上是一个视频驱动的一个世界模型。还有,去年的时候,当OpenAI发布了视频生成模型以后,大家会有一个很自然的想法:我可以控制一个视频生成模型,跟他说“帮我生成一个机器人,去整理一下房间”。
如果模型生成的视频中,机器人可以完成任务,那我是不是能让这个视频生成模型直接去驱动一个机器人完成任务。这个想法非常简单直接,我们去年的时候就去做了这个事情。
大家可以看到,右上角的视频其实是生成出来的,不是用摄像头采集的。我们用一个预训练的视频生成模型,重新训练了一下,让他先去生成一个机器人动作的视频,然后再控制一个机器人去做,这个技术是能实现的。包括谷歌的视频生成世界模型,他们也想实现这个效果。
图片
我觉得这个路线的方向可能会比VLA模型发展得要快,收敛概率还更大。但我不敢打包票,可能还是有很多问题。其中有个很大的问题就是,视频生成模型太关注视频生成的质量了,导致对GPU的消耗有点大。
对机器人干活来说,某种意义上你并不需要很G精度的视频生成质量,你只要驱动机器人去干活就行了。大家可以关注谷歌的视频生成模型,还是非常有意思的。整个模型的架构还是非常简单粗暴的,就是把机器人的一些动作序列控制,直接对齐到模型的架构上。
图片
另外一点,大家也知道,目前机器人跳跳舞、打格斗效果其实不错了,但实际上面临一个很大的问题,如果要进一步机器人能力提升,也就是机器人RL的Scaling Law,还是做得非常不好。
举个Z简单的例子,我训练一个机器人做新的动作、跳新的舞蹈,都要重新训练,还是从头开始训练,这是非常不好的一个事情。我们是希望机器人每次做一个新的训练的时候,可以在过去训练基础上进行。
理论上我做RL训练的时候,每次训练的速度应该越来越快,学习新技能的效果越来越好。但是全行业内,目前整个机器人在RL的Scaling Law,没有人做出来,做好。我觉得这是非常值得做的一个方向。
因为RL Scaling Law在语言模型上已经是充分验证过的事情。但在机器人的运动控制上面,大家才刚刚开始。
我个人感觉,在未来2到5年,智能机器人技术的重心是端到端的具身智能AI模型。我觉得模型本身是Z重要的。
然后就是更低成本的,更G寿命的硬件,这个是毋庸置疑的。大家也知道,哪怕对于汽车行业来说,已经一百多年了,哪怕到今天,一家企业要做很好的一辆汽车出来,工程量还是非常大的。
对机器人行业来说,未来如果每年要生产制造几百万、几千万甚至几亿的人体机器人,它的工程量挑战还是非常惊人的。
同时,低成本的大规模的算力也很重要。在人形机器人上,或者在移动机器人本体上,其实没办法直接部署大规模的算力。它的尺寸只有这么大,它的电池只有这么大,它部署算力的功耗是有限制的。
我个人感觉在人形机器人上,Z多只能部署峰值功耗为100瓦的算力,平时工作的时候算力只有小几十瓦,简单说就只有大概几个手机的算力水平。
但是,未来机器人还是需要大规模算力的,而且我觉得可能是分布式的算力。机器人干活的时候,我们希望其通信延迟比较低的,如果在北京干活的机器,数据中心在上海或者在内蒙,延迟实在是太大了。
我个人感觉,未来在工业领域大规模运用人形机器人时,工厂里面可以有个分布式的服务器,所有的机器人直接连接工厂里的局部服务器就好了。服务器的安全性、通信延迟是可以接受的。
或者换一个话题,如果一个小区每家每户有一个机器人的时候,在这个小区可能是有分布式的集群算力中心的,可以保证延迟与安全性。并且,如果有新客户想买一个人形机器人的时候,他不需要给这部分算力的建设花钱,成本也会更低很多。
我觉得分布式算力会是机器人行业未来非常重要的一个领域,可能比目前算力的分布还要更广一些。
另外一点,大家也知道,在AI领域、机器人领域一直是一个共创的过程。ZG的企业、美国的企业,包括英伟达等,已经做出了很多贡献。

在AI领域,没有一家大公司能保证,只要有足够的人、有足够的资源,我就能永远L先。OpenAI和DeepSeek已经证明了,AI的创新永远伴随着一些随机性,伴随着更多的聪明年轻人的。所以很多情况下都是很多公司、G校做出的贡献,还是要共创出来的。


精密减速器:群雄逐鹿,新的篇章-市场规模达 91 亿,减速器迎来全新机遇

精密减速 器市场呈现出“高端由外资主导、中低端由国产加速替代”的竞争格局;工业机器人稳步增长,人形机器人最潜力的下游应用场景

机器人旋转关节核心部件,精密减速器国产替代正当时-谐波+行星为当下主流方案

当前人形机器人关节模组精密减速器可分为谐波减速器,RV 减速器,行星减速器和摆线针轮减速器,减速器企业工艺水平不断提升,国产减速器供应能力日益增强

人形机器人市场规模,它还能有多大-2050年市场价值可能达到3万亿

拟人化机器人的市场规模可能高达2400亿美元,这一 估计是基于拟人化机器人在家庭和制造环境中的规模化运行潜力,麦格理暗示到2050年市场价值可能达到3万亿美元

7个关于人形机器人的关键要点:市场,技术,劳动力短缺解决方案,成本削减,投资机会,社会影响

人形机器人市场即将迎来指数级增长,未来可能影响75%的工种和40%的员工;成本正快速暴跌,降幅达40%,现大规模采用将成为可能;开启一个前所未有的丰裕时代

人形机器人运动控制:制约商业化落地进程的关键环节,确保机器人能够完成复杂的任务,进入各种生态场景

在软件算法层面,机器人的运动控制可以分为基于模型的控制和数据驱动控制;二者相结合的混合控制方式,兼顾了控制精度和适应性,大大提高了人形机器人的运动和作业能力

具身智能——决定 机器人泛化能力天花板的“大小脑”,分层具身大模型和端到端大模型

端到端大模型:能够直接实 现从人类指令到机械臂执行;分层具身大模型是不同层次模型协作, 上层大模型进行感知与决策,底层硬件层和中间响应快的小模型进行决策的分解与执行

全栈式智能服务机器人生态价值体现:终端用户、生产厂商、行业生态

智能服务机器人生态意味着更加便捷和高效的用户体验;提供了机器人之间的相互协同和调度的能力;降低技术壁垒,促进不同厂商和服务提供商之间的无缝集成

2025具身机器人行业现状及未来趋势分析报告-科研教育市场‌2万台,工业级人形机器人单价降至$3万

规模化生产降本‌:BOM成本年均下降18%,2027年工业级人形机器人单价降至$3万;谐波减速器国产化使关节模组成本降低40%;有望重构 1.5 万亿劳动力市场

智能机器人产业2025年投资策略报告:智启量产,星辰可及,百万台年产量,市场规模接近4000亿

预计2025年全球具身智能机器人出货量 至少达到2万台以上。我们中性预测,至2030年全球具身智能机器人出货量或达263 万台,市场规模望接近4,000亿元

人形机器人产业梳理之二:爆发元年,空间无限,需求或达百亿,潜在收入超10万;

人形机器人市场规模有望超越新能源汽车和智能手机,长期需求或达百亿台级别(马斯克预测人机比例2:1),潜在收入超10万亿美元;地方政策聚焦技术攻关、场景应用和产业基金支持

通用具身服务机器人生态的5个泛化性

服务机械臂采用了灵活的抓取技术使机器人能够识别和适应不同类型的物体;灵巧手的出现带来了更强的精细化操作能力;多任务处理能力使得机械臂在多种应用场景中都具有价值

通用具身智能机器人的多元形态:专用+类人形+人形

人形机器人并非唯一的终极形态,而是多种形态互补共生的过程;专用机器人、类人形机器 人与人形机器人将各自承载着不同的功能定位 ,构成服务机器人生态的核心支柱
资料获取
机器人趋势
== 资讯 ==
机器人产业规模化的机遇与挑战,增长速度快
精密减速器:群雄逐鹿,新的篇章-市场规模
机器人旋转关节核心部件,精密减速器国产替
人形机器人本体研究(一):宇树科技,10
2025养老机器人行业政策-《互联家庭环
养老机器人研究,近万亿级机器人市场,生态
人形机器人市场规模,它还能有多大-205
7个关于人形机器人的关键要点:市场,技术
2025~2035元趋势报告(机器人)-
山东省“人工智能+教育”实施方案2025
2025具身机器人行业未来展望报告-当前
机器人和嵌入式边缘AI应用设计的计算平台
人脑与机器人大脑对应关系:大小脑对中央控
人形机器人运动控制:制约商业化落地进程的
山东省机器人产业高质量发展行动计划(20
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  展厅机器人  服务机器人底盘  核酸采样机器人  智能配送机器人  导览机器人 
版权所有 yaxin333cn亚星智能机器人集团股份有限公司 运营中心:北京 清华科技园九号楼5层 生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728