当特斯拉仍在为灵巧手的工程化与可靠性问题所困,当小鹏汽车公开表示灵巧手因高成本与技术难度短期内难以普及时,整个行业都面临一个共同难题:为何灵巧手数量众多,却依然难以投入实际应用?
许多产品不得不在性能、寿命与成本之间做出艰难取舍:要么为性能牺牲成本,成为实验室中的“奢侈品”;要么为成本妥协性能,沦为“精致的玩具”。
今天,我们将分享灵巧智能如何打造真正“有用的手”。
一、产业之问:为何灵巧手“遍地开花”,头部企业仍称“不实用”?
一些灵巧手品牌宣传声势浩大,甚至号称占据全球80%市场份额,但真正的产业用户为何迟迟不愿买单?答案简单而残酷:因为它们所宣传、演示甚至售卖的,往往并非产业真正需要且敢于使用的产品。
以下三个问题,或许是它们不愿透露的真相:
1)灵巧手究竟是要替代“人手”,还是“工具”?
灵巧手的目标并非二选一,而是在“替代人手”与“替代工具”之间找到平衡,其终极愿景是“替代人手”。
替代“人手”方向追求复制人类手部全部功能,实现在任何人类工作环境中无缝替代,核心设计理念是极致的通用性与拟人化,典型代表为特斯拉Optimus GEN3的22自由度灵巧手。
替代“工具”方向则主张“为何非要是手?解决问题的是一系列专用工具”,其核心是在特定任务中追求高效、可靠与低成本,典型代表为特斯拉Optimus GEN1的6自由度灵巧手。
2)哪些场景真正需要灵巧手?
以汽车制造业为例,冲压、焊接、喷涂等前序车间自动化率可达90%甚至100%,但总装车间仍依赖大量人工。这并非技术不足,而是由总装工序特性、成本效益及人机优势对比共同决定。
总装涉及成千上万零件的组装,许多步骤需根据实际情况微调、对位、卡扣,远非简单的“抓取-放置”,涵盖非标准化操作、精细操作及综合感知决策等复杂需求。
类似这样的场景正是灵巧手的核心应用点——狭窄空间的精细感知与微动操作,需要手、感知与大脑的协同作业。
3)为何灵巧手必须与场景深度结合?
灵巧手的“灵巧”并非固有属性,而是在特定环境与任务中通过物理交互涌现的能力。脱离具体场景,灵巧手便失去存在的价值与意义。
首先,硬件设计由场景需求驱动。工业装配可能仅需“三指手”完成抓取、插入等重复任务,而弹钢琴演奏则需要“五指”协同。
其次,控制算法的有效性高度依赖场景知识。灵巧手控制极为复杂,其智能体现在算法上,而算法的效能完全取决于对场景的理解。未与场景结合的灵巧手仅能执行预设轨迹,无法适应微小变化;而与场景深度结合的灵巧手,通过视觉、力觉、触觉等传感器实时获取信息,调整抓取力、姿态与手势,实现鲁棒且柔顺的操作。
最后,学习与训练数据源于场景。现代灵巧手控制日益依赖机器学习(尤其是强化学习与模仿学习),而模型性能严重依赖于训练数据的质量与广度。
二、灵巧智能的解决方案:突破“不可能三角”,以操作的“力”为核心,打造“有用的手”
绳驱(腱绳传动)被公认为实现类人灵巧手的理想路径,国内灵巧手企业众多,空心杯电机与腱绳供应链成熟,为何绳驱灵巧手厂商不足5家?答案简单而残酷:绳驱手的设计难度、量产工艺与可靠性挑战劝退了大多数玩家。
灵巧智能选择以机械与控制的复杂性,换取本体结构的轻量化与拟人化,并在此技术路径上提出以下实践:
1)硬件灵巧手:以“力”为核心,解决“用手难”问题
灵巧智能绳驱灵巧手产品线涵盖3款产品,分别面向不同客户与场景:
通用版五指DexHand 021:首款量产绳驱五指灵巧手,面向科研、教育、数据采集、具身智能及生化等行业。通过130套模具实现741个零件的标准化生产,确保产品公差一致性;配备主动散热系统,支持长时间使用;通过腱绳涂层与绳头端子设计,解决腱绳蠕变与干摩擦问题。是目前唯一投入高频数据采集应用的高自由度绳驱灵巧手。
入门版三指DexHand 021S:视触双模、双拇指构型的三指灵巧手,适用于教育、具身智能、工业及农业等场景。无需复杂模型驱动,通过双拇指构型(弯曲+旋转)实现约70%人手功能,结合掌心视觉与指尖触觉,扩展多场景操作任务,为入门用户提供具身智能最优选。
专业版腕手一体五指DexHand 021pro:具备双绳双向传动、全掌感知与端侧算力的腕手一体五指灵巧手。通过“外力”触觉感知与“内力”传动控制,不仅具备端侧抓取规划的智能化能力,更实现抓取控制的力控能力。
2)高质量数据:以“力”为核心,破解“数据稀疏性”难题
机器人具备三大智能:运动智能、交互智能与操作智能。交互智能核心在于利用大语言模型实现人机情感交互;运动智能核心是“非接触”,使机器人掌握平衡与协调;而操作智能核心在于“接触”,不仅关乎手部状态与被操作物体,更与手-物接触关系,尤其是“接触力”信息密切相关。
基于此,灵巧智能开发两款产品:
DexCap数据采集外骨骼:通过人类“遥操作”示教机器人,在灵巧手与物体接触时,结合触觉传感器与指尖振动力反馈,实现沉浸式操作与数据采集。
桌面手部动捕与触觉手套:旨在捕获人类操作数据,包括主视角操作视频、上肢(含手指)运动轨迹、被操作物体物理特性及手-物接触力等多维度信息。今年9月底,灵巧智能重磅开源DexCanvas数据集。
3)操作模型:以小参数量模型,逐步解决“手的操作”难题
手是人类极为精妙的器官,既是感知外界的窗口,也是执行动作与实现交互的关键载体。从出生到十岁左右,人类通过持续的手部互动,构建“手—感知—大脑”协调的发育闭环。将此映射至灵巧手发展,可见其运动能力已高度逼近人手,但“脑力”——即认知与决策能力——仍处于类似人类三岁阶段,目前仅能实现有限抓握功能。
古人云“隔行如隔山”,又道“纸上得来终觉浅,绝知此事要躬行”,皆揭示“行业操作数据”与“知行合一”的深刻价值。与参数动辄超过300亿的大规模视觉语言模型不同,灵巧智能更聚焦于“Action”本身:
一方面,通过多维数据采集与高保真物理仿真增强,构建参数量为30亿级的灵巧操作基础模型;另一方面,与场景需求方深度协同,共建真实环境中的数据采集工厂,在垂直场景中系统获取操作数据,训练高度适配的专用操作模型。
灵巧手正站在从“演示可行”到“应用可用”的关键十字路口。破解困局之道,并非追求参数上的极致拟人,而在于回归“有用”这一本质:通过硬件、数据与模型的深度融合,在真实的产业场景中,将无形的智能转化为精准可控的“操作力”。道虽远,笃行可至;事虽巨,坚为必成。我们坚信,当灵巧手能像人手一样,在纷繁复杂的世界中可靠地完成一个又一个具体任务时,它所触及的,将不仅是冰冷的机器与零件,更是通用智能机器人与我们共同未来的大门。
本文链接:特斯拉与小鹏的机器人灵巧手破局——灵巧智能何以打造“有用的手”?http://www.sushuapos.com/show-3-158608-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 京东个护小家电补贴立省15%加赠“买1件送1年”好礼
下一篇: 全球十大黄金外汇交易平台金融市场排名