您当前的位置: 中国广告营销网 > 动态

华为云:大模型时代的机器人开发与应用探索

来源:盖世汽车 阅读量:12717 时间:2025-03-26 19:13   
导读智能机器人的细分领域中,工业仓储机器人成为投资热点,2024年融资额激增至35亿美元,同比飙升90%,特别是泛机器人领域的投资增长了7至8倍,相比之下,家庭服务机器人融资则下降了40%。 2025年3月13日,在第三届具身智能机器人产业发...

智能机器人的细分领域中,工业仓储机器人成为投资热点,2024年融资额激增至35亿美元,同比飙升90%,特别是泛机器人领域的投资增长了7至8倍,相比之下,家庭服务机器人融资则下降了40%。

2025年3月13日,在第三届具身智能机器人产业发展论坛上,华为云计算技术有限公司具身智能产品孵化负责人张靖坦言,当前,具身智能面临两大技术难关,一是算力稀缺,二是数据匮乏,现有数据总量有限且任务类型单一、碎片化,难以适应复杂应用场景。例如,多数数据仅适用于单臂机器人在桌面操作的任务,双臂机器人的相关数据则更为稀缺。

对此,华为云提出了利用少量真实数据合成高质量数据的方法。同时,华为还开发了集数据平台、训练平台、运行平台于一体的具身智能开发与运行平台。

华为云计算技术有限公司具身智能产品孵化负责人

以下为演讲内容整理:

具身智能产业观点分享

具身智能的应用范围十分广泛,从最初的规则驱动型机器人,仅能满足一些最基本的智能需求,且面临的技术挑战相对较低,到如今随着智能技术的持续进步与挑战的不断升级,其应用范围正日益拓展。在下一个发展阶段,具身智能或许能在某些规则化的区域内实现有限度的自动驾驶。诸如在矿区、港口等地,我们已能目睹一些自动驾驶车辆的身影,乃至当前在开放道路上进行的自动驾驶测试,均可视为具身智能应用的一个重要分支。

图源:演讲嘉宾素材

另一个具身智能应用的广泛领域在于通用智能机器人及计算设备,近年来,诸如XR等设备层出不穷。事实上,学术界对于具身智能机器人的研究早已展开。值得注意的是,自2023年起,众多大型企业开始积极涉足具身智能领域的学术研究。而步入2024年,越来越多的初创企业亦投身于这一领域,展现出极高的活跃度与积极性。

众多初创企业及产业投资者已通过资金投入表明了他们的立场。据统计,2024年Top 10的初创企业在该领域的融资总额约为35亿美元,同比增长率高达约90%。特别值得关注的是,对于那些尚未明确具体使用场景的通用机器人的投资呈现出爆发式增长,投资金额从2.8亿美元激增至14.8亿美元,增幅约为7至8倍。关于通用机器人的应用领域,人们或许会联想到家庭服务,而其实际落地之处则可能是工业仓储等领域。从当前趋势来看,至少在2024年的表现中,工业仓储机器人的投资增长更为显著,相比之下,家庭服务机器人则遭遇了一些冷遇,其融资情况与前一年相比下降了40%。

在国内,北京、上海、深圳等城市都在积极建设具身智能应用和数据基地。

具身智能的技术挑战

当前市场上,采集机器人数据的方式主要有几种。比如特斯拉采集的数据质量上乘,但成本极为高昂,数据的多样性相对不足。此外,谷歌等公司则更倾向于利用互联网数据,例如通过观看视频来学习技能,但这类数据的质量普遍较低,因为它缺乏三维世界的相关信息。华为云认为,一条更为合适的路径是基于少量的真实数据,通过合成技术生成高质量的数据。

华为云布局与进展

华为云致力于服务于整个产业链上游,涵盖最终使用机器人的企业客户、组装具身智能解决方案的集成商,以及机器人本体的制造商。我们观察到,在这一链条中,软件技术是一个显著的缺失环节。因此,针对这一使用上的空白,我们开发了一个一站式支撑智能开发与运行的平台。该平台包含三个核心模块:数据平台、训练平台与运行平台。

图源:演讲嘉宾素材

数据平台方面,我们的主要职责是进行数据的重建、增广与合成。训练平台则基于这些经过重建与增广的数据,对具身智能的“大脑”与“小脑”进行训练。最后,运行平台负责管理所有运行中的机器人,使我们能够一站式地感知与管理所有机器人,包括它们的位置与运行状态。

我们采用自有设备,在不同地点进行数据采集,并对采集到的数据进行重建。在龙岩烟厂的生产现场,我们进行了一次采集,并呈现了重建结果。整个重建过程无需人工干预,仅需数小时的自动处理即可达到效果,重建质量相当可观。

此外,在我们的园区也进行了一次采集。重建结果不仅具备视觉真实性,我们还对其进行了混合表征处理,使其既保留了3D重建的视觉真实效果,又融入了深度信息及语义信息。基于一次重建结果,我们能够生成适用于不同高度机器人的数据。例如,在开发机器狗与人形机器人时,由于它们的视角差异,我们不希望为了适配不同机器人而多次采集相同数据。因此,只需进行一次数据采集,即可根据不同机器人的形态与高度,对数据进行调整与再生成。

我们认识到,实际采集的数据往往缺乏多样性,因此在构建具身数据时,我们致力于解决这一问题。例如,在训练机器人抓取杯子时,我们期望机器人不仅能在木桌上成功执行,也能适应大理石桌面等其他环境。因此,在仿真环境中,我们会模拟这样的纹理变化,光照条件也是我们改变的另一个变量。

在仿真器中,我们实现了机器人在重建环境中学习抓取药品的任务。通过重建整个环境,机器人能在该环境中学习如何抓取并拧开药品。这种方法不仅提高了数据的多样性,还有助于机器人更好地适应各种实际环境。

在进行仿真模拟时,其核心在于拥有一个强大且高效的渲染引擎与物理引擎。在此,我们采用了华为自主研发的引擎,该引擎基于O3DE进行开发,并且支持开源,用户可以通过插件机制来调用主流的开发引擎。这款引擎的渲染效果极其高保真,其光影效果的细腻度相当高。这样的渲染引擎旨在最大程度地缩小现实与仿真之间的差距,从而在高保真的环境下,更好地辅助机器人学习各种技能。

行业中一些重要的工作通常是通过实际采集数据结合3D policy learning来学习单一任务的操作。据观察,此类操作的成功率大致在80%左右,这是其上限。对于更复杂的柔性任务,如叠衣服,成功率可能会更低。然而,如果我们采用全仿真合成数据结合policy learning的方法,任务成功率能达到约87%。这基本验证了模拟仿真的可用性,并已应用于我们的产品中。

我们的目标是统一整个生态,因为该产业中存在众多不同品牌,可能各自拥有独立的平台。但我们发现,更多的终端企业希望采购多家机器人,并在统一的平台上管理这些不同品牌、不同结构的机器人。因此,我们开发了这样一个统一的调度平台,并推出了云端控制平台和物流接口指南。这一指南是联合多家企业协会以及高校共同打造的,旨在使用户能够通过华为统一的平台来管理所有产品。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。