登录站点

用户名

密码

商汤大装置“解题”人形机器人,一段式端到端开启具身智能的奇点时刻

已有 4 次阅读  5小时前

大模型与具身智能的融合,正在将人形机器人推向AI发展的新浪潮。

作为国内AI基础设施服务的领导者,商汤大装置将为推动人形机器人的技术创新与应用,提供领先的算力、模型和数据处理能力支撑。在本周举办的第二届中国具身智能与人形机器人创新发展大会上,商汤科技大装置事业群生态总监刘远辉分享了商汤在AI和自动驾驶领域的创新实践对于具身智能、人形机器人的借鉴价值。他指出,AI基础设施将是驱动人形机器人端到端发展的新引擎。

一段式端到端AI系统

开启人形机器人通往AGI之路

过去十年间,AI技术已在多个垂直领域突破了工业红线,成功与各行业的实际应用场景融合,但其发展仍面临诸多挑战。

比如,各行各业中的长尾场景众多,但需求规模小,而大规模的研发投入又会导致投资回报率降低。此外,行业中的AI模型种类众多,但单一模型能够解决的问题仍十分有限。机器人的发展也呈现近似趋势。大多数机器人产品仅局限于执行单一、特定的任务,缺乏足够的通用性和泛化能力,成为广泛普及与应用的一大障碍。商汤在端到端自动驾驶大模型方面的创新研发实践,为具身智能、人形机器人的突破提出了可以借鉴的新路径。传统的自动驾驶系统由多个感知小模型和规则定义的规控系统组成。在2022年底,商汤及其联合实验室提出了行业首个感知决策一体化自动驾驶通用模型UniAD,将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型中。UniAD作为“一段式”端到端的代表,相较于业内其他将感知和规控分为两个模型的“两段式”端到端方案,能够实现感知信息的无损传递,拥有更好的复杂场景理解、泛化能力和解决corner case的能力。“一段式”端到端系统完全由数据驱动,其能力将随着训练数据量的增加而实现跃迁,让自动驾驶系统和人形机器人拥有更通用、更泛化的复杂场景理解能力,有望创造自动驾驶和具身智能发展的“ChatGPT时刻”,开启自动驾驶和人形机器人通往AGI之路。而“一段式”端到端系统的训练,需要更高算力、全新数据生产管线、世界模型等作为平台支撑,带来了对人工智能基础设施需求的激增。

参考链接:https://www.sensetime.com/cn/technology-index
分享 举报