广西新闻网 > 图片频道 > 高清图集 > 正文 |
让机器人“长”出聪明“大脑”——全球首个通用具身基座大模型的智慧担当 |
2025年09月21日 08:05 来源:广西云-广西日报 编辑:钟玮 |
充当东博会高规格迎宾礼宾,与中外嘉宾同台见证盛会启幕;为中外记者提供东博会信息问询;热心为参会者提供展馆导览服务……这几天,在南宁国际会展中心,智元创新(上海)科技有限公司(以下简称智元机器人)的远征A2机器人大出风头。 人工智能主题展互动展区。记者 郭燕群 摄 面对高频互动,它聪明应对,人机交互稳健流畅。这,是怎么做到的? “机器人能摆脱‘遥控玩具’标签,全靠装了全球首个通用具身基座大模型——智元启元大模型。”智元机器人展位代表说,过去行业内机器人多靠人工实时操控,脱离指令就“停摆”,可以“能动能演”,却做不到“能干会用”。 机器人要自主能动,得先理清其能力构成。智元机器人团队把机器人能力拆为“本体、小脑、大脑”——本体是钢铁身躯,小脑管平衡与关节活动、步态调整,大模型就是大脑,掌管认知、学习和执行。展位代表边说边对身旁机器人指令:“帮倒杯水。” 机器人头部微动,摄像头快速扫过桌面,在分清水瓶与杯子的同时,握住水瓶、倾斜注水,还会微调角度防溢,倒至杯身2/3处便端稳了送到我们面前。 机器人是如何复制人类动作? “为了让机器人读懂物理世界,团队给大模型输入了海量互联网图片、视频数据,再通过VLM(视觉语言模型)架构,让机器人能像人一样识别物体。”智元机器人CMO邱恒解释,为了让机器人既有知识又会动手,他们团队在上海搭建了3000多平方米的数据集采厂,给100多台机器人配备人类老师,进行“手把手教学”。 “工作人员戴上动作捕捉装备,给机器人示范家务动作,抓、握、提、拉、倒……机器人同步模仿,连轻重缓急都一致。经过收集多维度的交互数据,机器人就能把人类的经验转化为自己的能力。”邱恒说。 真实世界情况复杂,怎能保证机器人不出错?大模型自带“错题本”。 “在运行过程中一旦出现任务没达成,系统就会自动标注错误案例,存入数据库,让错误不再重演。目前我们的执行准确度已经处在行业前列。”邱恒举例,在四川富临精工工厂一次连续3小时网络中,“搬运工人”智元机器人连续搬运800个箱子零差错,“现在富临精工已正式投用近百台机器人,让它们协同人类一起工作,应对柔性生产需求。” 在东博会现场,这些“聪明”的机器人,正成为智能制造的鲜活样本。“东盟市场对智能装备需求旺盛,我们希望通过东博会,让更多人看到具身智能的潜力。”邱恒表示,他们与泰国企业积极对接,希望让“聪明能干”的人形机器人为当地零售行业注入新活力。 交谈中,智元机器人展位上,多个机器人各司其职。有的与观众合影时主动比心,有的接受媒体采访时清晰回应技术问题……当钢铁身躯有了聪明“大脑”,人机协同的未来,正一步步走进现实。 |
|
扫一扫在手机打开当前页
|
>>更多精彩图集推荐 |
|