工业机器人应用

全国首个！成都创新团队发布机器人多模态模型

时间:2024-08-15 作者:系统超管来源:系统超管

成都人形机器人创新中心在我国多模态模型应用于人形机器人领域的率先突破，使“AI 物理化”进程加速，也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力。

8月12日，成都人形机器人创新中心发布最新研发成果：中国首个机器人多模态模型RRMM（Raydiculous Robot Multimodal Model）及双臂协作系统RTACS（Raydiculous Two-Arm Cooperation System）。多模态模型（RRMM）能使机器人理解推理抽象的语义指令，并调度双臂协作系统（RTACS）执行任务。目前仅OpenAI等国外头部企业发布类似成果，这标志成都人形机器人创新中心在我国多模态模型应用于人形机器人领域的率先突破，使“AI 物理化”进程加速，也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力。

多模态（即多种异构模态）数据协同推理能融合两种或两种以上不同感知来源进行综合推理，并完成复杂任务、

例如最新的ChatGPT4o展示其强大功能时，测试者不用传统的键盘输入问题指令，而是在一张纸上手写一个待解方程，以及手绘一个几何图形并用语音指令要求GPT4o解题，GPT4o通过图像识别、语音识别和语义理解及推理，快速给出准确答案，这就是典型的多模态应用。

多模态应用于人形机器人领域，使人形机器人能融合图像、语义、力感知、环境感知等多种因素，综合判断、生成任务并执行任务，这是人形机器人具有自主思考能力的关键核心技术。

微信图片_20240815152556

成都人形机器人创新中心发布的相关资料显示，语义指令有相对明确的将水果和非水果、饮料和非饮料进行区分和分拣，也有相对抽象的将圆柱体和长方体物体进行区分和分拣，还有比较抽象的把可食用和不可食用物品进行区分和分拣，完成以上任务需要机器人通过多模态模型自主对所有物品进行提取归纳，特别是对多个相似瓶子形状的物体，需进一步通过瓶身包装上的文字、图片等要素综合判断其是否为可食用，而非化妆品、洗涤剂等非食用瓶装物，才能最终完成任务。

免责声明：本网站部分文章和信息来源于互联网，本网转载出于传递更多信息和学习之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请立即联系管理员，我们会予以更改或删除相关文章，保证您的权利。对使用本网站信息和服务所引起的后果，本网站不作任何承诺。