分享
智源研究院具身数据创新基座介绍
输入“/”快速插入内容
智源研究院具身数据创新基座介绍
用户2371
用户4938
2025年11月24日修改
一、详细内容介绍
2025年11月20日,北京智源人工智能研究院正式发布具身数据创新基座:智源具身一站式平台RoboXstudio、大型高质量双臂机器人真机数据集RoboCOIN、智源具身数据软件框架CoRobot,推动了具身智能技术从数据到模型再到应用的全面升级。
1.1 具身智能三大数据难题
具身数据是当前具身智能发展中最热门的话题,当前,它面临着数据孤岛、质控缺失、成本难题三大挑战。
•
数据孤岛:
具身数据格式不统一、标准缺失,导致数据处理过程复杂。同时,具身智能数据工具链分散,导致数据使用壁垒高。现状是数据相互隔离。形成“数据孤岛”。
•
质控缺失:
具身数据仍普遍存在丢帧、卡顿、静止帧、关节信息不齐、时间戳错位等记录问题。同时,还可能存在数采动作过快过慢等操作问题,缺乏质量控制措施。
•
成本难题:
具身数据生成过程依赖大量人工操作与标注,效率低。缺乏成熟平台来支撑难以规模化,设备、场地和人力综合导致数据生产成本居高不下。
1.2 CoRobot具身数据软件框架
为了解决上述问题,智源研究院自主研发了
CoRobot具身数据软件框架
,构建了一套“面向异构本体、规范操作流程、提升研发效率”的软件
框架
,借此实现了
“定标准、保质量、提效率”
的三大目标。
该软件框架由5大组件构成:
•
泛本体数采工具
——支持接入各种本体和遥操作设备。
•
格式转换工具
——支持其他格式与标准格式的双向转换。
•
数据处理工具
——可处理丢帧、卡顿、关节信息不齐、时间戳错位等记录问题,标注场景、任务、运动描述信息。
•
数据管理工具
——支持具身数据的原子化存储、可视化,数据的多维度、精准筛选,目标数据集的下载命令生成。
•
模型训推工具
——支持π0、RDT、ACT、DP等具身模型训练任务的快速接入,支持参数调节与训练进度管理。
CoRobot具身数据软件框架主页
:
https://github.com/FlagOpen/CoRobot
1.3 共建RoboCOIN数据集:全球双臂机器人数据新标杆
基于CoRobot具身数据软件框架,
智源研究院联合蚂蚁天玑实验室、银河通用、乐聚、软通天擎、松灵、星海图、智平方、睿尔曼
等8家企业,以及清华大学、北京大学、中国人民大学、北京邮电大学、电子科技大学、斯坦福、伯克利和剑桥大学等高校,合作建立了一个全球“本体数最多、标注最精细、使用最便捷”的高质量双臂机器人真机数据集RoboCOIN,其具备三大领先优势:
•
本体数最多:
该数据集涉及的双臂本体数远超之前开源的数据集,包括了15款双臂机器人,数据量达到18万条,覆盖工业、家居、零售等10多个场景。
•
标注最精细:
借助CoRobot软件框架,对数据集完成了“轨迹级-段级-帧级”的三层次细粒度标注,使之成为全球标注最细的数据集。
•
使用最便捷:
依托CoRobot软件框架实现开箱即用,使之成为全球使用最便捷的数据集。
RoboCOIN数据集主页
:
https://flagopen.github.io/RoboCOIN/