数据导入
数据导入用于从外部系统批量导入数据到平台。主要支持两种场景:从本地 IO Agent 设备导入 MCap 文件,以及导入 LeRobot 格式的数据集。
典型使用场景:
- 离线采集数据导入:从本地采集设备批量导入数据
- 外部数据集导入:导入 LeRobot 格式的数据集
- 数据迁移:从其他系统迁移数据到平台

数据接入方式概览
数据可通过 IO Agent、LeRobot 包或本地上传等方式进入平台,经入库或转码后出现在数据管理页面,供后续标注与导出使用。
快速上手:从 IO Agent 导入数据
什么是 IO Agent?
IO Agent 是运行在本地设备上的软件,用于管理采集到的 MCap 文件。通过数据导入功能,可以将这些文件批量导入到平台。
导入步骤
第 1 步:配置 Agent 地址
- 在导入页面,输入 IO Agent 的服务地址
- 系统会自动检测 Agent 服务状态
- 连接成功后,可以浏览 Agent 设备上的文件
第 2 步:选择要导入的文件
- 浏览 Agent 设备上的 MCap 文件
- 显示文件大小、创建时间等元数据
- 支持按名称搜索和筛选文件
- 勾选需要导入的文件
第 3 步:选择存储方式
每个文件可以选择两种存储方式:
-
云端:下载文件并上传到云存储(推荐)
- 文件会从 Agent 设备下载
- 然后上传到配置的云存储
- 适合需要长期保存的数据
-
本地:只创建数据集记录,文件仍在 Agent 设备
- 不下载文件,只创建元数据
- 文件访问依赖 Agent 设备在线
- 适合临时数据或节省存储空间
第 4 步:开始导入
- 点击"云端"或"本地"按钮开始导入
- 系统会显示导入进度
- 导入完成后,文件会出现在数据管理页面
批量导入
批量操作:
- 可以勾选多个文件进行批量导入
- 支持批量选择所有文件
- 批量导入会按顺序逐个处理
导入队列:
- 导入任务会加入队列,按顺序执行
- 可以查看每个文件的导入状态
- 支持取消正 在进行的导入任务
LeRobot 格式导入(3.4.0 新增)
什么是 LeRobot 格式?
LeRobot 是一个流行的机器人学习框架。如果你有 LeRobot 格式的数据集,可以直接导入到平台。
支持格式:
- LeRobot 标准文件夹结构
- 包含图像、视频和标注数据
- 支持压缩包(tar.gz)格式导入
格式要求:
- 符合 LeRobot 标准文件夹结构
- 包含必要的元数据文件(
meta/info.json) - 标注数据格式正确
导入步骤
- 选择数据源:选择 LeRobot 格式的文件夹或压缩包
- 格式验证:系统自动识别格式并验证数据完整性
- 数据解析:提取元数据和标注信息
- 创建数据集:自动创建数据集并关联标注
- 完成导入:导入完成后可在数据页面查看
提示
LeRobot 导入说明:
- 导入前请确保文件夹结构符合 LeRobot 标准
- 支持批量导入多个文件夹
- 导入过程会自动验证数据完整性
导入管理
如何查看导入进度?
任务状态:
- 待处理:任务已创建,等待执行
- 处理中:正在下载或上传文件
- 已完成:文件已成功导入,数据集已创建
- 失败:处理过程中出现错误,可查看错误信息
进度信息:
- 实时显示每个文件的处理状态
- 显示上传进度百分比
- 显示已处理文件数量和总数量
- 显示预计剩余时间