数据上传
功能概述
艾欧数据采集设备支持一键批量自动上传,一般不需要用户手动上传数据。除非是来自外部系统的数据。可以联系艾欧对接适配,以尽量实现自动化上传流程,无需手动上传。
平台支持多种格式的数据文件上传和在线处理。平台提供智能转码、格式校验、进度监控等功能,确保数据能够顺利进入标注流程。

主要功能
多格式文件支持
机器人数据格式
平台支持多种机器人数据格式:MCAP文件作为机器人多模态数据的标准格式,推荐用于机器人数据;BAG文件作为ROS机器人数据的标准格式,支持自动转换为MCAP;HDF5文件作为科学计算数据格式,支持机器人状态数据。
媒体文件格式
支持主流的媒体文件格式:视频文件包括MP4、AVI、MOV、MKV等,音频文件包括MP3、WAV、AAC、OGG等,图片文件包括JPG、PNG、BMP、TIFF等。这些格式覆盖了绝大多数数据采集场景。
自动格式转换
系统提供智能的格式转换功能,支持多种格式自动转换为标准的MCAP格式:
视频转MCAP:
- 支持MP4、AVI、MOV、MKV等主流视频格式
- 在浏览器中实时转换,无需服务器处理
- 可配置转换参数:
- 图像画质:20%、50%、70%、100%(默认70%)
- 视频帧率:自动、10 FPS、15 FPS、30 FPS(默认自动)
- 包含音频:可选择是否保留视频中的音频轨道
- 转换过程显示实时进度
- 转换后的MCAP文件自动上传
音频转MCAP:
- 支持MP3、WAV、AAC、OGG等主流音频格式
- 自动提取音频采样率、声道数等元数据
- 将音频数据转换为ROS标准的AudioData消息格式
- 支持多声道音频处理
- 音频消息频率固定为10Hz,确保与机器人数据同步
BAG转MCAP:
- 支持ROS1和ROS2的BAG文件格式
- 自动提取所有话题和消息
- 保持时间戳和消息结构完整性
- 转换后的MCAP文件可在平台中正常使用
浏览器兼容性检测:
视频转换功能需要浏览器支持MediaStreamTrackProcessor API,目前只有最新版本的Chrome和Edge浏览器支持此功能。
平台会自动检测浏览器是否支持视频转换:
- 兼容浏览器:Chrome 94+、Edge 94+(完全支持)
- 不兼容浏览器:Firefox、Safari等(会显示明确的错误提示)
- 自动检测:上传视频文件时,系统会自动检测浏览器兼容性
- 友好提示:不支持时会提示用户使用Chrome或Edge浏览器
如果您的浏览器不支持视频转换,建议:
- 使用最新版本的Chrome或Edge浏览器
- 或者先将视频转换为MCAP格式后再上传
- 联系技术支持获取其他解决方案
项目与存储管理
项目选择
系统显示所有可访问的项目,包括个人空间、共享项目、私有项目等不同类型。根据用户权限显示可访问项目,确保数据安全和访问控制。
云存储选择
支持多种云存储服务:腾讯云COS(支持多个地域)、阿里云OSS、华为云OBS、自建MinIO存储等。用户可以在不同存储间切换,选择最适合的存储方案。
智能上传功能
拖拽上传
支持文件拖拽到上传区域,可以同时上传多个文件,甚至支持整个文件夹上传。这种直观的上传方式大大提高了用户体验。
进度监控
实时显示每个文件的上传进度,包括当前上传速度、剩余时间等信息。当上传失败时,系统会显示具体的错误原因,帮助用户快速定位问题。
断点续传
当网络中断时,系统会自动恢复上传,确保文件上传完整性。同时具备重复上传检测功能,避免重复上传相同文件,节省时间和带宽。
软删除数据集恢复:
平台支持智能的数据集恢复功能。当您重新上传之前已删除(软删除)的数据集时:
- 自动检测 - 系统会自动检测是否存在同名的软删除数据集
- 恢复选项 - 如果检测到软删除数据集,可以选择:
- 恢复现有数据集 - 恢复软删除的数据集,保留原有的标注、任务关联等信息
- 创建新数据集 - 忽略软删除的数据集,创建全新的数据集记录
- 数据保护 - 恢复操作会保留数据集的所有历史信息,包括:
- 原有的标注数据
- 关联的标注任务
- 数据集标签和元数据
- 访问和操作日志
数据恢复建议:
- 如果数据曾被误删,建议选择"恢复现有数据集"以保留历史信息
- 如果是全新的数据文件,可以选择"创建新数据集"
- 恢复的数据集会自动从回收站中移除
数据预处理
格式校验
系统会自动验证文件格式是否正确,检查文件是否损坏,检测视频/音频编码格式,检查视频分辨率和帧率等。这些校验确保上传的数据符合平台要求。
自动转码
提供智能的转码功能,确保数据在平台中能够正常 使用:
视频转码:
- 将视频转换为标准MCAP格式
- 支持自定义画质和帧率设置
- 自动处理视频编码格式
- 保持视频质量的同时优化文件大小
音频转码:
- 将音频转换为MCAP格式的AudioData消息
- 自动提取音频元数据(采样率、声道数、格式等)
- 转换为ROS标准消息格式
- 保持音频质量,支持无损转换
格式标准化:
- 自动将不同来源的数据统一为标准格式
- 处理编码差异和格式兼容性问题
- 确保数据在平台中能够正常播放和处理
压缩优化:
- 自动压缩大文件以减少存储空间
- 在压缩的同时保持数据质量
- 支持选择压缩级别
- 优化传输速度
元数据提取
系统会自动提取各种元数据:视频信息(时长、分辨率、帧率等)、音频信息(时长、采样率、声道等)、机器人数据(传感器数据信息)、时间戳(数据采集时间)等。这些元数据为后续的数据管理提供重要信息。