跳到主要内容

标注任务

标注任务管理是平台的核心工作流。从数据到标注,再到审核和导出,每个环节都需要清晰的状态跟踪和协作机制。

典型工作流程:

  1. 创建任务:项目经理选择数据,分配给标注员和审核员
  2. 执行标注:标注员完成标注工作
  3. 质量审核:审核员检查标注质量
  4. 数据提交:审核通过后提交用于训练

平台通过状态管理和进度跟踪,确保整个流程有序进行。

标注任务界面

快速上手:理解任务状态

任务状态说明

任务在生命周期中会经历五个主要状态:

状态详解:

  • 待开始:任务已创建,标注员尚未开始工作
  • 工作中:标注员正在进行标注
  • 待检查:标注完成,等待审核员审核
  • 检查合格:审核通过,标注质量符合要求
  • 提交数据:已提交用于模型训练

如何查看任务?

任务列表视图:

页面提供两种视图模式:

  • 水平视图:按状态分组显示,每个状态一列,适合查看整体分布
  • 垂直视图:所有任务统一列表,适合搜索和筛选

筛选和搜索:

  • 按状态筛选:点击状态标签,只显示该状态的任务
  • 按项目筛选:选择特定项目,查看项目相关任务
  • 搜索任务:输入任务名称或描述关键词

任务列表

创建和分配任务

如何创建标注任务?

前置条件:在数据管理页面选择要标注的数据集。

创建步骤:

  1. 在数据管理页面,勾选需要标注的数据集
  2. 点击底部操作栏的"标注"按钮
  3. 填写任务信息:
    • 任务名称:清晰描述任务内容(如"抓取动作标注-第1批")
    • 任务描述:补充说明和要求(可选)
    • 标注员:选择负责标注的人员
    • 审核员:选择负责审核的人员
    • 所属项目:选择任务归属的项目
    • 完成时间:设置任务截止日期(可选)
  4. 确认创建

创建任务对话框

💡 建议:创建任务前,先用筛选功能确认数据状态,避免将已标注的数据重复分配。

如何分配任务给标注员?

分配方式:

  • 创建时分配:创建任务时直接指定标注员
  • 后续调整:项目经理可以编辑任务,重新分配标注员

分配建议:

  • 根据标注员的工作负载合理分配
  • 考虑标注员的专业领域和技能匹配
  • 设置合理的完成时间,避免任务积压

批量操作任务

批量选择:

  • 在任务列表中勾选多个任务
  • 支持跨页选择(选择后会在底部显示已选数量)
  • 可以按状态、项目等条件筛选后进行批量操作

批量删除:

  1. 选择要删除的任务
  2. 点击底部操作栏的"删除"按钮
  3. 确认删除操作
注意

批量删除操作不可恢复,请谨慎操作。删除任务不会删除关联的数据集,只会解除任务与数据集的关联关系。

批量分配(开发中):

  • 支持批量将任务重新分配给标注员
  • 支持批量修改任务属性

任务详情页

页面结构

每个任务都有详细的详情页面,包含:

标签页:

  1. 标注数据(dataset):默认标签页

    • 显示任务关联的所有数据集列表
    • 可以查看每个数据集的基本信息
    • 支持添加或移除数据集
  2. 批量标注(repeats):批量标注工作区

    • 批量标注模式,提高标注效率
    • 样本选择器,快速切换数据
    • 标注进度条,显示完成情况
    • 支持快速标注功能(3.3.0 新增)
  3. 问题标注(invalids):问题标注管理

    • 显示所有标记为无效的标注
    • 可以查看无效原因
    • 支持重新标注或删除无效标注
  4. 标注统计(analysis):标注数据分析

    • 显示任务中所有标注的统计信息
    • 标注描述列表和详情
    • 支持标注数据导出

侧边栏:

  • 任务基本信息(名称、状态、创建时间等)
  • 任务相关人员(标注员、审核员)
  • 任务统计(数据集数量、标注数量等)
  • 任务操作(编辑、删除、状态变更等)

如何管理任务状态?

状态变更:

在任务详情页的侧边栏,可以看到当前状态和可执行的操作:

  • 开始标注:标注员点击后,任务从"待开始"变为"工作中"
  • 提交审核:标注员完成标注后,任务变为"待检查"
  • 审核通过:审核员通过后,任务变为"检查合格"
  • 审核不通过:审核员打回后,任务回到"工作中",标注员需要重新标注
  • 提交数据:审核通过后,可以提交用于训练

权限说明:

  • 标注员可以:开始标注、提交审核
  • 审核员可以:审核通过、审核不通过
  • 项目经理/管理员可以:所有操作,包括编辑和删除
提示

任务已审核合格后,标注员不能再修改任务状态,确保数据完整性。

进度跟踪与监控

如何查看任务进度?

任务列表进度:

在任务卡片上可以看到:

  • 完成百分比:已标注数据占总数量的比例
  • 数据集数量:任务包含的数据集总数
  • 标注数量:已完成的标注数量

任务详情页进度:

进入任务详情页,可以查看更详细的信息:

  • 各数据集标注情况:每个数据集的标注完成情况
  • 标注员工作进度:如果任务分配给多个标注员,可以看到每个人的进度
  • 实时更新:页面可见性变化时自动刷新进度

进度估算:

系统会根据当前进度和速度,估算剩余完成时间,帮助你合理安排工作计划。

进度报告

平台提供多层次的进度报告:

  • 个人进度:标注员可以查看自己的任务完成情况
  • 团队进度:项目经理可以查看团队整体工作进度
  • 项目进度:项目级别的进度统计,包括所有相关任务
  • 质量报告:标注质量分析报告,包括通过率、准确率等

质量控制

审核流程

审核机制:

  • 人工审核:审核员逐一检查标注质量
  • 自动检查:系统基于规则进行初步质量检查
  • 抽样审核:对部分标注进行重点审核
  • 全量审核:对所有标注进行全面审核

审核操作:

审核员在任务详情页可以:

  1. 查看标注结果
  2. 检查标注是否符合标准
  3. 通过或打回标注
  4. 添加审核意见和反馈

审核不通过处理:

如果审核不通过:

  • 任务状态回到"工作中"
  • 标注员可以看到审核意见
  • 标注员需要根据意见修改标注
  • 修改后重新提交审核

质量指标

系统通过以下指标评估标注质量:

  • 通过率:一次通过审核的比例,反映标注质量
  • 准确率:标注准确性的统计,需要人工评估
  • 一致性:不同标注员间的一致性,用于评估标注标准
  • 完整性:标注完整性的检查,确保没有遗漏

这些指标帮助识别需要改进的地方,提升整体标注质量。

快速标注功能(3.3.0 新增)

什么是快速标注?

快速标注功能简化了标注流程,减少操作步骤,提高标注效率。

功能特点:

  • 快速创建标注,减少操作步骤
  • 支持批量标注模式
  • 自动保存标注进度
  • 简化标注流程

使用场景:

  • 大量相似数据的快速标注
  • 简单标注任务的批量处理
  • 提高标注员的工作效率

如何使用:

  1. 进入任务详情页
  2. 切换到"批量标注"标签页
  3. 使用快速标注功能进行标注

数据导出与集成

如何导出标注结果?

标注完成后,可以在任务详情页的"标注统计"标签页导出数据:

导出格式:

  • LeRobot:LeRobot 框架标准格式
  • HDF5:科学计算常用格式
  • JSON:通用数据格式
  • 自定义格式:根据需求配置导出格式

导出选项:

  • 全部标注:导出任务中的所有标注
  • 新增标注:只导出新增或修改的标注
  • 按时间范围:导出指定时间范围内的标注
  • 按数据集:选择特定数据集导出

批量导出:

支持批量导出多个任务的标注结果,方便大规模数据处理。

训练数据准备

导出后的数据可以直接用于模型训练,平台还提供:

  • 数据清洗:自动清洗和预处理标注数据
  • 格式转换:转换为模型训练所需格式
  • 质量验证:验证导出数据的质量
  • 版本管理:管理不同版本的训练数据

任务队列管理

什么是任务队列?

任务队列用于管理后台任务,如数据导出、格式转换等。这些任务在后台异步执行,不会阻塞用户操作。

队列功能(管理员权限):

队列控制:

  • 暂停队列:临时暂停队列处理,停止执行新的任务
  • 恢复队列:恢复队列处理,继续执行等待中的任务
  • 队列状态:实时显示队列的暂停/运行状态

队列清理:

  • 清空等待队列:清空所有等待和延迟中的任务(不影响正在执行、已完成、失败的任务)
  • 清理历史任务:清理 24 小时之前已完成或失败的任务,释放存储空间
  • 批量重试:批量重试所有失败的任务(一次最多处理 1000 条)

队列监控:

  • 查看队列中的任务数量(等待、进行中、已完成、失败)
  • 查看任务执行日志和错误信息
  • 监控队列处理速度和性能
信息

任务队列说明:

  • 任务队列主要用于后台任务处理,如数据导出、格式转换等
  • 暂停队列不会影响正在执行的任务,只会阻止新任务开始
  • 清理操作会永久删除历史任务记录,请谨慎操作
  • 批量重试可以帮助恢复因临时错误失败的任务

常见问题

如何知道任务分配给谁了?

在任务列表或任务详情页可以看到:

  • 标注员:负责执行标注的人员
  • 审核员:负责审核标注的人员
  • 创建人:创建任务的人员(通常是项目经理)

点击人员名称可以查看详细信息。

任务状态无法变更怎么办?

可能的原因:

  1. 权限不足:确认你的角色是否有权限执行该操作
  2. 状态限制:某些状态变更需要特定条件(如必须先完成标注才能提交审核)
  3. 任务已锁定:任务已审核合格后,标注员不能再修改状态

如果问题持续,联系项目经理或管理员。

如何查看任务的详细进度?

进入任务详情页,可以查看:

  • 每个数据集的标注完成情况
  • 标注员的工作进度(如果有多人)
  • 标注质量统计
  • 预计完成时间

审核不通过后怎么办?

如果审核不通过:

  1. 查看审核意见,了解不通过的原因
  2. 根据意见修改标注
  3. 修改完成后重新提交审核
  4. 审核员会再次检查

建议在标注前仔细阅读标注标准,减少返工。

适用角色

管理员

你可以:

  • 查看所有任务的整体状况
  • 管理标注员和审核员资源
  • 监控整体标注质量
  • 配置任务流程和规则
  • 管理任务队列

项目经理

你可以:

  • 为项目创建标注任务
  • 跟踪项目标注进度
  • 监控标注质量状况
  • 协调标注员和审核员工作
  • 导出数据用于训练

标注员

你可以:

  • 接收分配给自己的任务
  • 执行具体的标注工作
  • 更新任务完成进度
  • 反馈标注过程中的问题
  • 查看自己的工作效率统计

审核员

你可以:

  • 审核标注员完成的任务
  • 评估标注质量
  • 向标注员反馈问题
  • 制定和更新标注标准
  • 查看审核统计信息

相关功能

完成标注任务后,你可能还需要: