データエクスポート
機能概要
データエクスポートはIOデータプラットフォームの重要なデータ配信モジュールであり、アノテーション済みデータをJSON、CSV、HDF5、LeRobot、MCapなどの複数の標準形式でエクスポートする機能を提供します。柔軟なフィルタ条件、バッチエクスポート機能、エクスポート履歴管理を通じて、アノテーション済みデータが最も適した形式でダウンストリームシステムに配信され、モデル訓練、データ分析、様々なアプリケーションシナリオをサポートすることを確保します。
主要機能
マルチ形式エクスポートサポート
標準データ形式
複数の標準データ形式へのエクスポートをサポートし、JSON(構造化データ)、CSV(表形式データ)、HDF5(科学計算データ)、LeRobot(ロボット学習データ)、MCap(マルチモーダルデータ)などを含みます。これらの形式はダウンストリームアプリケーションのニーズの大部分をカバーしています。
カスタム形式
特定のニーズに基づいてエクスポート形式をカスタマイズすることをサポートし、フィールド選択、データ変換、形式設定などを含みます。カスタム形式を通じて、特殊シナリオのデータエクスポートニーズを満たします。
形式変換
インテリジェントな形式変換機能を提供し、データを一つの形式から別の形式に変換でき、異なるシステム間のデータ互換性を確保します。変換プロセスはデータ検証と品質チェックをサポートします。
柔軟なフィルタ機能
多次元フィルタ
プロジェクト、時間、アノテーター、品質レベルなどの多次元でのデータフィルタをサポートします。柔軟なフィルタ条件を通じて、エクスポートが必要なデータを正確に選択できます。
高度フィルタ
高度フィルタ機能を提供し、複雑なフィルタ条件の組み合わせをサポートし、論理演算、範囲フィルタ、あいまいマッチングなどを含みます。高度フィルタにより、エクスポートするデータ範囲を正確に制御できます。
プレビュー機能
エクスポート前にデータプレビュー機能を提供し、フィルタ結果を表示し、エクスポートするデータが期待に合うことを確認できます。プレビュー機能は不要なエクスポート操作を避けます。
バッチエクスポート管理
バッチ処理
複数のデータセットのバッチエクスポートをサポートし、複数のエクスポートタスクを同時に処理でき、エクスポート効率を大幅に向上させます。バッチ処理は特に大規模データエクスポートシナリオに適しています。
タスクキュー
エクスポートタスクキュー管理を提供し、複数のエクスポートタスクのキューイングと実行をサポートします。タスクキューを通じて、大量のエクスポートリクエストを秩序正しく処理できます。
進捗監視
エクスポート進捗をリアルタイムで監視し、完了数量、処理速度、予想完了時間などを含みます。進捗監視を通じて、エクスポート状態を適時に理解できます。
エクスポート履歴管理
履歴記録
すべてのエクスポート操作の履歴を記録し、エクスポート時間、エクスポート形式、データ量、操作者などを含みます。履歴記録を通じて、データ使用を追跡できます。
バージョン管理
エクスポートデータのバージョン管理をサポートし、異なるバージョンのエクスポート結果を保存でき、データのバックトラッキングと比較を容易にします。バージョン管理はデータの追跡可能性を確保します。
権限制御
細粒度の権限制御を提供し、異なるユーザーの異なるデータへのエクスポート権限を設定できます。権限制御を通じて、データセキュリティを確保し、不正エクスポートを防止します。
適用役割
管理者
プラットフォーム管理者として、外部に訓練データやダウンストリーム分析に必要なデータを配信し、エクスポートタスクを管理し、エクスポート進捗を監視し、データエクスポート権限を制御できます。これらの機能はプラットフォームのデータ配信サービスが安全 で効率的であることを保証します。
プロジェクトマネージャー
プロジェクトマネージャーはプロジェクトに関連するデータをエクスポートし、プロジェクト配信のためのデータを準備し、データ使用状況を監視し、データエクスポート作業を調整できます。データエクスポート管理を通じて、プロジェクトマネージャーはプロジェクトのデータ配信を効果的に制御できます。