メインコンテンツまでスキップ

データエクスポート

機能概要

データエクスポートはIOデータプラットフォームの重要なデータ配信モジュールであり、アノテーション済みデータをJSON、CSV、HDF5、LeRobot、MCapなどの複数の標準形式でエクスポートする機能を提供します。柔軟なフィルタ条件、バッチエクスポート機能、エクスポート履歴管理を通じて、アノテーション済みデータが最も適した形式でダウンストリームシステムに配信され、モデル訓練、データ分析、様々なアプリケーションシナリオをサポートすることを確保します。


主要機能

マルチ形式エクスポートサポート

標準データ形式

複数の標準データ形式へのエクスポートをサポートし、JSON(構造化データ)、CSV(表形式データ)、HDF5(科学計算データ)、LeRobot(ロボット学習データ)、MCap(マルチモーダルデータ)などを含みます。これらの形式はダウンストリームアプリケーションのニーズの大部分をカバーしています。

カスタム形式

特定のニーズに基づいてエクスポート形式をカスタマイズすることをサポートし、フィールド選択、データ変換、形式設定などを含みます。カスタム形式を通じて、特殊シナリオのデータエクスポートニーズを満たします。

形式変換

インテリジェントな形式変換機能を提供し、データを一つの形式から別の形式に変換でき、異なるシステム間のデータ互換性を確保します。変換プロセスはデータ検証と品質チェックをサポートします。

柔軟なフィルタ機能

多次元フィルタ

プロジェクト、時間、アノテーター、品質レベルなどの多次元でのデータフィルタをサポートします。柔軟なフィルタ条件を通じて、エクスポートが必要なデータを正確に選択できます。

高度フィルタ

高度フィルタ機能を提供し、複雑なフィルタ条件の組み合わせをサポートし、論理演算、範囲フィルタ、あいまいマッチングなどを含みます。高度フィルタにより、エクスポートするデータ範囲を正確に制御できます。

プレビュー機能

エクスポート前にデータプレビュー機能を提供し、フィルタ結果を表示し、エクスポートするデータが期待に合うことを確認できます。プレビュー機能は不要なエクスポート操作を避けます。

バッチエクスポート管理

バッチ処理

複数のデータセットのバッチエクスポートをサポートし、複数のエクスポートタスクを同時に処理でき、エクスポート効率を大幅に向上させます。バッチ処理は特に大規模データエクスポートシナリオに適しています。

タスクキュー

エクスポートタスクキュー管理を提供し、複数のエクスポートタスクのキューイングと実行をサポートします。タスクキューを通じて、大量のエクスポートリクエストを秩序正しく処理できます。

進捗監視

エクスポート進捗をリアルタイムで監視し、完了数量、処理速度、予想完了時間などを含みます。進捗監視を通じて、エクスポート状態を適時に理解できます。

エクスポート履歴管理

履歴記録

すべてのエクスポート操作の履歴を記録し、エクスポート時間、エクスポート形式、データ量、操作者などを含みます。履歴記録を通じて、データ使用を追跡できます。

バージョン管理

エクスポートデータのバージョン管理をサポートし、異なるバージョンのエクスポート結果を保存でき、データのバックトラッキングと比較を容易にします。バージョン管理はデータの追跡可能性を確保します。

権限制御

細粒度の権限制御を提供し、異なるユーザーの異なるデータへのエクスポート権限を設定できます。権限制御を通じて、データセキュリティを確保し、不正エクスポートを防止します。

適用役割

管理者

プラットフォーム管理者として、外部に訓練データやダウンストリーム分析に必要なデータを配信し、エクスポートタスクを管理し、エクスポート進捗を監視し、データエクスポート権限を制御できます。これらの機能はプラットフォームのデータ配信サービスが安全で効率的であることを保証します。

プロジェクトマネージャー

プロジェクトマネージャーはプロジェクトに関連するデータをエクスポートし、プロジェクト配信のためのデータを準備し、データ使用状況を監視し、データエクスポート作業を調整できます。データエクスポート管理を通じて、プロジェクトマネージャーはプロジェクトのデータ配信を効果的に制御できます。