Тонкая настройка моделей Pi0 и Pi0.5: Платформа машинного обучения роботов с открытым исходным кодом Physical Intelligence
Pi0 и Pi0.5 — это ведущие в отрасли серии моделей Vision-Language-Action (VLA), разработанные командой Physical Intelligence. Эти модели предварительно обучены на больших объемах данных роботов и могут быстро адаптироваться к конкретным робототехническим задачам и сценариям применения посредством тонкой настройки.
Данное руководство основано на официальном фреймворке OpenPI от Physical Intelligence и подробно описывает, как эффективно выполнять тонкую настройку предварительно обученных моделей Pi0/Pi0.5 на пользовательских наборах данных.
Обзор серии моделей
Репозиторий OpenPI в настоящее время предоставляет три типа моделей:
Тип модели | Описание | Особенности | Случаи использования |
---|---|---|---|
π₀ (Pi0) | Модель Vision-Language-Action на основе потоков | Генерация потоков, высококачественное предсказание действий | Сложные манипуляционные задачи, требования высокой точности |
π₀-FAST | Авторегрессионная VLA на основе токенизатора действий FAST | Авторегрессионная генерация, быстрый вывод | Управление в реальном времени, требования низкой задержки |
π₀.₅ (Pi0.5) | Обновленная версия π₀ с лучшей обобщающей способностью в открытом мире | Обучение с изоляцией знаний, улучшенная обобщающая способность | Разнообразные среды, междоменные приложения |
Примечание: Все модели предварительно обучены на данных роботов объемом более 10 000 часов и предоставляют базовые контрольные точки модели для тонкой настройки.
Предварительные требования и настройка среды
Системные требования
Минимальная конфигурация:
- Python 3.11+ (рекомендуется использовать менеджер пакетов uv)
- GPU: Для обучения требуется NVIDIA GPU (рекомендуется A100/H100)
- Память: 32GB+ системной оперативной памяти
- Хранилище: 100GB+ доступного дискового пространства
Рекомендуемая конфигурация:
- Оборудование: NVIDIA A100/H100 или установка с несколькими GPU
- Хранилище: NVMe SSD-диски
- Сеть: Стабильное сетевое соединение для загрузки моделей и данных