Инференс моделей
Платформа EmbodyFlow предоставляет полные услуги инференса моделей, позволяя в один клик развертывать обученные модели обучения роботов в виде сервисов инференса промышленного уровня. Платформа поддерживает несколько форматов моделей и гибкие методы развертывания, обеспечивая возможности ИИ-инференса для любых сценариев — от облака до периферийных устройств.
Особенности продукта
Платформа обеспечивает полную цепочку от обучения модели до развертывания инференса, поддерживая различные методы проверки и развертывания.
| Способ инференса | Сценарии применения | Описание |
|---|---|---|
| Моделируемый тест | Быстрая проверка | Использование случайных данных или пользовательского ввода для быстрой проверки функциональности и производительности инференса модели |
| Тест файла MCAP | Проверка на реальных данных | Использование записанных демонстрационных данных робота для проверки эффектов инференса модели в реальных сценариях |
| Автономное периферийное развертывание | Промышленное применение | Развертывание сервиса инференса на локальном GPU робота для обеспечения управления в реальном времени с низкой задержкой |
Рабочий процесс инференса
Платформа предоставляет готовый процесс развертывания инференса через визуальный интерфейс, позволяющий пройти путь от выбора модели до промышленного развертывания без навыков программирования:
1. Выбор источника модели
Платформа поддерживает несколько источников моделей для удовлетворения потребностей в различных сценариях:
Использование тонко настроенной модели (рекомендуется):
- Выбор завершенных моделей из задач обучения.
- Поддержка выбора различных чекпоинтов (рекомендуется использовать "last" или "best").
- Автоматическое наследование конфигурации и параметров модели из процесса обучения.
- Не требует дополнительной настройки, готова к немедленному развертыванию.
Загрузка пользовательской модели:
- Поддержка основных форматов: SafeTensors, PyTorch (.pth, .pt), ONNX и др.
- Возможность скачивания файлов моделей по URL-ссылкам.
- Поддержка автоматической распаковки архивов ZIP и TAR.
- Подходит для внешнего обучения или развертывания сторонних моделей.
Использование предобученной модели:
- Предоставление проверенных базовых моделей, таких как Pi0 Latest, Pi0 0.5, SmolVLA и др.
- Автоматическое скачивание и загрузка из репозитория моделей.
- Быстрый запуск, подходит для оперативной проверки и тестирования.
Советы по выбору модели:
- Для первого развертывания рекомендуется использовать тонко настроенную модел ь, чтобы гарантировать соответствие модели данным обучения.
- Если требуется быстрое тестирование, можно использовать предобученную модель.
- Для пользовательских моделей необходимо убедиться в совместимости форматов и правильности конфигурации.

2. Конфигурация и развертывание сервиса
Настройка базовой информации
При создании сервиса инференса необходимо настроить следующую информацию:
- Имя сервиса — задайте легко узнаваемое имя для сервиса инференса.
- Описание сервиса — опционально, добавьте информацию о назначении сервиса.
- Проект — привяжите сервис к конкретному проекту для удобства управления.
- Тип модели — выберите тип модели (например, SmolVLA, Pi0 и др.), система автоматически адаптируется.
Настройка параметров инференса
В зависимости от типа модели можно настроить следующие параметры:
- Точность инференса — выбор типа точности (bfloat16 или float32).
- Размер батча — размер пакета при пакетном инференсе.
- Макс. длина последовательности — для моделей, поддерживающих последовательности, ограничение максимальной длины.
- Другие специфические параметры — отображение релевантных опций в зависимости от типа модели.
Настройка ресурсов
Вычислительные ресурсы:
- Автоматическое обнаружение доступных ресурсов GPU.
- Поддержка выбора конкретного GPU или развертывания на нескольких GPU.
- Поддержка платформ CUDA, MPS (Apple Silicon) и др.
- Автоматический переход на CPU при отсутствии GPU (более низкая производительность).
Конфигурация контейнера:
- Каждый сервис инференса запускается в независимом Docker-контейнере.
- Автоматическое назначение портов (диапазон 28000-28999).
- Поддержка проброса GPU для высокопроизводительного инференса.
- Автоматическое управление контейнерами, не требующее ручных операций.
Развертывание сервиса
После завершения настройки нажмите кнопку «Развернуть»:
- Система автоматически создаст Docker-контейнер.
- Загрузятся веса модели и конфигурация.
- Запустится сервис инференса (занимает около 20–30 секунд).
- Автоматически выполнится проверка здоровья для обеспечения нормальной работы.
После завершения развертывания сервис запустится автоматически и будет поддерживать рабочее состояние; вы сможете сразу приступить к тестированию.
Управление сервисом
После развертывания сервис предоставляет полные функции мониторинга и управления:
Информация о сервисе:
- Host-адрес и порт — адреса доступа HTTP и WebSocket для API инференса.
- Статус сервиса — отображение состояния в реальном времени (Запущен, Остановлен, Ошибка и т.д.).
- Информация о контейнере — ID Docker-контейнера и его статус.
- Время создания — время создания и последнего об новления сервиса.
Мониторинг ресурсов:
- Загрузка CPU — отображение текущей загрузки процессора.
- Использование памяти — отображение занятой памяти и пиковых значений.
- Загрузка GPU — при использовании GPU, отображение загрузки ядра и видеопамяти.
- Сетевой ввод-вывод — статистика сетевого трафика.
Управление сервисом:
- Запуск/Остановка — возможность в любой момент запустить или остановить сервис.
- Перезапуск — перезапуск сервиса для применения изменений конфигурации.
- Удаление — удаление ненужных сервисов для освобождения ресурсов.
Советы по управлению сервисом:
- После развертывания рекомендуется подождать 20–30 секунд до полного запуска.
- Регулярно проверяйте использование ресурсов во избежание их исчерпания.
- Неиспользуемые долгое время сервисы можно останавливать для экономии ресурсов.

Спецификации входа и выхода модели
Сервис инференса обладает способностью к интеллектуальной адаптации к требованиям различных моделей:
- Вход изображений — адаптация к количеству камер (один или несколько ракурсов) и разрешению (автоматическое масштабирование).
- Вход состояния — observation.state [12], observation.gripper [2], observation.score [1].
- Выход действий — action [12] команды управления суставами робота.
Вышеуказанная информация демонстрирует полную конфигурацию сервиса, помогая пользователям понять требования к входу и выходу модели для правильного использования функций инференса.
Функции тестирования инференса
Моделируемый тест инференса
Эта функция обеспечивает удобный способ проверки сервиса без подготовки реальных да нных:

Особенности:
-
Ввод задач на естественном языке — ввод команд, таких как «Подними яблоко и положи его в корзину».
- Поддержка команд на китайском и английском языках.
- Автоматическое кодирование языка системой.
-
Интеллектуальная генерация данных — заполнение тестовых данных в один клик для быстрой проверки.
- Автоматическая генерация изображений (случайные пиксели или заглушки) согласно требованиям модели.
- Автозаполнение значений состояния суставов (observation.state).
- Автозаполнение состояния захвата (observation.gripper).
- Все форматы данных автоматически адаптируются под требования входа модели.
-
Мгновенное выполнение — получение результатов инференса сразу после нажатия кнопки «Отправить».
- Отображение прогресса в реальном времени.
- Быстрый возврат результатов.