Инструкции по подключению через несколько протоколов и форматов

1. Формат, совместимый с OpenAI

Подходит для большинства новых сценариев интеграции, рекомендуется в первую очередь:

POST /v1/chat/completions
POST /v1/responses
GET /v1/responses/{response_id}
POST /v1/images/generations
POST /v1/images/edits
POST /v1/videos
GET /v1/videos/{task_id}

Особенности:

Зрелая экосистема SDK
Единый стиль полей
Удобно для переключения между несколькими моделями

2. Нативный формат модели

Когда модели требуются специфические поля, выделенная структура задач или собственный протокол запросов, предоставляются нативные интерфейсы:

Seedance：/api/v3/contents/generations/tasks
HappyHorse: /api/v1/services/aigc/video-generation/video-synthesis и /api/v1/tasks/{task_id}
Vidu：/ent/v2/text2video、/ent/v2/img2video、/ent/v2/start-end2video、/ent/v2/reference2video 和 /ent/v2/tasks/{task_id}/creations
Omni и Veo: gemini-omni использует /v1/videos или /api/v3/contents/generations/tasks; собственные зарезервированные пути Veo — /v1beta/models/{model}:predictLongRunning и /v1beta/{operation_name}
Генерация изображений Gemini: /v1beta/models/{model}:generateContent
Генерация музыки: /suno/submit/music и /suno/fetch/{task_id}, поддерживаются режим описания по промпту, лёгкая музыка/чистый аккомпанемент, расширенный режим с текстом песни

gemini-omni — это публичное имя видеомодели, не нужно учитывать внутреннюю upstream-модель; для вызова видео в приоритете используйте /v1/videos, также можно использовать формат задачи Seedance /api/v3/contents/generations/tasks. mode=t2v/r2v/edit обозначают генерацию видео по тексту, генерацию по референсу и редактирование видео, а поле длительности будет автоматически сопоставлено с вариантами 4 / 6 / 8 / 10 секунд. Подходит для:

Большого количества специфических для модели полей
Необходимости в нативной структуре тела запроса
Необходимости сохранения формата, близкого к официальному формату вышестоящего провайдера

3. Специализированные видео-интерфейсы моделей

В настоящее время также доступно небольшое количество специфических интерфейсов моделей, например:

POST /kling/v1/videos/text2video
POST /kling/v1/videos/image2video Подходит для:
Интеграций, уже выполненных на основе специфического протокола соответствующей модели
Необходимости использования специфического режима параметров данной модели

4. Рекомендации по выбору

Для новых проектов в приоритете используйте формат, совместимый с OpenAI.
Если совместимый формат не поддерживает специфические поля модели, переключитесь на нативный формат.
Интерфейсы длительных задач должны четко разделять «интерфейс создания» и «интерфейс запроса»; сохраняйте task_id или operation_name.
Если для одной и той же модели существует несколько форматов вызова, руководствуйтесь полями, поддерживаемыми на соответствующей странице интерфейса; не смешивайте структуры тел запросов.

​1. Формат, совместимый с OpenAI

​2. Нативный формат модели

​3. Специализированные видео-интерфейсы моделей

​4. Рекомендации по выбору

1. Формат, совместимый с OpenAI

2. Нативный формат модели

3. Специализированные видео-интерфейсы моделей

4. Рекомендации по выбору