Перейти к основному содержанию

1. Формат, совместимый с OpenAI

Подходит для большинства новых сценариев интеграции, рекомендуется в первую очередь:
  • POST /v1/chat/completions
  • POST /v1/responses
  • GET /v1/responses/{response_id}
  • POST /v1/images/generations
  • POST /v1/images/edits
  • POST /v1/videos
  • GET /v1/videos/{task_id}
Особенности:
  • Зрелая экосистема SDK
  • Единый стиль полей
  • Удобно для переключения между несколькими моделями

2. Нативный формат модели

Когда модели требуются специфические поля, выделенная структура задач или собственный протокол запросов, предоставляются нативные интерфейсы:
  • Seedance:/api/v3/contents/generations/tasks
  • HappyHorse: /api/v1/services/aigc/video-generation/video-synthesis и /api/v1/tasks/{task_id}
  • Vidu:/ent/v2/text2video/ent/v2/img2video/ent/v2/start-end2video/ent/v2/reference2video/ent/v2/tasks/{task_id}/creations
  • Omni и Veo: gemini-omni использует /v1/videos или /api/v3/contents/generations/tasks; собственные зарезервированные пути Veo — /v1beta/models/{model}:predictLongRunning и /v1beta/{operation_name}
  • Генерация изображений Gemini: /v1beta/models/{model}:generateContent
  • Генерация музыки: /suno/submit/music и /suno/fetch/{task_id}, поддерживаются режим описания по промпту, лёгкая музыка/чистый аккомпанемент, расширенный режим с текстом песни
gemini-omni — это публичное имя видеомодели, не нужно учитывать внутреннюю upstream-модель; для вызова видео в приоритете используйте /v1/videos, также можно использовать формат задачи Seedance /api/v3/contents/generations/tasks. mode=t2v/r2v/edit обозначают генерацию видео по тексту, генерацию по референсу и редактирование видео, а поле длительности будет автоматически сопоставлено с вариантами 4 / 6 / 8 / 10 секунд. Подходит для:
  • Большого количества специфических для модели полей
  • Необходимости в нативной структуре тела запроса
  • Необходимости сохранения формата, близкого к официальному формату вышестоящего провайдера

3. Специализированные видео-интерфейсы моделей

В настоящее время также доступно небольшое количество специфических интерфейсов моделей, например:
  • POST /kling/v1/videos/text2video
  • POST /kling/v1/videos/image2video Подходит для:
  • Интеграций, уже выполненных на основе специфического протокола соответствующей модели
  • Необходимости использования специфического режима параметров данной модели

4. Рекомендации по выбору

  1. Для новых проектов в приоритете используйте формат, совместимый с OpenAI.
  2. Если совместимый формат не поддерживает специфические поля модели, переключитесь на нативный формат.
  3. Интерфейсы длительных задач должны четко разделять «интерфейс создания» и «интерфейс запроса»; сохраняйте task_id или operation_name.
  4. Если для одной и той же модели существует несколько форматов вызова, руководствуйтесь полями, поддерживаемыми на соответствующей странице интерфейса; не смешивайте структуры тел запросов.