1. OpenAI 互換フォーマット
ほとんどの新規導入シナリオに適しており、優先的に検討すべきもの:POST /v1/chat/completionsPOST /v1/responsesGET /v1/responses/{response_id}POST /v1/images/generationsPOST /v1/images/editsPOST /v1/videosGET /v1/videos/{task_id}
- SDK のエコシステムが成熟
- フィールド形式が統一されている
- マルチモデルの切り替えに適している
2. モデルネイティブ形式
モデル自体に専用フィールド、専用タスク構造、またはネイティブクエリプロトコルが必要な場合は、ネイティブインターフェースを公開します:- Seedance:
/api/v3/contents/generations/tasks - HappyHorse:
/api/v1/services/aigc/video-generation/video-synthesisと/api/v1/tasks/{task_id} - Vidu:
/ent/v2/text2video、/ent/v2/img2video、/ent/v2/start-end2video、/ent/v2/reference2video和/ent/v2/tasks/{task_id}/creations - Omni と Veo:
gemini-omniは/v1/videosまたは/api/v3/contents/generations/tasksを使用します。Veo のネイティブ予約済みパスは/v1beta/models/{model}:predictLongRunningと/v1beta/{operation_name}です - Gemini 画像生成:
/v1beta/models/{model}:generateContent - 音楽生成:
/suno/submit/musicと/suno/fetch/{task_id}。プロンプト記述モード、軽音楽/インストゥルメンタル、歌詞の高度モードに対応
gemini-omni は外部公開されている動画モデル名であり、内部の上流モデルを気にする必要はありません。動画の呼び出しでは /v1/videos を優先して使用しますが、Seedance のタスク形式 /api/v3/contents/generations/tasks も使用できます。mode=t2v/r2v/edit はそれぞれテキストから動画生成、参考生成、動画編集を表し、duration フィールドは 4 / 6 / 8 / 10 秒のいずれかに自動でマッチします。
以下の場合に適しています:
- モデル固有のフィールドが多い
- ネイティブなリクエストボディ構造が必要
- アップストリームの公式形式に近い状態を維持する必要がある
3. モデル専用ビデオインターフェース
現在、以下のような少数のモデル専用インターフェースも公開されています:POST /kling/v1/videos/text2videoPOST /kling/v1/videos/image2video以下の場合に適しています:- すでに対応するモデル専用プロトコルに基づいて統合されている
- そのモデル専用のパラメータモードを使用する必要がある
4. 選択のアドバイス
- 新規プロジェクトでは OpenAI 互換フォーマットを優先して使用します。
- 互換形式でモデル固有のフィールドをカバーできない場合に限り、ネイティブ形式に切り替えてください。
- 長期タスクインターフェースでは、「作成インターフェース」と「クエリインターフェース」を明確に区別し、
task_idまたはoperation_nameを保存してください。 - 同一モデルに複数の呼び出し形式が存在する場合、対応するインターフェースページのサポートフィールドを基準とし、リクエストボディを混用しないでください。
