テキストから動画を作成(Vidu)
このシリーズはOpenAIの動画生成形式をサポートしています(詳細はリンク 動画生成Sora互換形式 を参照してください)。
Vidu 公式動画生成API。公開パスは Vidu 公式仕様に準拠します。
現在公開されているモデル:viduq3-turbo。テキストから動画、画像から動画、開始・終了フレームから動画、参考動画から動画に対応しています。同一モデルは /v1/videos Sora 互換形式でも接続でき、一般的な mode は t2v、i2v、i2v_first_last、reference_images です。
Vidu 公式動画生成フォーマットの公開リクエスト骨格、タスク照会構造、推奨検証テンプレートを補足します。公開パスは Vidu 公式エンドポイント形式を維持します。
対応モデル: viduq3-turbo
共通リクエストフィールド:
model(string, 必須): Vidu の対外公開モデル名。現在公開中のviduq3-turbo。prompt(string, 任意): 動画生成プロンプト。テキストから動画では必須、画像から/開始・終了フレーム/参考動画からは業務要件に応じて送信します。images(array[string], 任意): 画像入力。画像から動画は1枚、開始・終了フレームは2枚、参考動画からは1〜7枚。videos(array[string], 任意): 参考動画から動画で使用できる動画主体入力。Vidu 公式モデルの機能に応じて使用します。subjects(array[object], 任意): 参考動画から動画の主体ライブラリ形式の入力。主体名、画像、動画、音色などのフィールドを含めることができます。duration(integer, 任意): 動画の長さ。単位は秒です。viduq3-turboは通常 5 秒で、公式の範囲に従って設定できます。resolution(string, 任意): 出力解像度。一般的な値は540p、720p、1080pです。aspect_ratio(string, 任意): 出力アスペクト比。テキストから動画/参考動画から動画で一般的に使用されます。例:16:9、9:16、1:1。seed(integer, 任意): 乱数シード。movement_amplitude(string, 任意): モーションの強さ。一般的な値はauto、small、medium、largeです。audio(boolean, 任意): 音声付き動画の直接出力を有効にするかどうか。off_peak(boolean, 任意): オフピーク生成を使用するかどうか。watermark(boolean, 任意): ウォーターマークを追加するかどうか。
代表的なモデル/モードの違い:
Vidu 文生视频: サポートモデル viduq3-turbo;公式形式のテキストから動画。Vidu 图生视频: サポートモデル viduq3-turbo;公式形式の単一画像から動画。Vidu 首尾帧生视频: サポートモデル viduq3-turbo;公式形式の開始・終了フレームの2画像から動画。Vidu 参考生视频: サポートモデル viduq3-turbo;公式形式の複数参考画像から動画。
承認
Bearer Token を使用して認証します。
形式: Authorization: Bearer sk-xxxxxx
ボディ
Vidu の外部向けモデル名。現在公開中の viduq3-turbo。
viduq3-turbo "viduq3-turbo"
動画生成用プロンプト。テキストから動画生成では必須。画像から動画生成/開始・終了フレーム/参照による動画生成では、業務要件に応じて指定してください。
"A cinematic product ad with smooth camera motion"
画像入力。画像から動画は1枚、開始/終了フレームは2枚、参照画像からの動画生成は1〜7枚。
["https://example.com/input.jpg"]参考となる生動画は、オプションの動画主体入力です。Vidu の公式モデル機能に従って使用してください。
生成動画の主体ライブラリ形式を参照して入力します。主体名、画像、動画、音色などのフィールドを含めることができます。
動画の長さ。単位は秒。viduq3-turbo 通常は5秒で、公式の範囲に従って設定できます。
5
出力解像度。一般的な値は 540p、720p、1080p です。
540p, 720p, 1080p "720p"
出力のアスペクト比。テキスト生成/参照生成動画でよく使用されます。例: 16:9、9:16、1:1。
16:9, 9:16, 4:3, 3:4, 1:1 "16:9"
乱数シード。
動作範囲。一般的な値は auto、small、medium、large です。
auto, small, medium, large "auto"
音声・映像の直接出力を有効にするかどうか。
all, speech_only, sound_effect_only 生成をオフピークで実行するかどうか。
透かしを追加するかどうか。
1, 2, 3, 4 レスポンス
タスクの作成に成功しました
タスク作成時に返されるタスク ID。タスクの照会に使用します。
タスクのステータス。一般的な値は created、queueing、processing、success、failed です。
created, queueing, processing, success, failed 今回のタスクで消費されたポイント。
