curl --request POST \
  --url https://api.aiid.edu.kg/ent/v2/img2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "viduq3-turbo",
  "prompt": "A cinematic product ad with smooth camera motion",
  "duration": 5,
  "resolution": "720p",
  "aspect_ratio": "16:9"
}
'

{
  "task_id": "<string>",
  "model": "<string>",
  "prompt": "<string>",
  "images": [
    "<string>"
  ],
  "duration": 123,
  "resolution": "<string>",
  "credits": 123,
  "created_at": "<string>",
  "creations": "<string>"
}

Génération vidéo Vidu

Créer une vidéo à partir d’une image(Vidu)

Cette série prend en charge le format de génération vidéo OpenAI (voir le lien Formats compatibles pour la génération vidéo Sora).

Vidu interface officielle de génération vidéo ; le chemin public suit le protocole officiel Vidu.

Modèle public actuel : viduq3-turbo. Prend en charge la génération vidéo à partir de texte, d’image, d’images de début et de fin, ainsi que de références. Le même modèle prend également en charge l’intégration au format compatible Sora via /v1/videos ; les mode courants sont t2v, i2v, i2v_first_last et reference_images.

Complète le squelette de requête publique, la structure de requête de tâche et le modèle de validation recommandé du format officiel de génération vidéo Vidu ; le chemin public conserve le format de point de terminaison officiel Vidu.

Modèles pris en charge : viduq3-turbo

Champs de requête unifiés :

model (string, requis) : nom de modèle externe Vidu, actuellement public viduq3-turbo.
prompt (string, facultatif) : prompt de génération vidéo ; obligatoire pour le texte vers vidéo, à fournir selon les besoins métier pour image vers vidéo, images de début/fin et vidéo de référence.
images (array[string], facultatif) : entrées d’image. 1 image pour image vers vidéo, 2 images pour les images de début et de fin, 1 à 7 images pour la vidéo de référence.
videos (array[string], facultatif) : entrée facultative de sujet vidéo pour la vidéo de référence, à utiliser selon les capacités officielles du modèle Vidu.
subjects (array[object], facultatif) : entrée au format de bibliothèque de sujets pour la vidéo de référence, pouvant inclure des champs tels que le nom du sujet, des images, des vidéos ou le timbre vocal.
duration (integer, facultatif) : durée de la vidéo, en secondes. viduq3-turbo utilise couramment 5 secondes ; peut être définie selon la plage officielle.
resolution (string, facultatif) : résolution de sortie, valeurs courantes 540p, 720p et 1080p.
aspect_ratio (string, facultatif) : format d’image de sortie, couramment utilisé pour le texte vers vidéo et la vidéo de référence, par exemple 16:9, 9:16 et 1:1.
seed (integer, facultatif) : graine aléatoire.
movement_amplitude (string, facultatif) : amplitude du mouvement, valeurs courantes auto, small, medium et large.
audio (boolean, facultatif) : activer ou non la sortie directe audio et vidéo.
off_peak (boolean, facultatif) : utiliser ou non la génération décalée.
watermark (boolean, facultatif) : indiquer s’il faut ajouter un filigrane.

Différences courantes entre modèles/modes :

Vidu 文生视频 : modèle pris en charge viduq3-turbo ; texte vers vidéo au format officiel.
Vidu 图生视频 : modèle pris en charge viduq3-turbo ; image unique vers vidéo au format officiel.
Vidu 首尾帧生视频 : modèle pris en charge viduq3-turbo ; deux images de début et de fin vers vidéo au format officiel.
Vidu 参考生视频 : modèle pris en charge viduq3-turbo ; vidéo à partir de plusieurs images de référence au format officiel.

POST

ent

img2video

curl --request POST \
  --url https://api.aiid.edu.kg/ent/v2/img2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "viduq3-turbo",
  "prompt": "A cinematic product ad with smooth camera motion",
  "duration": 5,
  "resolution": "720p",
  "aspect_ratio": "16:9"
}
'

{
  "task_id": "<string>",
  "model": "<string>",
  "prompt": "<string>",
  "images": [
    "<string>"
  ],
  "duration": 123,
  "resolution": "<string>",
  "credits": 123,
  "created_at": "<string>",
  "creations": "<string>"
}

Autorisations

Authorization

string

header

requis

Utilisez l'authentification Bearer Token. Format : Authorization: Bearer sk-xxxxxx

Corps

application/json

model

enum<string>

requis

Nom externe du modèle Vidu ; actuellement public viduq3-turbo.

Options disponibles:

viduq3-turbo

Exemple:

"viduq3-turbo"

images

string<uri>[]

requis

Entrée d'image. Génération vidéo à partir d'image : 1 image ; image de début et de fin : 2 images ; génération vidéo à partir de références : 1 à 7 images.

Required array length: 1 element

Exemple:

["https://example.com/input.jpg"]

prompt

string

Prompt de génération vidéo ; obligatoire pour la génération de vidéo à partir de texte, à renseigner selon les besoins métier pour la génération à partir d’image, par images de début/fin, ou par vidéo de référence.

Exemple:

"A cinematic product ad with smooth camera motion"

videos

string<uri>[]

Utilisez la saisie facultative du sujet vidéo pour la génération de vidéo de référence, conformément aux capacités officielles du modèle Vidu.

subjects

object[]

Saisissez en vous référant au format de la bibliothèque de sujets de génération vidéo ; cela peut inclure des champs tels que le nom du sujet, des images, des vidéos ou le timbre vocal.

Hide child attributes

subjects.name

string

subjects.images

string<uri>[]

subjects.videos

string<uri>[]

subjects.voice_id

string

subjects.server_id

string

auto_subjects

boolean

duration

integer

Durée de la vidéo, en secondes. viduq3-turbo 5 secondes sont courantes ; vous pouvez définir une valeur dans la plage officielle.

Exemple:

5

resolution

enum<string>

Résolution de sortie, valeurs courantes 540p, 720p, 1080p.

Options disponibles:

540p,

720p,

1080p

Exemple:

"720p"

aspect_ratio

enum<string>

Rapport largeur/hauteur de sortie, couramment utilisé pour les vidéos générées à partir de texte ou de référence, par exemple 16:9, 9:16, 1:1.

Options disponibles:

16:9,

9:16,

4:3,

3:4,

1:1

Exemple:

"16:9"

seed

integer

Graine aléatoire.

movement_amplitude

enum<string>

Amplitude du mouvement, valeurs courantes auto, small, medium et large.

Options disponibles:

auto,

small,

medium,

large

Exemple:

"auto"

audio

boolean

Activer ou non la sortie directe audio/vidéo.

audio_type

enum<string>

Options disponibles:

all,

speech_only,

sound_effect_only

voice_id

string

is_rec

boolean

bgm

boolean

payload

string

off_peak

boolean

Utiliser ou non une génération décalée.

watermark

boolean

Ajouter un filigrane ou non.

wm_position

enum<integer>

Options disponibles:

1,

2,

3,

4

wm_url

string<uri>

callback_url

string<uri>

Réponse

200 - application/json

Tâche créée avec succès

task_id

string

requis

ID de tâche renvoyé lors de la création de la tâche, utilisé pour interroger la tâche.

state

enum<string>

requis

État de la tâche, valeurs courantes created, queueing, processing, success et failed.

Options disponibles:

created,

queueing,

processing,

success,

failed

model

string

prompt

string

images

string[]

duration

integer

resolution

string

credits

integer

Points consommés pour cette tâche.

created_at

string

creations

string

Interroger une tâche (Seedance)Créer une vidéo de référence générée(Vidu)