Créer une vidéo à partir d’une image(Vidu)
Cette série prend en charge le format de génération vidéo OpenAI (voir le lien Formats compatibles pour la génération vidéo Sora).
Vidu interface officielle de génération vidéo ; le chemin public suit le protocole officiel Vidu.
Modèle public actuel : viduq3-turbo. Prend en charge la génération vidéo à partir de texte, d’image, d’images de début et de fin, ainsi que de références. Le même modèle prend également en charge l’intégration au format compatible Sora via /v1/videos ; les mode courants sont t2v, i2v, i2v_first_last et reference_images.
Complète le squelette de requête publique, la structure de requête de tâche et le modèle de validation recommandé du format officiel de génération vidéo Vidu ; le chemin public conserve le format de point de terminaison officiel Vidu.
Modèles pris en charge : viduq3-turbo
Champs de requête unifiés :
model(string, requis) : nom de modèle externe Vidu, actuellement publicviduq3-turbo.prompt(string, facultatif) : prompt de génération vidéo ; obligatoire pour le texte vers vidéo, à fournir selon les besoins métier pour image vers vidéo, images de début/fin et vidéo de référence.images(array[string], facultatif) : entrées d’image. 1 image pour image vers vidéo, 2 images pour les images de début et de fin, 1 à 7 images pour la vidéo de référence.videos(array[string], facultatif) : entrée facultative de sujet vidéo pour la vidéo de référence, à utiliser selon les capacités officielles du modèle Vidu.subjects(array[object], facultatif) : entrée au format de bibliothèque de sujets pour la vidéo de référence, pouvant inclure des champs tels que le nom du sujet, des images, des vidéos ou le timbre vocal.duration(integer, facultatif) : durée de la vidéo, en secondes.viduq3-turboutilise couramment 5 secondes ; peut être définie selon la plage officielle.resolution(string, facultatif) : résolution de sortie, valeurs courantes540p,720pet1080p.aspect_ratio(string, facultatif) : format d’image de sortie, couramment utilisé pour le texte vers vidéo et la vidéo de référence, par exemple16:9,9:16et1:1.seed(integer, facultatif) : graine aléatoire.movement_amplitude(string, facultatif) : amplitude du mouvement, valeurs courantesauto,small,mediumetlarge.audio(boolean, facultatif) : activer ou non la sortie directe audio et vidéo.off_peak(boolean, facultatif) : utiliser ou non la génération décalée.watermark(boolean, facultatif) : indiquer s’il faut ajouter un filigrane.
Différences courantes entre modèles/modes :
Vidu 文生视频: modèle pris en charge viduq3-turbo ; texte vers vidéo au format officiel.Vidu 图生视频: modèle pris en charge viduq3-turbo ; image unique vers vidéo au format officiel.Vidu 首尾帧生视频: modèle pris en charge viduq3-turbo ; deux images de début et de fin vers vidéo au format officiel.Vidu 参考生视频: modèle pris en charge viduq3-turbo ; vidéo à partir de plusieurs images de référence au format officiel.
Autorisations
Utilisez l'authentification Bearer Token.
Format : Authorization: Bearer sk-xxxxxx
Corps
Nom externe du modèle Vidu ; actuellement public viduq3-turbo.
viduq3-turbo "viduq3-turbo"
Entrée d'image. Génération vidéo à partir d'image : 1 image ; image de début et de fin : 2 images ; génération vidéo à partir de références : 1 à 7 images.
1 element["https://example.com/input.jpg"]Prompt de génération vidéo ; obligatoire pour la génération de vidéo à partir de texte, à renseigner selon les besoins métier pour la génération à partir d’image, par images de début/fin, ou par vidéo de référence.
"A cinematic product ad with smooth camera motion"
Utilisez la saisie facultative du sujet vidéo pour la génération de vidéo de référence, conformément aux capacités officielles du modèle Vidu.
Saisissez en vous référant au format de la bibliothèque de sujets de génération vidéo ; cela peut inclure des champs tels que le nom du sujet, des images, des vidéos ou le timbre vocal.
Durée de la vidéo, en secondes. viduq3-turbo 5 secondes sont courantes ; vous pouvez définir une valeur dans la plage officielle.
5
Résolution de sortie, valeurs courantes 540p, 720p, 1080p.
540p, 720p, 1080p "720p"
Rapport largeur/hauteur de sortie, couramment utilisé pour les vidéos générées à partir de texte ou de référence, par exemple 16:9, 9:16, 1:1.
16:9, 9:16, 4:3, 3:4, 1:1 "16:9"
Graine aléatoire.
Amplitude du mouvement, valeurs courantes auto, small, medium et large.
auto, small, medium, large "auto"
Activer ou non la sortie directe audio/vidéo.
all, speech_only, sound_effect_only Utiliser ou non une génération décalée.
Ajouter un filigrane ou non.
1, 2, 3, 4 Réponse
Tâche créée avec succès
ID de tâche renvoyé lors de la création de la tâche, utilisé pour interroger la tâche.
État de la tâche, valeurs courantes created, queueing, processing, success et failed.
created, queueing, processing, success, failed Points consommés pour cette tâche.
