Tạo video khung đầu và khung cuối (Vidu)
Dòng này hỗ trợ định dạng tạo video OpenAI (xem chi tiết tại liên kết Định dạng tương thích với Sora tạo video).
Vidu giao diện tạo video chính thức, đường dẫn công khai tuân theo giao thức chính thức của Vidu.
Mô hình công khai hiện tại: viduq3-turbo. Hỗ trợ text-to-video, image-to-video, video từ khung đầu-cuối, và reference-to-video. Cùng một mô hình cũng hỗ trợ tích hợp thông qua định dạng tương thích Sora của /v1/videos, các mode thường dùng là t2v, i2v, i2v_first_last, reference_images.
Bổ sung skeleton request công khai, cấu trúc truy vấn tác vụ và mẫu xác minh được khuyến nghị cho định dạng tạo video chính thức của Vidu, đường dẫn công khai giữ nguyên định dạng endpoint chính thức của Vidu.
Mô hình hỗ trợ: viduq3-turbo
Các trường yêu cầu thống nhất:
model(string, bắt buộc): tên mô hình công khai của Vidu, hiện công khaividuq3-turbo.prompt(string, tùy chọn): prompt tạo video; bắt buộc với text-to-video, còn image-to-video/khung đầu-cuối/reference-to-video thì truyền theo nhu cầu nghiệp vụ.images(array[string], tùy chọn): đầu vào hình ảnh. image-to-video dùng 1 ảnh, khung đầu-cuối dùng 2 ảnh, reference-to-video dùng 1~7 ảnh.videos(array[string], tùy chọn): đầu vào đối tượng video tùy chọn cho reference-to-video, sử dụng theo năng lực mô hình chính thức của Vidu.subjects(array[object], tùy chọn): đầu vào theo định dạng thư viện chủ thể của reference-to-video, có thể bao gồm các trường như tên chủ thể, ảnh, video hoặc giọng.duration(integer, tùy chọn): độ dài video, tính bằng giây.viduq3-turbothường dùng 5 giây, có thể đặt theo phạm vi chính thức.resolution(string, tùy chọn): độ phân giải đầu ra, giá trị phổ biến540p,720p,1080p.aspect_ratio(string, tùy chọn): tỷ lệ khung hình đầu ra, thường dùng cho text-to-video/reference-to-video, như16:9,9:16,1:1.seed(integer, tùy chọn): Seed ngẫu nhiên.movement_amplitude(string, tùy chọn): mức độ chuyển động, các giá trị phổ biếnauto,small,medium,large.audio(boolean, tùy chọn): có bật xuất trực tiếp âm thanh và video hay không.off_peak(boolean, tùy chọn): có sử dụng tạo lệch giờ hay không.watermark(boolean, tùy chọn): Có thêm watermark hay không.
Khác biệt thường gặp giữa mô hình/chế độ:
Vidu 文生视频: hỗ trợ mô hình viduq3-turbo; text-to-video theo định dạng chính thức.Vidu 图生视频: hỗ trợ mô hình viduq3-turbo; image-to-video một ảnh theo định dạng chính thức.Vidu 首尾帧生视频: hỗ trợ mô hình viduq3-turbo; video từ hai ảnh khung đầu-cuối theo định dạng chính thức.Vidu 参考生视频: hỗ trợ mô hình viduq3-turbo; reference-to-video với nhiều ảnh tham chiếu theo định dạng chính thức.
Ủy quyền
Sử dụng xác thực Bearer Token.
Định dạng: Authorization: Bearer sk-xxxxxx
Nội dung
Vidu là tên mô hình công khai ra bên ngoài, hiện tại công khai viduq3-turbo.
viduq3-turbo "viduq3-turbo"
Đầu vào hình ảnh. Tạo video từ ảnh: 1 ảnh; khung đầu và khung cuối: 2 ảnh; tạo video tham chiếu: 1~7 ảnh.
2 elements["https://example.com/input.jpg"]
Câu lệnh gợi ý tạo video; bắt buộc với văn bản thành video, với ảnh thành video/khung đầu-cuối/video tham chiếu thì truyền theo nhu cầu nghiệp vụ.
"A cinematic product ad with smooth camera motion"
Tham khảo đầu vào chủ thể video tùy chọn để tạo video, sử dụng theo khả năng của mô hình chính thức Vidu.
Nhập theo định dạng thư viện chủ thể video sinh tham khảo, có thể bao gồm các trường như tên chủ thể, ảnh, video hoặc giọng điệu.
Thời lượng video, tính bằng giây. viduq3-turbo Thường dùng 5 giây, có thể đặt theo phạm vi chính thức.
5
Độ phân giải đầu ra, các giá trị thường gặp là 540p, 720p, 1080p.
540p, 720p, 1080p "720p"
Tỷ lệ khung hình đầu ra, thường dùng cho video tạo từ văn bản/tham chiếu, như 16:9, 9:16, 1:1.
16:9, 9:16, 4:3, 3:4, 1:1 "16:9"
Hạt giống ngẫu nhiên.
Biên độ chuyển động, các giá trị thường gặp auto、small、medium、large。
auto, small, medium, large "auto"
Có bật xuất trực tiếp âm thanh và video hay không.
all, speech_only, sound_effect_only Có sử dụng tạo lệch thời gian không.
Có thêm hình mờ hay không.
1, 2, 3, 4 Phản hồi
Tạo nhiệm vụ thành công
ID tác vụ được trả về khi tạo tác vụ, dùng để truy vấn tác vụ.
Trạng thái tác vụ, các giá trị thường gặp created、queueing、processing、success、failed.
created, queueing, processing, success, failed Số điểm đã tiêu hao cho tác vụ này.
