Tạo video
Giao diện tạo video định dạng tương thích OpenAI Sora. Hỗ trợ chế độ tạo từ văn bản thành video và tạo bằng ảnh/video tham chiếu.
POST /v1/videos: Tạo tác vụ videoGET /v1/videos/{video_id}: Truy vấn trạng thái tác vụGET /v1/videos/{video_id}/content: Lấy nội dung nhị phân của video
Hiện chưa cung cấp ra bên ngoài:
GET /v1/videosPOST /v1/videos/{video_id}/remix
Header xác thực tiêu chuẩn:
Content-Type: application/json
POST /v1/videostạo tác vụ, lấyid- Thăm dò
GET /v1/videos/{id}cho đến khicompletedhoặcfailed - Sau khi hoàn tất, ưu tiên sử dụng
video_urltrong kết quả trả về - Nếu cần tải xuống thống nhất, gọi
GET /v1/videos/{id}/content
Tham số cốt lõi:
model: string: Bắt buộc, tên mô hình công khaiprompt: string: Khuyến nghị, mô tả tạo videoseconds: number|string: Tùy chọn, thời lượng mục tiêuduration: number|string: Tùy chọn, bí danh thời lượngsize: string: Tùy chọn, kích thước đầu ramode: string: Tùy chọn, các giá trị phổ biếnt2vi2vi2v_first_lastreference_material
Tham số tương thích thường dùng:
aspect_ratioratioqualityresolutionfpsimageimage_urlimage_urlsimagesreference_imagesinput_referenceend_image_urllast_image_urlvideo_urlsaudio_urlsfunction_modecontentcallback_urlexternal_task_id
Các tham số mở rộng thường dùng của Kling:
model_namenegative_promptcfg_scalesoundcamera_controlimage_listvideo_idtask_idwatermark_info
4.1 Dòng Veo
Lưu ý: stable, official v.v. biểu thị các nhóm khác nhau, không phải hậu tố model dùng đối ngoại; khi gọi, vui lòng giữ model là tên mô hình cơ sở, nhóm tài khoản hoặc mã thông báo sẽ quyết định thực tế đi qua nhóm nào.
Mô hình chính Veo 3.x
veo3veo3-fastveo3-fast-framesveo3-framesveo3-proveo3-pro-framesveo3.1veo3.1-fastveo3.1-proveo3.1-componentsveo3.1-4kveo3.1-pro-4k
Khuyến nghị:
- Với video tạo từ văn bản thuần túy, ưu tiên dùng mô hình chính
veo3*/veo3.1* - Với các tình huống tạo video từ ảnh hoặc từ tham chiếu, nên truyền rõ ràng
mode + image_url/reference_images
4.2 Dòng Sora
Mô hình cơ sở:
sora-2sora-2-pro
Khuyến nghị:
sora-2*phù hợp cho các lệnh gọi thông dụng- Nếu cần sử dụng các nhóm như
stable/official, vui lòng giữmodellà tên mô hình cơ sở, không thêm hậu tố vào sau tên mô hình.
4.3 Dòng Seedance
Mô hình công khai:
doubao-seedance-1-0-lite-t2v-250428doubao-seedance-1-0-lite-i2v-250428doubao-seedance-1-0-pro-250528doubao-seedance-1-0-pro-fast-251015doubao-seedance-1-5-pro-251215doubao-seedance-2-0-260128doubao-seedance-2-0-fast-260128
Khuyến nghị:
- Với tạo video từ văn bản, ưu tiên
*-t2v-*hoặcpro / fast - Với tạo video từ hình ảnh, ưu tiên
*-i2v-* - Với các tình huống có tư liệu tham chiếu phức tạp, ưu tiên dùng
content
4.4 Dòng video Grok
Mô hình công khai:
grok-imagine-1.0-videogrok-imagine-video-1.5-previewgrok-video-3
Tham số thường dùng:
promptratio/aspect_ratioresolution/sizeseconds/durationimage/image_url/input_referencereference_images
Ví dụ:
{
"model": "grok-imagine-1.0-video",
"prompt": "雨夜霓虹街道上的电影感推镜,光影丰富,运动自然",
"reference_images": [
"https://example.com/ref-1.jpg"
],
"seconds": 10,
"aspect_ratio": "16:9",
"resolution": "720P"
}
4.5 Mô hình chính video Kling
Mô hình chính công khai:
kling-video
Bắt buộc:
modelmodel_name
Các model_name được hỗ trợ:
kling-v1kling-v1-5kling-v1-6kling-v2-masterkling-v2-1kling-v2-1-masterkling-v2-5-turbokling-v2-6kling-v3
Các mode phổ biến:
t2vi2vmulti_i2vextend
Tham số đầu vào tối thiểu:
- Tạo video từ văn bản:
model + model_name + prompt + mode=t2v - Tạo video từ hình ảnh:
model + model_name + prompt + mode=i2v + image - Tham chiếu nhiều ảnh:
model + model_name + prompt + mode=multi_i2v + image_list - Kéo dài video:
model + model_name + mode=extend + video_id
Ví dụ:
{
"model": "kling-video",
"model_name": "kling-v2-6",
"mode": "t2v",
"prompt": "海边日落镜头,电影感,风吹长发",
"duration": 5,
"aspect_ratio": "16:9"
}
-
mode=t2v -
Tham số đầu vào tối thiểu:
model + prompt -
mode=i2v -
Tham số đầu vào tối thiểu:
model + prompt + image_url -
mode=i2v_first_last -
Tham số đầu vào tối thiểu:
model + prompt + image_url + end_image_url -
mode=reference_images -
Tham số đầu vào tối thiểu:
model + prompt + reference_images -
mode=reference_material -
Tham số đầu vào tối thiểu:
model + prompt + (image_urls/video_urls/audio_urls 至少一种)
Hướng dẫn gọi Gemini Omni
gemini-omnilà tên mô hình video công khai của new-api, có thể trực tiếp gọi quaPOST /v1/videos.mode=t2v: tạo video từ văn bản, tham số đầu vào tối thiểu làmodel + prompt.mode=r2v: tạo bằng ảnh/tư liệu tham chiếu, ảnh có thể đặt trongimage、image_url、images、image_urls、reference_images、input_referencehoặccontent.mode=edit: chỉnh sửa video, video có thể đặt trongvideo、video_url、videoshoặccontent, đồng thời cũng có thể truyền ảnh tham chiếu.- Trường thời lượng có thể dùng
secondshoặcduration, hệ thống sẽ tự động khớp với các mức 4 / 6 / 8 / 10 giây.
Ủy quyền
Sử dụng xác thực Bearer Token.
Định dạng: Authorization: Bearer sk-xxxxxx
Nội dung
Bắt buộc, tên mô hình công khai. gemini-omni Có thể được gọi thông qua /v1/videos.
sora-2, sora-2-pro, gemini-omni, happyhorse-1.0, happyhorse-1.0-i2v, happyhorse-1.0-t2v, happyhorse-1.0-r2v, happyhorse-1.0-video-edit, doubao-seedance-1-0-lite-i2v-250428, doubao-seedance-1-0-lite-t2v-250428, doubao-seedance-1-0-pro-250528, doubao-seedance-1-0-pro-fast-251015, doubao-seedance-1-5-pro-251215, doubao-seedance-2-0-260128, doubao-seedance-2-0-fast-260128, veo3, veo3-fast, veo3-fast-frames, veo3-frames, veo3-pro, veo3-pro-frames, veo3.1, veo3.1-4k, veo3.1-components, veo3.1-fast, veo3.1-pro, veo3.1-pro-4k, kling-video, grok-imagine-1.0-video, grok-imagine-video-1.5-preview, grok-video-3, viduq3-turbo, hailuo-video "sora-2"
Điểm nhập prompt thống nhất. Bắt buộc với hầu hết các mô hình.
Cổng vào cho một ảnh đơn, một số chế độ tương thích sẽ được ánh xạ tới images.
Đầu vào thời lượng được thống nhất; một số mô hình cũng chấp nhận seconds.
Video width
512
Video height
512
Video frame rate
30
Random seed
20231234
Number of videos to generate
1
Response format
"url"
User identifier
"user-1234"
Container trường mở rộng động. Một số lượng lớn các trường đặc thù của mô hình được giải tuần tự hóa từ đây.
Tùy chọn, chế độ tạo video. gemini-omni Hỗ trợ t2v, r2v, edit.
Điểm vào thống nhất cho nhiều ảnh. Vidu, Seedance, Veo sẽ sử dụng, v.v.
Điểm vào kích thước hợp nhất, sẽ được ánh xạ thành resolution/aspect_ratio, v.v.
Sora điểm vào tương thích, trong thời gian chạy sẽ quay về duration.
Sora/Veo điểm vào ảnh tham chiếu tương thích, có thể là tệp multipart hoặc đối tượng tương thích.
Phản hồi
Đã tạo tác vụ video thành công
Should use VideoStatus constants: VideoStatusQueued, VideoStatusInProgress, VideoStatusCompleted, VideoStatusFailed
queued, in_progress, completed, failed, video_url, url, completed_at Tương thích với giao diện cũ (Sắp ngừng hỗ trợ)
