1. Định dạng tương thích OpenAI
Phù hợp với hầu hết các kịch bản tích hợp mới, nên ưu tiên cân nhắc:POST /v1/chat/completionsPOST /v1/responsesGET /v1/responses/{response_id}POST /v1/images/generationsPOST /v1/images/editsPOST /v1/videosGET /v1/videos/{task_id}
- Hệ sinh thái SDK trưởng thành
- Phong cách các trường thống nhất
- Phù hợp để chuyển đổi giữa nhiều mô hình
2. Định dạng gốc của mô hình
Khi bản thân mô hình yêu cầu các trường chuyên dụng, cấu trúc nhiệm vụ chuyên dụng hoặc giao thức truy vấn gốc, hãy công khai giao diện gốc:- Seedance:
/api/v3/contents/generations/tasks - HappyHorse:
/api/v1/services/aigc/video-generation/video-synthesisvà/api/v1/tasks/{task_id} - Vidu:
/ent/v2/text2video、/ent/v2/img2video、/ent/v2/start-end2video、/ent/v2/reference2video和/ent/v2/tasks/{task_id}/creations - Omni và Veo:
gemini-omnisử dụng/v1/videoshoặc/api/v3/contents/generations/tasks; đường dẫn dự trữ gốc của Veo là/v1beta/models/{model}:predictLongRunningvà/v1beta/{operation_name} - Gemini tạo hình ảnh:
/v1beta/models/{model}:generateContent - Tạo nhạc:
/suno/submit/musicvà/suno/fetch/{task_id}, hỗ trợ chế độ mô tả bằng prompt, nhạc nhẹ/nhạc đệm thuần, chế độ nâng cao cho lời bài hát
gemini-omni là tên mô hình video công khai, không cần quan tâm đến mô hình upstream nội bộ; khi gọi video ưu tiên dùng /v1/videos, cũng có thể dùng định dạng tác vụ Seedance /api/v3/contents/generations/tasks. mode=t2v/r2v/edit lần lượt biểu thị tạo video từ văn bản, tạo theo tham chiếu và chỉnh sửa video; trường thời lượng sẽ tự động khớp với các mốc 4 / 6 / 8 / 10 giây.
Phù hợp cho:
- Có nhiều trường đặc thù của mô hình
- Cần cấu trúc body request gốc
- Cần duy trì sự gần gũi với định dạng chính thức của thượng nguồn (upstream)
3. Giao diện video chuyên dụng của mô hình
Hiện tại vẫn công khai một số ít giao diện chuyên dụng của mô hình, ví dụ:POST /kling/v1/videos/text2videoPOST /kling/v1/videos/image2videoPhù hợp cho:- Đã tích hợp dựa trên giao thức chuyên dụng của mô hình tương ứng
- Cần sử dụng chế độ tham số chuyên dụng của mô hình đó
4. Gợi ý lựa chọn
- Dự án mới ưu tiên sử dụng định dạng tương thích OpenAI.
- Nếu định dạng tương thích không thể bao quát các trường đặc thù của mô hình, hãy chuyển sang định dạng gốc.
- Giao diện nhiệm vụ dài nên phân biệt rõ ràng giữa “Giao diện tạo” và “Giao diện truy vấn
- Khi một mô hình có nhiều định dạng gọi, hãy căn cứ vào các trường được hỗ trợ trên trang giao diện tương ứng, không dùng lẫn lộn body request.
