Google · Gemini Omni — mô hình đa phương thức

Gemini Omni: Video AI đa phương thức với tri thức thế giới Gemini

Gemini Omni đưa hiểu ngôn ngữ, tri thức thế giới và lý luận vật lý Gemini vào tạo video. Trên Yevideo bạn chạy văn bản→video, hình→video, video→video và chỉnh sửa video AI trong một mô hình—lý tưởng cho quảng cáo, demo sản phẩm, clip mạng xã hội và cảnh cần nhiều tham chiếu.

Tri thức thế giới + vật lý: cảnh hợp lý

Nhiều video AI sai logic—trọng lực lệch, tương tác xuyên, phần tử không khớp brief. Gemini Omni dựa tri thức thế giới và lý luận vật lý Gemini để môi trường phức tạp và chuyển động đa chủ thể thuyết phục hơn. Nêu rõ nguyên nhân, vật liệu và hướng chuyển động thay vì xếp tính từ.

Tham chiếu đa phương thức: tối đa 7 hình + 1 video trong một hạn mức

Mỗi hình = 1 đơn vị hạn mức; mỗi video tham chiếu = 2; số hình + số video×2 ≤ 7. Bắt đầu chỉ từ văn bản, khóa diện mạo bằng 1–7 hình, hoặc thêm clip tham chiếu (≤30s) cho camera và nhịp trong video→video hoặc chỉnh sửa AI—cả bốn workbench dùng chung ID mô hình.

Đến 4K: từ thử nhanh đến mẫu trình bày được

Chọn 720p, 1080p hoặc 4K; khi không gắn video tham chiếu, chọn 4, 6, 8 hoặc 10 giây và 16:9 hoặc 9:16. Quy trình phổ biến: clip ngắn 720p xác nhận mood và chuyển động, rồi tăng độ phân giải khi giao. Tín dụng ước tính hiện trước khi tạo.

Văn bản-to-video · Gemini Omni

Văn bản-to-video: turn who / where / how into executable shots

Không bắt buộc hình tham chiếu—mô tả cảnh và tạo chuyển động. Tốt cho nhịp câu chuyện, xác nhận concept và ý tưởng marketing còn ở chữ. Tách chủ thể, cảnh, thứ tự hành động, ánh sáng và camera thành dòng ngắn; tránh mô tả mâu thuẫn.

  • Dùng dòng ngắn: chủ thể / cảnh / hành động / ánh sáng / chuyển động camera
  • Với nhịp phức tạp, dùng trước… rồi… cuối cùng… theo thứ tự thời gian
  • Cụ thể tín hiệu thế giới thật (thời tiết, vật liệu, tỷ lệ)
  • Thử 720p và 8s first, then raise resolution hoặc length
Hình ảnh-to-video · Gemini Omni

Hình→video: 1–7 hình tham chiếu để hoạt hình hình chủ đạo

Ít nhất một hình, tối đa bảy. Gemini Omni giữ ngoại hình và silhouette khi thêm chuyển động—tốt cho xoay sản phẩm, animation nhân vật và biến art KV thành mẫu động. Văn bản mô tả chuyển động và camera, không lặp những gì đã có trong khung.

  • Use clear subjects; với multiple images, say what each contributes
  • Mô tả hướng, biên độ và nhịp chuyển động
  • To preserve identity, state what must not change on face hoặc product
  • Hạn mức: hình + video×2 ≤ 7—lên kế hoạch tham chiếu cho phù hợp
Video→video · Gemini Omni trên Yevideo

Video→video: clip tham chiếu + hình cho cảnh mới, không chỉ bộ lọc

Video tham chiếu tùy chọn (2 đơn vị hạn mức) cộng 1–7 hình. Giữ nhịp camera hoặc khung hành động khi đổi phong cách, môi trường hoặc mood. Khi gắn clip tham chiếu, thời lượng đầu ra do mô hình quyết định và điều khiển thời lượng ẩn trong workbench.

  • Quyết định clip tham chiếu cung cấp gì: camera, hành động hay nhịp
  • Rồi nói phần giữ so với đổi bằng văn bản
  • Reference clip ≤30s, ≤100MB per file; total quota ≤7 với images
  • Đổi phong cách lớn: ổn định chủ thể trước, rồi môi trường
Chỉnh sửa video AI · Gemini Omni

Chỉnh sửa video AI: chỉnh sáng, đổi nền, sửa chi tiết bằng ngôn ngữ tự nhiên

Tập trung sửa footage có sẵn thay vì phát minh câu chuyện mới từ đầu. Tải clip tham chiếu với hình tùy chọn và mô tả chỉnh sửa—ánh sáng, nền, thay thế cục bộ. Video→video nhắm cảnh mới từ tham chiếu; trình chỉnh sửa nhắm mài những gì bạn đã có.

  • Một loại thay đổi mỗi lượt (ánh sáng / nền / chủ thể) hiệu quả nhất
  • Mô tả chỉnh sửa theo thời gian: sáng đoạn mở, cửa sổ đêm giữa clip, v.v.
  • Giới hạn chỉnh cục bộ: chỉ nền, hoặc chỉ tay—không phải cả mặt
  • Có video tham chiếu, thời lượng tự động—không chọn giây thủ công

Chọn Gemini Omni trong workbench Yevideo để thử văn bản, hình, video→video và chỉnh sửa AI trong một luồng.

Gemini Omni dành cho ai—và mang giá trị gì?

Sáng tạo thương hiệu, marketer sản phẩm, creator và team indie cần cảnh phức tạp đáng tin, tham chiếu linh hoạt và một đường từ thử đến mẫu 4K.

Thương hiệu & sáng tạo: cách dùng Gemini Omni điển hình trên Yevideo

Fantasy vẫn đọc như thật

Quảng cáo concept thường cố ý phá vật lý—nhưng người xem vẫn phải tin. Lý luận Gemini Omni giúp ý tưởng siêu thực vẫn đọc được khi chuyển động, ít lỗi AI rõ.

Câu hỏi thường gặp

Gemini Omni là gì và liên quan Google Gemini thế nào?

Gemini Omni là mô hình video AI đa phương thức của Google trên nền Gemini—tri thức thế giới, lý luận vật lý và đầu vào tham chiếu linh hoạt. Yevideo kết nối qua API để bạn dùng trên trình duyệt mà không tự host.

Gemini Omni giỏi nhất ở đâu?

Ba điểm mạnh: tri thức thế giới Gemini cho cảnh hợp lý, tham chiếu đa phương thức linh hoạt (tối đa 7 hình + 1 video), và một ID mô hình cho bốn workbench. Tốt cho thử quảng cáo, chuyển động sản phẩm, clip mạng xã hội và đồng bộ tài sản.

Hạn mức tham chiếu hoạt động thế nào?

Tổng hạn mức là 7: mỗi hình = 1, mỗi video tham chiếu = 2. Một clip video còn chỗ cho 5 hình; không video thì tối đa 7 hình. Hình→video cần ít nhất một hình.

Nên viết prompt thế nào để kết quả ổn định hơn?

Dùng chủ thể + cảnh + hành động + camera + mood, mỗi thứ một dòng; tránh ghi chú ánh sáng hoặc camera mâu thuẫn. Với hình, mô tả chuyển động và ống kính—không những gì đã thấy. Với tham chiếu video, nói clip dẫn camera hay hành động và phần muốn đổi.

Gemini Omni vs Seedance 2.0 hoặc Veo 3.1?

Chọn theo tác vụ—không có một người thắng. Gemini Omni nổi ở tri thức thế giới và đầu vào đa phương thức linh hoạt hạn mức; nếu quy trình âm gốc hoặc pipeline nhà cung khác phù hợp hơn, chạy cùng storyboard trên cả hai và so hình ảnh với chi phí tín dụng.

Tín dụng trên Yevideo tính thế nào?

Bảng giá depends on model, resolution, duration, và whether a reference video is attached. Estimates show before generate. Thử 720p và shorter clips first; thất bại jobs should not deduct tín dụng per current site rules.

Yevideo Inspiration