Google · Gemini Omni

Gemini Omni: วิดีโอ AI ต่อเนื่องหลายรูปแบบที่ขับเคลื่อนโดยความรู้ของโลกราศีเมถุน

Gemini Omni นำความเข้าใจภาษา ความรู้ระดับโลก และการให้เหตุผลทางฟิสิกส์ของ Gemini มาสู่การสร้างวิดีโอ บน Yevideo คุณสามารถเรียกใช้การตัดต่อข้อความเป็นวิดีโอ รูปภาพเป็นวิดีโอ วิดีโอเป็นวิดีโอ และการตัดต่อวิดีโอ AI ด้วยโมเดลเดียว ซึ่งเหมาะสำหรับโฆษณา การสาธิตผลิตภัณฑ์ คลิปโซเชียล และช็อตที่ต้องการการอ้างอิงหลายรายการ

ความรู้ระดับโลก + ฟิสิกส์: ฉากที่สมเหตุสมผล

วิดีโอ AI จำนวนมากล้มเหลวตามตรรกะ เช่น การแตกของแรงโน้มถ่วง คลิปการโต้ตอบ องค์ประกอบไม่ตรงกับบรีฟ Gemini Omni อาศัยความรู้ทางโลกและเหตุผลทางฟิสิกส์ของ Gemini ซึ่งทำให้สภาพแวดล้อมที่ซับซ้อนและการเคลื่อนไหวหลายวิชามีความน่าเชื่อถือมากขึ้น สะกดสาเหตุ เนื้อหา และทิศทางการเคลื่อนไหว แทนที่จะเรียงคำคุณศัพท์ซ้อนกัน

การอ้างอิงต่อเนื่องหลายรูปแบบ: สูงสุด 7 รูปภาพ + 1 วิดีโอภายใต้โควต้าเดียว

แต่ละภาพมีราคา 1 หน่วยโควต้า วิดีโออ้างอิงแต่ละรายการมีราคา 2; จำนวนรูปภาพ + จำนวนวิดีโอ×2 จะต้องคงอยู่ ≤ 7 เริ่มจากข้อความเท่านั้น ล็อครูปลักษณ์ด้วยรูปภาพ 1–7 รูป หรือเพิ่มคลิปอ้างอิงหนึ่งคลิป (≤30 วินาที) สำหรับกล้องและจังหวะในการตัดต่อวิดีโอเป็นวิดีโอหรือ AI—ทั้งสี่โต๊ะทำงานใช้ ID รุ่นเดียวกัน

สูงถึง 4K: ตั้งแต่การทดสอบอย่างรวดเร็วไปจนถึงตัวอย่างที่เรียบร้อย

เลือก 720p, 1080p หรือ 4K; เมื่อไม่ได้แนบวิดีโออ้างอิง ให้เลือก 4, 6, 8 หรือ 10 วินาที และ 16:9 หรือ 9:16 ขั้นตอนการทำงานทั่วไป: คลิปสั้น 720p เพื่อตรวจสอบอารมณ์และการเคลื่อนไหว จากนั้นเพิ่มความละเอียดในการส่ง เครดิตโดยประมาณจะแสดงก่อนที่คุณจะสร้าง

การแปลงข้อความเป็นวิดีโอ · Gemini Omni

ข้อความเป็นวิดีโอ: เปลี่ยนใคร / ที่ไหน / อย่างไรให้เป็นช็อตปฏิบัติการ

ไม่จำเป็นต้องมีภาพอ้างอิง—อธิบายฉากและสร้างการเคลื่อนไหว เหมาะที่สุดสำหรับจังหวะของเรื่องราว การตรวจสอบแนวคิด และแนวคิดทางการตลาดที่ยังคงเป็นคำพูด แบ่งวัตถุ ฉาก ลำดับการกระทำ แสง และกล้องออกเป็นเส้นสั้นๆ หลีกเลี่ยงคำอธิบายที่ขัดแย้งกัน

  • ใช้เส้นสั้นๆ: วัตถุ / ฉาก / แอ็กชัน / แสง / การเคลื่อนไหวของกล้อง
  • สำหรับจังหวะที่ซับซ้อน ใช้ก่อน... จากนั้น... สุดท้าย... เพื่อเรียงลำดับเวลา
  • มีความเฉพาะเจาะจงเกี่ยวกับสัญญาณในโลกแห่งความเป็นจริง (สภาพอากาศ วัสดุ ขนาด)
  • ลองใช้ 720p และ 8 วินาทีก่อน จากนั้นจึงเพิ่มความละเอียดหรือความยาว
จากภาพเป็นวิดีโอ · Gemini Omni

รูปภาพต่อวิดีโอ: รูปภาพอ้างอิง 1–7 รูปเพื่อทำให้ภาพหลักของคุณเคลื่อนไหว

อย่างน้อยหนึ่งภาพ สูงสุดเจ็ดภาพ Gemini Omni คงรูปลักษณ์และภาพเงาในขณะที่เพิ่มการเคลื่อนไหว เหมาะสำหรับการหมุนผลิตภัณฑ์ แอนิเมชันของตัวละคร และเปลี่ยนงานศิลปะ KV ให้เป็นตัวอย่างแบบไดนามิก ข้อความควรอธิบายการเคลื่อนไหวและกล้อง ไม่ใช่ทำซ้ำสิ่งที่อยู่ในเฟรม

  • ใช้วัตถุที่ชัดเจน ด้วยภาพหลายภาพ ให้บอกสิ่งที่แต่ละภาพมีส่วนช่วย
  • อธิบายทิศทาง ความกว้าง และจังหวะของการเคลื่อนไหว
  • เพื่อรักษาเอกลักษณ์ ให้ระบุสิ่งที่ต้องไม่เปลี่ยนแปลงบนใบหน้าหรือผลิตภัณฑ์
  • โควต้า: รูปภาพ + วิดีโอ×2 ≤ 7—วางแผนการอ้างอิงตามนั้น
วิดีโอเป็นวิดีโอ · Gemini Omni

วิดีโอเป็นวิดีโอ: คลิปอ้างอิง + รูปภาพสำหรับช็อตใหม่ ไม่ใช่แค่ฟิลเตอร์

วิดีโออ้างอิงเสริม (2 หน่วยโควต้า) พร้อมรูปภาพ 1–7 ภาพ รักษาจังหวะของกล้องหรือฉากแอ็คชั่นในขณะที่เปลี่ยนสไตล์ สภาพแวดล้อม หรืออารมณ์ เมื่อแนบคลิปอ้างอิง ระยะเวลาเอาต์พุตจะถูกกำหนดโดยแบบจำลอง และการควบคุมระยะเวลาจะถูกซ่อนไว้ในโต๊ะทำงาน

  • ตัดสินใจว่าคลิปอ้างอิงมีอะไรบ้าง: กล้อง แอ็กชัน หรือจังหวะ
  • จากนั้นพูดว่าอะไรควรเก็บเทียบกับการเปลี่ยนแปลงในข้อความ
  • คลิปอ้างอิง ≤30s, ≤100MB ต่อไฟล์ โควต้าทั้งหมด ≤7 พร้อมรูปภาพ
  • สำหรับการเปลี่ยนแปลงสไตล์ครั้งใหญ่ เวที: ทำให้วัตถุมั่นคงก่อน จากนั้นจึงสร้างสภาพแวดล้อม
ตัดต่อวิดีโอด้วย AI · Gemini Omni

การแก้ไขวิดีโอ AI: ปรับแสง สลับพื้นหลัง แก้ไขรายละเอียดในภาษาธรรมชาติ

มุ่งเน้นไปที่การแก้ไขฟุตเทจที่มีอยู่แทนที่จะสร้างเรื่องราวใหม่ตั้งแต่ต้น อัปโหลดคลิปอ้างอิงพร้อมรูปภาพเสริมและอธิบายการแก้ไข เช่น การจัดแสง พื้นหลัง การแทนที่ในเครื่อง วิดีโอต่อวิดีโอกำหนดเป้าหมายช็อตใหม่จากการอ้างอิง ตัวแก้ไขมีเป้าหมายที่จะขัดเกลาสิ่งที่คุณมีอยู่แล้ว

  • การเปลี่ยนแปลงหนึ่งระดับต่อการผ่าน (แสง / พื้นหลัง / วัตถุ) ทำงานได้ดีที่สุด
  • อธิบายการแก้ไขตามลำดับเวลา: เพิ่มความสว่างในการเปิด คลิปกลางหน้าต่างตอนกลางคืน ฯลฯ
  • ขอบเขตการแก้ไขเฉพาะที่: พื้นหลังเท่านั้น หรือมือเท่านั้น ไม่ใช่ทั้งใบหน้า
  • สำหรับวิดีโออ้างอิง ระยะเวลาจะเป็นแบบอัตโนมัติ ไม่ต้องใช้ตัวเลือกวินาทีแบบแมนนวล

เลือก Gemini Omni ในโต๊ะทำงาน Yevideo เพื่อลองแก้ไขข้อความ รูปภาพ วิดีโอเป็นวิดีโอ และ AI ในขั้นตอนเดียว

Gemini Omni มีไว้เพื่อใคร และมีประโยชน์อะไร?

ครีเอทีฟของแบรนด์ นักการตลาดผลิตภัณฑ์ ครีเอเตอร์ และทีมงานอินดี้ที่ต้องการฉากที่ซับซ้อนน่าเชื่อ ข้อมูลอ้างอิงที่ยืดหยุ่น และเส้นทางเดียวตั้งแต่การทดสอบไปจนถึงตัวอย่าง 4K

แบรนด์และความคิดสร้างสรรค์: Gemini Omni ทั่วไปใช้กับ Yevideo

แฟนตาซีที่ยังอ่านเหมือนจริง

โฆษณาแนวความคิดมักจะทำลายหลักฟิสิกส์ตามจุดประสงค์ แต่ผู้ดูยังคงต้องยอมรับเหตุผล การใช้เหตุผลของ Gemini Omni ช่วยให้แนวคิดเหนือจริงสามารถอ่านได้ในขณะเคลื่อนไหวโดยมีช่วงพักของ AI ที่ชัดเจนน้อยลง

คำถามที่พบบ่อย

Gemini Omni คืออะไร และเกี่ยวข้องกับ Google Gemini อย่างไร

Gemini Omni เป็นโมเดลวิดีโอ AI ต่อเนื่องหลายรูปแบบของ Google ที่สร้างขึ้นจากความสามารถของ Gemini ไม่ว่าจะเป็นความรู้ระดับโลก การใช้เหตุผลทางฟิสิกส์ และการป้อนข้อมูลอ้างอิงที่ยืดหยุ่น Yevideo เชื่อมต่อผ่าน API เพื่อให้คุณสามารถใช้งานได้ในเบราว์เซอร์โดยไม่ต้องโฮสต์ด้วยตนเอง

Gemini Omni เก่งที่สุดในเรื่องอะไร?

จุดแข็งสามประการที่โดดเด่น: ความรู้เกี่ยวกับโลกของราศีเมถุนสำหรับฉากที่เป็นไปได้ การอ้างอิงต่อเนื่องหลายรูปแบบที่ยืดหยุ่น (สูงสุด 7 ภาพ + 1 วิดีโอ) และรหัสโมเดลหนึ่งรหัสบนโต๊ะทำงานสี่ตัว เหมาะสำหรับการทดสอบโฆษณา ความเคลื่อนไหวของผลิตภัณฑ์ คลิปโซเชียล และการจัดตำแหน่งหลายเนื้อหา

โควต้าอ้างอิงทำงานอย่างไร

โควต้าทั้งหมดคือ 7: แต่ละภาพ = 1, แต่ละวิดีโออ้างอิง = 2 คลิปวิดีโอหนึ่งคลิปเหลือที่ว่างสำหรับ 5 ภาพ; หากไม่มีวิดีโอคุณสามารถใช้ภาพได้สูงสุด 7 ภาพ รูปภาพต่อวิดีโอต้องมีรูปภาพอย่างน้อยหนึ่งภาพ

ฉันจะเขียนพรอมต์เพื่อให้ได้ผลลัพธ์ที่เสถียรยิ่งขึ้นได้อย่างไร

ใช้วัตถุ + ฉาก + แอ็กชัน + กล้อง + อารมณ์ แยกบรรทัด หลีกเลี่ยงแสงที่ขัดแย้งกันหรือบันทึกย่อของกล้อง ด้วยรูปภาพ ให้อธิบายการเคลื่อนไหวและเลนส์ ไม่ใช่สิ่งที่มองเห็นอยู่แล้ว ด้วยการอ้างอิงวิดีโอ ให้บอกว่าคลิปนั้นขับเคลื่อนกล้องหรือแอ็คชั่น และคุณต้องการการเปลี่ยนแปลงอะไร

Gemini Omni กับ Seedance 2.0 หรือ Veo 3.1?

เลือกตามงาน—ไม่ใช่ผู้ชนะแม้แต่คนเดียว Gemini Omni นำเสนอความรู้ระดับโลกและการป้อนข้อมูลต่อเนื่องหลายรูปแบบที่ยืดหยุ่นตามโควต้า หากเวิร์กโฟลว์เสียงเนทิฟหรือไปป์ไลน์ของผู้จำหน่ายรายอื่นเหมาะสมกว่า ให้เรียกใช้สตอรี่บอร์ดเดียวกันทั้งสองรายการ แล้วเปรียบเทียบรูปลักษณ์และต้นทุนเครดิต

เครดิตคำนวณบน Yevideo อย่างไร

ราคาขึ้นอยู่กับรุ่น ความละเอียด ระยะเวลา และการแนบวิดีโออ้างอิงหรือไม่ การประมาณการแสดงก่อนที่จะสร้าง ลองใช้คลิปขนาด 720p และสั้นกว่านี้ก่อน งานที่ล้มเหลวไม่ควรหักเครดิตตามกฎของไซต์ปัจจุบัน

Yevideo แรงบันดาลใจ