Google · Gemini Omni
Gemini Omni:Geminiの世界知識を活かしたマルチモーダルAI動画
Gemini Omniは、Geminiの言語理解・世界知識・物理推論を動画制作に取り込むモデルです。Yevideoではテキストから動画、画像から動画、動画から動画、AI動画編集を同一モデルで実行でき、広告・商品デモ・SNSクリップ・複数参照が必要なショットに最適です。
世界知識+物理推論:見た目だけでなく「筋が通る」画面
多くのAI動画は解像度ではなく論理で失敗します—重力の破綻、インタラクションの穿ち、ブリーフと合わない要素。Gemini OmniはGeminiの世界知識と物理推論により、複雑な環境や複数主体の動きをより信頼できる形で生成しやすくなります。因果・素材・動きの方向を明確に書き、形容詞の羅列は避けましょう。
マルチモーダル参照:最大7画像+1動画を1クォータで
画像1枚=クォータ1、参照動画1本=2、画像数+動画数×2≤7。テキストのみから始め、1〜7枚でルックを固定し、動画から動画やAI編集では参照クリップ(最大30秒)でカメラとリズムを制御できます。4つのワークベンチは同一モデルIDを共有します。
最大4K:素早い検証から提示可能なサンプルへ
720p/1080p/4Kを選択。参照動画なしでは4・6・8・10秒、16:9または9:16。まず720pの短尺で雰囲気と動きを確認し、問題なければ1080pや4Kへ—生成前に推定クレジットが表示されます。
テキストから動画:「誰/どこ/どう動く」を実行可能なショットに
参照画像は不要—シーンを記述して動きを生成。ストーリービート、コンセプト検証、まだ言葉だけのマーケ案に最適。主体・シーン・動作順・光・カメラを短い行で分け、矛盾する記述は避けてください。
- 短い行:主体/シーン/動作/光/カメラワーク
- 複雑なビートは「まず…次に…最後に…」で時間順
- 天候・素材・スケールなど現実の手がかりは具体的に
- まず720p・8秒で試し、満足したら解像度や尺を上げる
画像から動画:参照1〜7枚でキービジュアルを動かす
最低1枚、最大7枚。Gemini Omniはルックとシルエットを保ちながら動きを付与—商品回転、キャラアニメ、静止KVの動的サンプルに向きます。テキストは動きとカメラを書き、フレーム内の既知情報は繰り返さないでください。
- 主体がはっきりした画像;複数枚時は各枚の役割を明記
- 動きの方向・振幅・テンポを記述
- 同一性を保つ場合、顔や商品で変えてはいけない点を明示
- クォータ:画像+動画×2≤7—参照を計画
動画から動画:参照クリップ+画像で新ショット、単なるフィルタではない
任意の参照動画(クォータ2)と1〜7枚の画像。カメラリズムやアクションの骨格を保ちつつスタイル・環境・ムードを変更。参照クリップありでは出力尺はモデル決定、ワークベンチの尺選択は非表示になります。
- 参照クリップが提供するものを決める:カメラ/アクション/テンポ
- テキストで残す部分と変える部分を指定
- クリップ≤30秒、1ファイル≤100MB;画像と合計クォータ≤7
- 大きなスタイル変更は段階的に—主体を安定してから環境
AI動画編集:自然言語でライト・背景・細部を修正
既存映像の修正に特化し、ゼロから新しい物語を作る用途ではありません。参照クリップと任意の画像をアップロードし、ライティング・背景・局所置換などを記述。動画から動画は参照から新ショット、編集は既存素材の仕上げ向けです。
- 1パスで1種類の変更(光/背景/主体)が成功率が高い
- 時間順に記述:オープニングを明るく、中盤で夜景の窓など
- 局所編集の範囲を限定:背景のみ、手のみ—顔全体は避ける
- 参照動画ありでは尺は自動—手動の秒数選択なし
YevideoワークベンチでGemini Omniを選び、テキスト・画像・動画から動画・AI編集を一つの流れで体験できます。
Gemini Omniは誰向け?どんな価値がある?
ブランドクリエイティブ、プロダクトマーケ、クリエイター、小規模チーム—複雑で信頼できるシーン、柔軟な参照、試作から4Kサンプルまで一本化したい方に。
.png)
非日常でも「信じられる」ファンタジー
コンセプト広告は意図的に物理を破ることもありますが、視聴者は納得する必要があります。Gemini Omniの推論は、超現実的なアイデアを動きの中でも読みやすく保ち、明らかなAI破綻を減らします。
よくある質問
Gemini Omniとは?Google Geminiとの関係は?
Gemini OmniはGoogleがGeminiのマルチモーダル能力に基づくAI動画モデルで、世界知識・物理推論・柔軟な参照入力が特徴です。YevideoはAPI経由で接続し、ブラウザから利用でき、自前ホスティングは不要です。
Gemini Omniの強みと向いている用途は?
三点が突出:1. 世界知識と物理推論で複雑シーンが信頼しやすい;2. 柔軟なマルチモーダル参照(最大7画像+1動画);3. 4ワークベンチ同一モデルで文生から編集まで連続制作。広告試作、商品モーション、SNS短尺、コンセプト絵コンテに適します。
参照画像・動画のクォータはどう計算されますか?
合計7:画像1枚=1、参照動画1本=2。動画1本(2)なら画像は最大5枚;動画なしなら画像最大7枚。画像から動画は最低1枚必要です。
安定した結果のためのプロンプトの書き方は?
「主体+シーン+動作+カメラ+雰囲気」を行分け;矛盾する光やカメラ記述は避ける。画像ありでは動きとレンズを書き、見えている内容は繰り返さない。参照動画ありでは、クリップがカメラかアクションか、何を変えたいかを明示してください。
Seedance 2.0やVeo 3.1と比べてどう選ぶ?
万能最強はなく、タスク次第。Gemini Omniは世界知識と柔軟なマルチモーダル入力が強み;別ベンダーのネイティブ音声ワークフローが合うなら同一ストーリーボードで並行生成し、仕上がりとクレジットを比較するのが一般的です。
Yevideoでのクレジット計算は?
モデル・解像度・尺・参照動画の有無などで決まり、生成前に推定表示。まず720pと短尺で方向性を試すのがおすすめです。参照動画ありでは出力尺はモデル決定。異常失敗時はクレジットが差し引かれないのが現在のサイトルールです。
.webp)
.webp)
.webp)
.webp)
.png)
.png)
.png)