Google · Gemini Omni

Gemini Omni: мультимодальное ИИ-видео на мировых знаниях Gemini

Gemini Omni переносит понимание языка, мировые знания и физическое рассуждение Gemini в создание видео. На Yevideo текст в видео, изображение в видео, видео в видео и ИИ-монтаж работают на одной модели — для рекламы, демо продуктов, соцклипов и планов с несколькими референсами.

Мировые знания + физика: сцены, которые логичны

Многие ИИ-ролики проваливаются в логике — гравитация ломается, взаимодействия просачиваются, элементы не совпадают с брифом. Gemini Omni опирается на мировые знания и физику Gemini, чтобы сложные среды и движение нескольких субъектов были убедительнее. Опишите причину, материалы и направление движения, а не груду прилагательных.

Мультимодальные референсы: до 7 изображений + 1 видео в одной квоте

Каждое изображение = 1 единица квоты; каждое референс-видео = 2; изображения + видео×2 ≤ 7. Старт только с текста, фиксация look 1–7 изображениями или референс-клип (≤30 с) для камеры и ритма в видео в видео или ИИ-монтаже — четыре верстака делят один ID модели.

До 4K: от быстрых тестов до презентабельных сэмплов

Выберите 720p, 1080p или 4K; без референс-видео — 4, 6, 8 или 10 секунд и 16:9 или 9:16. Типичный поток: короткие 720p для проверки настроения и движения, затем повышение разрешения. Оценка кредитов до генерации.

Текст в видео · Gemini Omni

Текст в видео: кто / где / как — в исполняемые планы

Референс-изображение не нужно — опишите сцену и сгенерируйте движение. Для сюжетных битов, валидации концептов и маркетинговых идей на стадии текста. Разделяйте субъект, сцену, порядок действий, свет и камеру короткими строками; избегайте противоречий.

  • Короткие строки: объект / сцена / действие / свет / движение камеры
  • Для сложных битов: сначала… затем… наконец… для времени
  • Конкретика о реальном мире (погода, материалы, масштаб)
  • Сначала 720p и 8 с, затем разрешение или длительность
Изображение в видео · Gemini Omni

Изображение в видео: 1–7 референсов для анимации ключевого визуала

Минимум одно изображение, до семи. Gemini Omni сохраняет look и силуэт, добавляя движение — вращение продукта, анимация персонажа, статичный KV в динамический сэмпл. Текст описывает движение и камеру, не то, что уже в кадре.

  • Чёткие субъекты; при нескольких изображениях укажите роль каждого
  • Направление, амплитуда и темп движения
  • Для сохранения идентичности: что не менять на лице или продукте
  • Квота: изображения + видео×2 ≤ 7 — планируйте референсы
Видео в видео · Gemini Omni

Видео в видео: референс-клип + изображения для новых планов, не просто фильтры

Опциональное референс-видео (2 единицы квоты) плюс 1–7 изображений. Сохраняйте ритм камеры или каркас действия, меняя стиль, среду или настроение. С референс-клипом длительность выхода определяет модель, выбор секунд скрыт в верстаке.

  • Решите, что даёт клип: камера, действие или темп
  • Затем текстом — что оставить и что изменить
  • Клип ≤30 с, ≤100 МБ на файл; общая квота ≤7 с изображениями
  • Большие смены стиля поэтапно: стабилизировать субъект, затем среду
ИИ-монтаж видео · Gemini Omni

ИИ-монтаж: relighting, фоны, детали на естественном языке

Фокус на изменении существующего материала, а не новой истории с нуля. Загрузите референс-клип с опциональными изображениями и опишите правки — свет, фон, локальные замены. Видео в видео — новые планы из референсов; редактор — полировка имеющегося.

  • Один тип изменения за проход (свет / фон / субъект) надёжнее
  • По времени: ярче в начале, ночное окно в середине и т.д.
  • Локальные правки: только фон или только руки — не всё лицо
  • С референс-видео длительность автоматическая — без ручного выбора секунд

Выберите Gemini Omni в верстаке Yevideo для текста, изображения, видео в видео и ИИ-монтажа в одном потоке.

Для кого Gemini Omni — и какую ценность даёт?

Бренд-креативы, продуктовый маркетинг, авторы и малые команды, которым нужны правдоподобные сложные сцены, гибкие референсы и путь от теста к 4K-сэмплу.

Бренд и креатив: типичное использование Gemini Omni на Yevideo

Фантазия, которая всё ещё кажется реальной

Концепт-реклама часто ломает физику намеренно — зрители должны поверить. Рассуждение Gemini Omni помогает сюрреалистичным идеям оставаться читаемыми в движении с меньшим числом явных ИИ-ошибок.

Частые вопросы

Что такое Gemini Omni и как он связан с Google Gemini?

Gemini Omni — мультимодальная ИИ-видеомодель Google на базе Gemini: мировые знания, физика и гибкие референсы. Yevideo подключается по API для работы в браузере без self-hosting.

Для чего Gemini Omni силён?

Три сильные стороны: мировые знания Gemini для правдоподобных сцен, гибкие мультимодальные референсы (до 7 изображений + 1 видео), один ID модели на четыре верстака. Для тестов рекламы, motion продукта, соцклипов и выравнивания мульти-ассетов.

Как работает квота референсов?

Общая квота 7: каждое изображение = 1, каждое референс-видео = 2. Одно видео оставляет место для 5 изображений; без видео — до 7 изображений. Изображение в видео требует минимум одно изображение.

Как писать промпты для стабильных результатов?

Структура субъект + сцена + действие + камера + настроение отдельными строками; избегайте противоречий света или камеры. С изображениями — движение и объектив, не видимое. С референс-видео укажите, ведёт ли клип камеру или действие и что менять.

Gemini Omni vs Seedance 2.0 или Veo 3.1?

Выбор по задаче. Gemini Omni силён в мировых знаниях и гибком мультимодальном вводе; если лучше подходит другой нативный аудиопоток или вендор — тот же сториборд на обоих и сравнение look и кредитов.

Как считаются кредиты на Yevideo?

По модели, разрешению, длительности и наличию референс-видео. Оценка до генерации. Сначала 720p и короткие клипы; сбои не должны списывать кредиты по текущим правилам сайта.

Yevideo Inspiration