Google · Gemini Omni
Gemini Omni: мультимодальное ИИ-видео на мировых знаниях Gemini
Gemini Omni переносит понимание языка, мировые знания и физическое рассуждение Gemini в создание видео. На Yevideo текст в видео, изображение в видео, видео в видео и ИИ-монтаж работают на одной модели — для рекламы, демо продуктов, соцклипов и планов с несколькими референсами.
Мировые знания + физика: сцены, которые логичны
Многие ИИ-ролики проваливаются в логике — гравитация ломается, взаимодействия просачиваются, элементы не совпадают с брифом. Gemini Omni опирается на мировые знания и физику Gemini, чтобы сложные среды и движение нескольких субъектов были убедительнее. Опишите причину, материалы и направление движения, а не груду прилагательных.
Мультимодальные референсы: до 7 изображений + 1 видео в одной квоте
Каждое изображение = 1 единица квоты; каждое референс-видео = 2; изображения + видео×2 ≤ 7. Старт только с текста, фиксация look 1–7 изображениями или референс-клип (≤30 с) для камеры и ритма в видео в видео или ИИ-монтаже — четыре верстака делят один ID модели.
До 4K: от быстрых тестов до презентабельных сэмплов
Выберите 720p, 1080p или 4K; без референс-видео — 4, 6, 8 или 10 секунд и 16:9 или 9:16. Типичный поток: короткие 720p для проверки настроения и движения, затем повышение разрешения. Оценка кредитов до генерации.
Текст в видео: кто / где / как — в исполняемые планы
Референс-изображение не нужно — опишите сцену и сгенерируйте движение. Для сюжетных битов, валидации концептов и маркетинговых идей на стадии текста. Разделяйте субъект, сцену, порядок действий, свет и камеру короткими строками; избегайте противоречий.
- Короткие строки: объект / сцена / действие / свет / движение камеры
- Для сложных битов: сначала… затем… наконец… для времени
- Конкретика о реальном мире (погода, материалы, масштаб)
- Сначала 720p и 8 с, затем разрешение или длительность
Изображение в видео: 1–7 референсов для анимации ключевого визуала
Минимум одно изображение, до семи. Gemini Omni сохраняет look и силуэт, добавляя движение — вращение продукта, анимация персонажа, статичный KV в динамический сэмпл. Текст описывает движение и камеру, не то, что уже в кадре.
- Чёткие субъекты; при нескольких изображениях укажите роль каждого
- Направление, амплитуда и темп движения
- Для сохранения идентичности: что не менять на лице или продукте
- Квота: изображения + видео×2 ≤ 7 — планируйте референсы
Видео в видео: референс-клип + изображения для новых планов, не просто фильтры
Опциональное референс-видео (2 единицы квоты) плюс 1–7 изображений. Сохраняйте ритм камеры или каркас действия, меняя стиль, среду или настроение. С референс-клипом длительность выхода определяет модель, выбор секунд скрыт в верстаке.
- Решите, что даёт клип: камера, действие или темп
- Затем текстом — что оставить и что изменить
- Клип ≤30 с, ≤100 МБ на файл; общая квота ≤7 с изображениями
- Большие смены стиля поэтапно: стабилизировать субъект, затем среду
ИИ-монтаж: relighting, фоны, детали на естественном языке
Фокус на изменении существующего материала, а не новой истории с нуля. Загрузите референс-клип с опциональными изображениями и опишите правки — свет, фон, локальные замены. Видео в видео — новые планы из референсов; редактор — полировка имеющегося.
- Один тип изменения за проход (свет / фон / субъект) надёжнее
- По времени: ярче в начале, ночное окно в середине и т.д.
- Локальные правки: только фон или только руки — не всё лицо
- С референс-видео длительность автоматическая — без ручного выбора секунд
Выберите Gemini Omni в верстаке Yevideo для текста, изображения, видео в видео и ИИ-монтажа в одном потоке.
Для кого Gemini Omni — и какую ценность даёт?
Бренд-креативы, продуктовый маркетинг, авторы и малые команды, которым нужны правдоподобные сложные сцены, гибкие референсы и путь от теста к 4K-сэмплу.
.png)
Фантазия, которая всё ещё кажется реальной
Концепт-реклама часто ломает физику намеренно — зрители должны поверить. Рассуждение Gemini Omni помогает сюрреалистичным идеям оставаться читаемыми в движении с меньшим числом явных ИИ-ошибок.
Частые вопросы
Что такое Gemini Omni и как он связан с Google Gemini?
Gemini Omni — мультимодальная ИИ-видеомодель Google на базе Gemini: мировые знания, физика и гибкие референсы. Yevideo подключается по API для работы в браузере без self-hosting.
Для чего Gemini Omni силён?
Три сильные стороны: мировые знания Gemini для правдоподобных сцен, гибкие мультимодальные референсы (до 7 изображений + 1 видео), один ID модели на четыре верстака. Для тестов рекламы, motion продукта, соцклипов и выравнивания мульти-ассетов.
Как работает квота референсов?
Общая квота 7: каждое изображение = 1, каждое референс-видео = 2. Одно видео оставляет место для 5 изображений; без видео — до 7 изображений. Изображение в видео требует минимум одно изображение.
Как писать промпты для стабильных результатов?
Структура субъект + сцена + действие + камера + настроение отдельными строками; избегайте противоречий света или камеры. С изображениями — движение и объектив, не видимое. С референс-видео укажите, ведёт ли клип камеру или действие и что менять.
Gemini Omni vs Seedance 2.0 или Veo 3.1?
Выбор по задаче. Gemini Omni силён в мировых знаниях и гибком мультимодальном вводе; если лучше подходит другой нативный аудиопоток или вендор — тот же сториборд на обоих и сравнение look и кредитов.
Как считаются кредиты на Yevideo?
По модели, разрешению, длительности и наличию референс-видео. Оценка до генерации. Сначала 720p и короткие клипы; сбои не должны списывать кредиты по текущим правилам сайта.
.webp)
.webp)
.webp)
.webp)
.png)
.png)
.png)