Сравниваем новые ИИ-модели от Google и ByteDance - Такое кино
 

Сравниваем новые ИИ-модели от Google и ByteDance

03.03.2026, 10:47, Технологии
Теги: ,

Практическое тестирование показывает, чем отличаются новейшие визуальные нейросети в плане цены, скорости и свободы творчества.

На этой неделе с разницей всего в несколько дней вышли две самые мощные на сегодняшний день ИИ-модели для генерации изображений. Они обещают полностью изменить подход к созданию контента.

Nano Banana 2 — внутреннее название Google для Gemini 3.1 Flash Image — вышла 26 февраля и почти мгновенно захватила инфополе. Это преемница Nano Banana Pro, модели, ставшей золотым стандартом ИИ-редактуры после своего релиза в ноябре 2025 года. Seedream 5 Lite, новейшее пополнение в линейке генераторов изображений от ByteDance, была выпущена на несколько дней раньше.

И если первая появилась под громкие фанфары маркетинговой машины Google, то вторая проскользнула почти незамеченной, ограничившись скупым пресс-релизом. Но хотя разрыв во внимании СМИ был колоссальным, разница в их возможностях оказалась куда скромнее.

В чем, собственно, суть?

Обе модели построены на одной и той же базовой архитектурной идее: дать генератору изображений возможность «подумать», прежде чем начать рисовать.

Это означает интеграцию с веб-поиском в реальном времени еще до начала генерации, многоступенчатую цепочку рассуждений (chain-of-thought) для интерпретации сложных или неоднозначных промптов, а также способность работать с референсными изображениями в рамках затяжных процессов редактирования.

Это настоящий качественный сдвиг по сравнению с генеративными моделями годичной давности, когда революционной считалась Stable Diffusion.

Обе новинки выдают разрешение до 4K. Обе поддерживают ввод нескольких референсов для сохранения согласованности в рабочих процессах. Обе способны удерживать визуальную консистентность персонажей и объектов в рамках одной сессии.

Обе умеют генерировать стилизованный, читаемый текст внутри картинок, хотя и с разным успехом. И обе вышли на рынок, где уже присутствуют GPT Image 1.5 от OpenAI, Flux.2 от Black Forest Labs и стремительно растущий каталог китайских моделей, агрессивно конкурирующих за счет цены и гибкости.

Так какой же вариант лучше для конечного пользователя?

Технические характеристики и сравнение цен

Первое, в чем нужно разобраться — разница в цене.

Google оценивает Nano через Gemini API в 60 долларов за миллион сгенерированных токенов изображения. На практике это примерно $0,045 за картинку 512px, $0,067 за 1K, $0,101 за 2K и $0,151 за 4K.

Seedream берет фиксированную плату — $0,035 за изображение, независимо от итогового разрешения. Поэтому для любого размера больше 512px Seedream обходится дешевле.

При разрешении 4K один кадр от Nano стоит в четыре раза дороже. Для производственных конвейеров с большими объемами эта разница набегает очень быстро.

Пути распространения моделей тоже совершенно разные. Nano внедрена во всю потребительскую и разработческую экосистему Google: приложение Gemini, AI-режим в Google Поиске, Google Lens, AI Studio, Vertex AI и Google Flow для создания видео. Она встроена в инфраструктуру, которой уже ежедневно пользуются сотни миллионов людей.

Seedream доходит до пользователей через творческие приложения ByteDance — CapCut и Jianying, через сторонние платформы-агрегаторы API и через Dreamina (специальный интерфейс ByteDance для генерации изображений). Одно ключевое отличие: Seedream можно запускать локально. Google такого не позволяет.

Пользовательский опыт на платформах — еще одно важное отличие. Gemini — это в первую очередь чат-бот, а уже во вторую — генератор картинок. Он отлично и очень быстро создает изображения; заявления Google о скорости подтверждаются на практике.
Но вы работаете внутри диалогового интерфейса, который не был заточен под итеративные визуальные процессы (воркфлоу).

Dreamina же создавалась специально для работы с изображениями. В ней есть специализированные инструменты для управления референсами, многоэтапного редактирования и контроля композиции.

Кроме того, очередь генерации в Dreamina занимает заметно больше времени, чем у Nano через интерфейс Gemini. Для быстрого теста или одной картинки Gemini выдаст результат быстрее. Но для длительных сессий с множеством правок структура Dreamina куда логичнее.

Что касается модерации контента, Gemini в большинстве сценариев отказывается работать с реальными людьми: попросите ее изменить внешность, сделать фотоманипуляцию с публичной фигурой или создать что-то двусмысленное с узнаваемым лицом, и она откажет.

Seedream работает по гораздо более либеральным правилам. ByteDance позволяет редактировать реальные фотографии и работать с узнаваемыми лицами так, как Google никогда не позволит — что во многом объясняет высокую популярность Seedream среди контент-мейкеров.

Если говорить конкретно об API, обе модели поддерживают настройку глубины «рассуждений». Nano позволяет разработчикам устанавливать уровни осмысления от «Минимального» до «Высокого» или «Динамического», позволяя модели обдумывать сложные промпты перед началом рендеринга.

Seedream реализует контроль цепочки рассуждений на уровне архитектуры, тем самым повышая точность следования ТЗ для многосоставных и пространственно сложных задач.

Ни одна из моделей не делает процесс размышления полностью прозрачным для разработчика, но обе справляются со сложными запросами намного лучше, чем их предшественники, у которых этой функции не было.

Стабильность персонажей: тест мини-кампании

Этот тест проверяет, могут ли модели сохранять узнаваемую личность при множественных правках реальной фотографии. Исходником послужило реальное фото пары в торговом центре.

Задача — изменить их одежду и другие элементы кадра на протяжении пяти итераций, сохранив при этом узнаваемость лиц, телосложения и общей визуальной идентичности.

Чат-бот Gemini наотрез отказался работать с реальной фотографией — что соответствует их политике контента. Поэтому тестировать Nano Banana 2 пришлось напрямую через API.

Результаты Nano, хоть и выглядели визуально безупречно, к последним итерациям продемонстрировали сильный «дрифт» (искажение) личностей.

Геометрия сцены сохранилась: светодиодный туннель, перспектива выложенной плиткой дорожки и расположение вывесок на фоне остались цельными.
А вот самих героев фактически заменили. К концу итераций женщина перестала быть похожей на себя. Мужчина и вовсе полностью изменился: другой возраст, другое телосложение, другие черты лица, другая прическа.

Модель выдала красивую картинку, но это были не те люди, что на оригинальном фото. Это можно частично исправить, если загружать референсы для редактирования без лиц, которые могут запутать модель.

Seedream в том же воркфлоу справилась с сохранением идентичности заметно лучше. Строение лица женщины, геометрия ее улыбки и наклон головы оставались привязанными к исходному изображению на протяжении нескольких раундов.

Мужчина сохранил больше особенностей своего первоначального телосложения и физического присутствия. Непрерывность поз между двумя объектами также сохранилась лучше: положение рук, дистанция и стойка остались неизменными. Это критически важно, когда нужно создать ощущение, что это та же самая сцена, а не новая.

Правда, были заметны мелкие огрехи: легкое сглаживание кожи, небольшое изменение формы талии и общее снижение качества прорисовки персонажей.

Но пара оставалась узнаваемой парой. Для рекламных кампаний, где одни и те же люди должны появляться на разных креативах, это различие весьма существенно.

Аутпейнтинг (дорисовка) и расширение холста

В тесте на аутпейнтинг обеим моделям предстояло расширить изображение современной минималистичной гостиной до формата 16:9, естественно дорисовав сцену слева и справа с сохранением освещения и пространственной логики.

Промпт указывал белые стены, бежевый диван, деревянный журнальный столик и комнатные растения — четкое ТЗ с ясными архитектурными параметрами.

Nano Banana 2 выдала чистый, бесшовный результат без видимых артефактов склейки или тональных полос на границах исходного кадра. Цвет стен, баланс дневного света и материал пола остались однородными по всей ширине.

Направление света от предполагаемого окна правдоподобно продолжилось в расширенной области. Технически слияние было почти идеальным.

Однако модель добавила несколько элементов, которых не было в оригинальной сцене, например, корзину справа и здание на заднем плане. Тем не менее, по сравнению с предыдущими моделями это выглядит очень впечатляюще.

Базовый результат Seedream оказался более простым, что облегчило задачу по редактированию.

В расширенной левой части появилось второе большое растение в горшке и полноразмерная штора, что казалось пространственно оправданным относительно источника света.

Правая часть перешла во вторую стену с картиной в рамке и низкой деревянной консолью, сохранив минималистичный язык материалов: светлое дерево, мягкие нейтральные тона — ничего, что противоречило бы эстетике оригинала. Освещение осталось направленно согласованным на всем расширенном кадре.

Плоскость потолка, расположение подвесного светильника и узор паркета «елочкой» сохранили логичное выравнивание. Комната выглядела как правдоподобно расширенный кадр, а не как заново собранный концепт. Мы не заметили никаких явных артефактов или багов.

Для продакшена, где важны пространственная точность и архитектурная достоверность, Seedream 5 Lite здесь оказывается более надежным инструментом. Если же реализм важнее точного соответствия оригиналу, лучшим выбором может стать Nano Banana 2.

Нереалистичная генерация: тест обложки для YouTube

Этот тест перешел от редактирования к чистой генерации со специфическим ТЗ: обложка для YouTube с текстом «AI IMAGE WAR», подзаголовком с названиями обеих моделей, форматом сплит-экрана, крупным жирным текстом слева, контрастными энергичными цветами и соотношением сторон 16:9.

Создание превью требует точной типографики, выверенной композиционной иерархии и мгновенной визуальной экспрессии — всего и сразу.

Nano поняла грамматику YouTube-обложек идеально.

Она выдала композицию с огромной контрастной типографикой слева, драматичным противостоянием лиц в формате сплит-экрана справа, насыщенным неоновым столкновением теплого оранжевого и электрического синего, а также разделяющей молнией по центру, усиливающей динамику «versus».

Иерархия текста была четкой: надпись «AI IMAGE WAR» визуально доминировала благодаря контурной обводке и эффектам свечения, которые хорошо читаются на маленьких экранах смартфонов.

Рендеринг текста был точным, без искажений слов, без мешанины из символов и с равномерным кернингом. Лица получились гипердетализированными и эмоционально напряженными.

Визуальная энергетика зашкаливала. Это выглядело в точности как превью, по которому хочется кликнуть.

Seedream пошла по другому пути. Вместо драматичных фотореалистичных лиц она сгенерировала стилизованных маскотов — персонажа-банан и светящуюся нейронную сферу — репрезентующих каждую из моделей, что придало сравнению более графичный, иконографический вид.

Композиция получилась более чистой и структурированной: доминирующий заголовок, четко читаемый подзаголовок, а названия моделей помещены в рамки для быстрого считывания.

Типографика на уровне: четкая толщина штриха, читаемость при масштабировании, никаких крупных артефактов. Там, где Nano Banana сделала ставку на зрелищность и эмоциональный накал, Seedream выдала нечто менее взрывное, более структурированное и масштабируемое в качестве постоянного визуального стиля.

Это может быть вопросом вкуса, но, по нашему субъективному мнению, для агрессивной оптимизации CTR (кликабельности) кинематографичная интенсивность Nano Banana 2 имеет преимущество.

Реалистичная генерация: точность выполнения множественных условий

В последнем тесте проверялось, насколько точно каждая модель следует детализированному, многосоставному промпту, не нарушая и не искажая ни одно из условий.

ТЗ звучало так: кинематографичный портрет 32-летней женщины-архитектора на крыше на закате, одетой в бежевый тренч и круглые очки, держащей свернутые чертежи именно в левой руке, со слегка расфокусированным горизонтом города на заднем плане, освещением «золотого часа» с мягким контровым светом, малой глубиной резкости, имитирующей объектив 50 мм, вертикальным соотношением сторон 4:5, реалистичной текстурой кожи и легким пленочным зерном. Каждый элемент в этом списке — это условие, которое нейросеть может упустить.

Nano сгенерировала женщину европеоидной внешности, смотрящую в сторону от камеры — нарративное решение, не указанное в промпте, что намекает на склонность модели к творческой интерпретации в ущерб строгому следованию ТЗ.

Бежевый тренч, круглые очки и чертежи в левой руке были отрисованы корректно. Крыша и размытый горизонт присутствовали и выглядели пространственно убедительно.

Освещение золотого часа тоже было, но оно оказалось чуть холодноватым по сравнению с теплыми тонами, которые предполагал промпт. Контровой свет (rim light) был скорее приглушенным, чем четко выраженным. Глубина резкости получилась хорошей, но пространственное сжатие больше походило на объектив 35–40 мм, чем на честные 50 мм.

Пленочное зерно было минимальным, вплоть до незаметности. Текстура кожи выглядела реалистично, но с легким сглаживанием, характерным для диффузионных систем, натренированных на бьюти-ретуши. В целом крепкая работа, но с парой тихих вольностей, где модель сделала выбор за пользователя.

Seedream сгенерировала азиатку, смотрящую прямо в камеру — нейтральный дефолт для промпта, в котором не было указано направление взгляда.

Все заданные элементы присутствовали и были реализованы верно. Теплота золотого часа ощущалась физически (возможно, даже слегка утрированно), с четко выраженным контровым светом, отделяющим героиню от фона, что в точности соответствовало задумке промпта.

Исполнение глубины резкости и фокусное сжатие были гораздо ближе к реальной симуляции 50-мм объектива с естественными пропорциями объекта и фона. Текстура кожи получилась точной, с лучшим сохранением микроконтраста и меньшим количеством артефактов сглаживания, чем у Nano Banana.

Тем не менее, один из чертежей был сгенерирован некорректно и выглядел скорее как артефакт, чем как осмысленный элемент.

Композиционно результат Seedream был более отцентрованным и технически точным, с меньшим количеством отсебятины, но Nano Banana выдала более реалистичное изображение.

Баг консистентности, о котором стоит знать

В ходе продолжительных API-сессий, включающих большой объем последовательных генераций, обе модели продемонстрировали деградацию качества, которой не было в начале работы.

Seedream начала выдавать размытые, нечеткие лица персонажей, которые в ранних генерациях рендерились с высокой резкостью. Nano и вовсе начала терять идентичность объектов, генерируя персонажей, не имеющих ничего общего с героями, заданными в начале сессии.

Казалось, что по мере увеличения длительности сессии обе модели снижают глубину своих рассуждений — словно они тратят меньше усилий на каждую новую картинку пропорционально тому, сколько они уже сделали.

Вызвано ли это намеренным вычислительным ограничением (троттлингом), балансировкой нагрузки при интенсивном API-трафике или какими-то архитектурными особенностями — со стороны неясно.

Но это происходит достаточно стабильно, чтобы учитывать этот фактор при планировании любых производственных процессов с длинными цепочками генераций. Обе модели показывают максимум на старте сессии. Обе деградируют при продолжительных нагрузках.

В идеале, вместо последовательных итераций, стоит запрашивать у модели разумное количество правок за одну итерацию, чтобы избежать деградации.

Но это настоящее искусство. Слишком много правок за один раунд приведут к плохому соблюдению промпта; слишком мало — потребуют последующих итераций, которые разрушат стабильность персонажей.

Итог: кто победил?

Nano выигрывает в рендеринге текста, чистой скорости генерации, интеграции в экосистему и визуальной энергетике изображений. Точность текста — ее самое неоспоримое преимущество: никакой мешанины символов, никаких скачущих шрифтов, никакого дублирования слов.

Она работает быстро. Она доступна в продуктах, которыми уже пользуются миллиарды людей. А ее интеграция с мировыми знаниями (когда модель ищет информацию в сети, прежде чем решить, что рисовать) выдает результаты, которые кажутся редакционно выверенными, а не просто шаблонно красивыми.

Если ваши рабочие процессы завязаны на экосистему Google, если безошибочный текст на картинках критически важен, или если вам нужна быстрая итеративность без работы с фотографиями реальных людей — для этих конкретных задач Nano является более мощным инструментом.

Seedream побеждает в цене, дизайне платформы, свободе контента (отсутствии жесткой цензуры), структурной дисциплине в пространственных задачах и удержании персонажей при многоэтапном редактировании.

Фиксированная цена в $0,035 делает ее практическим стандартом для любых конвейеров потоковой генерации. Специализированный интерфейс Dreamina гораздо логичнее для длительных творческих сессий, чем чат-бот Gemini.

Лояльная политика модерации открывает возможности, за которые Google не возьмется. И для задач, требующих сохранения единой идентичности реальных людей на протяжении множества итераций — а это базовое требование для рекламных кампаний — Seedream показала себя лучше в каждом из проведенных нами тестов.


Смотреть комментарии → Комментариев нет


Добавить комментарий

Имя обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam

ПОСЛЕДНЕЕ

03.03 / «Леди»: Лаконичный, но впечатляющий нигерийский неонуар о дружбе, гендере и секс-работе

03.03 / «Страж короля» — бодрая корейская историческая драма о свергнутом монархе XV века в изгнании

03.03 / Это веселый пиксаровский мультфильм о подростке, пытающемся заговорить с животными и спасти их от злого застройщика

02.03 / Создательница Тилли Норвуд планирует «стремительное расширение» и запуск «Тилливселенной»

02.03 / «Секс в Сент-Луисе»: детектив с Дэвидом Харбором о приложениях для знакомств и изменах бьет по больному

28.02 / Холлидей Грейнджер об ИИ, боевой подготовке и сериале «Захват»

28.02 / Вселенная Человека-паука без Человека-паука абсолютно бессмысленна. Почему Sony не хочет его туда добавить?

27.02 / Крупнейший ИИ-генератор музыки Suno AI пробил отметку в 2 миллиона платных подписчиков

26.02 / Нив Кэмпбелл возвращается в «Крик 7»

26.02 / Netflix или Paramount: кто станет лучшим новым владельцем Warner Bros.?

Политика конфиденциальности - GDPR

Карта сайта →

По вопросам информационного сотрудничества, размещения рекламы и публикации объявлений пишите на адрес: rybinskonline@gmail.com

Поддержать проект:

PayPal – rybinskonline@gmail.com
WebMoney – Z399334682366, E296477880853, X100503068090

18+ © 2026 Такое кино: Самое интересное о культуре, технологиях, бизнесе и политике