Google I/O 2026: ИИ, который «симулирует мир», и автономный агент, работающий за вас 24/7
На конференции Google I/O 2026 компания представила два самых амбициозных продукта в истории Gemini.
Первый — нейросеть Omni для генерации видео и целых миров. Второй — персональный ассистент Spark, который сам читает почту, бронирует столики и управляет вашей жизнью, пока вы спите.
Аудитория приложения Google Gemini уже превышает 900 миллионов активных пользователей в месяц. И если до сегодняшнего дня большинство использовало его просто как очень умный чат-бот, то теперь всё изменится навсегда. На конференции Google I/O 2026 технологический гигант анонсировал два прорывных продукта, которые знаменуют переход к новому этапу развития искусственного интеллекта.
Gemini Omni: Шаг к симуляции реальности
Во-первых, Google представила Gemini Omni — мультимодальную ИИ-модель нового поколения, которая объединяет интеллект Gemini с передовыми инструментами генерации медиа (такими как Veo, Nano Banana и Genie).
Выступая на презентации, генеральный директор DeepMind Демис Хассабис описал Omni как «новую модель, способную создать что угодно из любых вводных данных».
— Она выводит понимание устройства мира, мультимодальность и редактирование на совершенно новый уровень, — заявил Хассабис, назвав запуск Omni «важным шагом на пути к созданию AGI (сильного искусственного интеллекта)». По его словам, компания потратила последний год на то, чтобы превратить Gemini в «мировую ИИ-модель, способную понимать и физически симулировать мир».
Первая версия, получившая название Gemini Omni Flash, будет интегрирована в Flow — ИИ-платформу Google для создания фильмов, а также во Flow Music, среду для генерации музыки. Во время презентации Omni в реальном времени сгенерировала пластилиновый образовательный мультфильм о сворачивании белков.
Главный прорыв Omni — это решение «болезни» всех ИИ-генераторов видео. Google утверждает, что новая модель способна сохранять стопроцентную консистентность персонажей, фонов и физики движений даже после внесения правок. Вы можете общаться с ИИ как с живым монтажером: благодаря развитым логическим способностям Gemini, пользователю достаточно описать атмосферу или суть сцены в общих чертах, не объясняя каждую деталь вручную. Также в редактор был добавлен Flow Agent — помощник, который может сам придумывать сцены, сортировать файлы, предлагать сюжетные повороты и массово редактировать проекты без единой строчки кода.
Запуск Omni опирается на грандиозный успех Nano Banana — предыдущего инструмента Google для редактирования изображений, который прошлой осенью помог Gemini впервые с 2022 года обойти ChatGPT по количеству скачиваний.
Gemini Spark: Агент, который никогда не спит
Если Omni создает миры, то второй анонс призван управлять вашей жизнью в реальном. Google представила Gemini Spark — персонального ИИ-агента, который не ждет ваших указаний. Он круглосуточно управляет задачами в разных приложениях, обращает ваше внимание на самое важное и выполняет фоновую работу, пока вы заняты своими делами или даже спите.
Spark работает на базе архитектуры Gemini 3.5 и платформы Antigravity — той самой агентной инфраструктуры, на которой строятся внутренние инструменты Google. В отличие от конкурирующих систем (вроде OpenClaw или Hermes), Spark живет в облаке на выделенных виртуальных машинах Google. Вам не нужно держать телефон разблокированным, а ноутбук открытым, чтобы агент продолжал работать.
Что умеет Spark прямо из коробки?
- Автоматически сканировать ежемесячные выписки по кредиткам в поисках новых или скрытых платных подписок.
- Читать школьную переписку ваших детей, вычленять важные дедлайны и присылать вам с партнером короткую ежедневную сводку.
- Собирать разрозненные заметки со встреч из Gmail и Docs, превращать их в чистовой документ и самостоятельно отправлять follow-up письма коллегам для запуска следующего этапа проекта.
При этом агента можно обучать собственным навыкам, по сути программируя под себя его логику работы. К слову, еще на прошлой неделе датамайнеры нашли упоминания «Gemini Spark» (ранее известного как проект Remy) в бета-версии Android-приложения. В слитом коде был дисклеймер, который Google оставила и в финальном релизе: «Spark может делиться вашей информацией или совершать покупки без спроса». И хотя алгоритм настроен запрашивать разрешение перед важными операциями, компания настоятельно рекомендует присматривать за ним.
На старте Spark нативно интегрирован в Gmail, Docs, Slides и всю экосистему Google Workspace. Кроме того, благодаря протоколу MCP, он сразу получил доступ к сторонним сервисам вроде Canva, OpenTable и Instacart. Это значит, что ИИ может не просто написать черновик письма, а физически забронировать вам столик в ресторане или заказать доставку продуктов на дом.
Этим летом Google планирует добавить возможность общаться со Spark по SMS и почте, создавать кастомных «субагентов» и позволить ИИ управлять вашим локальным браузером и файлами на macOS.
Тенденция на создание автономных ИИ-агентов назревала долгие месяцы. И Spark — это ответ Google на всё сразу: больше никаких терминалов, сложной настройки и репозиториев на GitHub. Только 900 миллионов готовых пользователей, глубочайшая интеграция с привычными инструментами и агент, который начинает работать в ту же секунду, как вы его включаете.
Доверенные тестировщики получат доступ к новинке уже на этой неделе. А на следующей неделе бета-версия откроется для американских подписчиков тарифа Google AI Ultra (стоимость которого компания, к слову, снизила с умопомрачительных 250 до 200 долларов в месяц).
Примечания:
- Демис Хассабис (Demis Hassabis, род. 1976) — британский учёный в области ИИ, генеральный директор Google DeepMind. В 2024 году получил Нобелевскую премию по химии за работу над AlphaFold. Один из наиболее влиятельных людей в мире искусственного интеллекта.
- Gemini Omni — Omni (от лат. omnis — «всё, каждый») указывает на всеобъемлющую, универсальную природу модели: она работает со всеми модальностями — текстом, изображением, видео, звуком. Название перекликается с философским понятием «омнипотентности» (всемогущества) — намёк на то, что модель может «делать всё».
- Veo — модель генерации видео от Google DeepMind, впервые представленная в 2024 году. Veo способна создавать высококачественные видеоролики по текстовым описаниям. В Gemini Omni Veo используется как один из компонентов видеогенерации.
- Nano Banana — модель ИИ-редактирования изображений от Google, получившая широкую популярность благодаря интуитивному диалоговому интерфейсу: пользователь мог редактировать фотографии простыми текстовыми командами («убери человека с фона», «сделай небо фиолетовым»). Название «Nano Banana» — характерное для Google «игривое» именование (как имена Android-версий, названные в честь десертов). Модель помогла Gemini впервые обойти ChatGPT по загрузкам в App Store.
- Genie — модель от Google DeepMind, способная генерировать интерактивные 3D-среды из изображений или текстовых описаний. Название отсылает к джинну из лампы — существу, исполняющему желания.
- Google I/O — ежегодная конференция разработчиков Google, проходящая в Маунтин-Вью (Калифорния). На I/O традиционно анонсируются ключевые продукты и технологии компании. I/O 2026 стала площадкой для презентации сразу нескольких крупных обновлений экосистемы Gemini.
- DeepMind — лаборатория искусственного интеллекта, основанная в Лондоне в 2010 году Демисом Хассабисом, Шейном Леггом и Мустафой Сулейманом. В 2014 году приобретена Google. DeepMind стоит за рядом прорывных достижений в области ИИ: AlphaGo (победа в го над чемпионом мира, 2016), AlphaFold (предсказание структуры белков, 2020), Gemini (семейство мультимодальных моделей, 2023–).
- Gemini Omni Flash — «Flash» в названии указывает на облегчённую, ускоренную версию модели (аналогично Gemini 1.5 Flash — быстрой версии Gemini 1.5 Pro). Flash-версии обычно работают быстрее и дешевле, но с некоторыми компромиссами в качестве.
- Flow — платформа Google для ИИ-кинематографа, позволяющая создавать и редактировать видео с помощью ИИ. Flow объединяет несколько инструментов (генерация, редактирование, монтаж) в едином интерфейсе.
- Flow Music — компонент платформы Flow, ориентированный на создание музыки с помощью ИИ. Появление Flow Music указывает на то, что Google рассматривает генерацию музыки как часть единой мультимодальной экосистемы.
- Искусственный общий интеллект (AGI — Artificial General Intelligence) — гипотетический уровень развития ИИ, при котором система способна выполнять любые интеллектуальные задачи на уровне человека или выше. Термин противопоставляется «узкому ИИ» (ANI — Artificial Narrow Intelligence), который специализируется на конкретных задачах. Хассабис неоднократно заявлял, что AGI может быть достигнут в ближайшие годы; описание Omni как «шага к AGI» — значимое заявление.
- Модель мира (world model) — концепция «модели мира» в ИИ означает систему, которая строит внутреннее представление о физическом мире и может предсказывать, как этот мир будет меняться под воздействием различных факторов. Человеческий мозг — пример «модели мира»: мы можем представить, что произойдёт, если бросить мяч, не проводя физического эксперимента. Модели-миры в ИИ — активная область исследований; к ним относятся Sora (OpenAI), Genie (Google) и World Labs (стартап Фэй-Фэй Ли).