Meta запускает Muse Spark — свою мощнейшую ИИ-модель, но Gemini 3.1 Pro всё еще удерживает лидерство

09.04.2026, 2:45, Технологии
Теги: Бизнес, Здоровье, Здравоохранение, Работа

Первая модель от подразделения Superintelligence нативно мультимодальна, обучена медицинскому анализу и по-настоящему конкурентоспособна. Однако она возглавляет далеко не все рейтинги.

Компания Meta (деятельность компании признана экстремистской и запрещена в РФ) представила свою новую флагманскую модель искусственного интеллекта под названием Muse Spark. Это первая разработка обновленного подразделения ИИ, на создание которого Марк Цукерберг в прошлом году потратил миллиарды долларов в попытке догнать конкурентов.

Согласно данным Meta, в тестах на навыки письма и логическое мышление Muse Spark показала результаты значительно выше предыдущих моделей компании. Она практически сравнялась с топовыми решениями от Google, OpenAI и Anthropic.

Тем не менее, модель всё еще уступает в способностях к программированию — области, которая стала приоритетной для Anthropic и других игроков в «гонке вооружений» ИИ. Примечательно, что анонс Meta состоялся всего через день после заявления Anthropic о том, что их новейшая модель Mythos слишком опасна для открытого релиза из-за угроз кибербезопасности.

За успехами Meta пристально следят. Anthropic, Google и OpenAI традиционно считаются лидерами в разработке базовых моделей ИИ, и Цукерберг, генеральный директор Meta, пообещал сократить этот разрыв любой ценой.

В прошлом году он выделил миллиарды долларов на наем лучших специалистов для создания лаборатории «Суперинтеллекта» (Superintelligence). Новая модель стала проверкой для руководства в лице Александра Ванга — 29-летнего предпринимателя из Кремниевой долины, которого Цукерберг пригласил на пост директора по ИИ (Chief A.I. Officer).

41-летний Цукерберг ранее заявлял, что готов инвестировать 600 миллиардов долларов в новые дата-центры, чтобы победить в ИИ-гонке. В этом году компания (владеющая Facebook, Instagram и WhatsApp) прогнозирует расходы в размере до 135 миллиардов долларов — это почти вдвое больше 72 миллиардов, потраченных в прошлом году. Лидерство в разработке ИИ помогает компаниям не только внедрять инновации, но и переманивать лучшие таланты.

— Новая модель и её показатели — это вопрос репутации Meta в сфере ИИ, — отмечает Майк Пру, директор по исследованиям Forrester. — Это первая реальная проверка того, могут ли колоссальные инвестиции трансформироваться в продукт, способный стоять в одном ряду с лидерами рынка.

Muse Spark, которая внутри компании носила кодовое имя Avocado («Авокадо»), уже доступна в отдельном приложении Meta AI, а в ближайшие недели появится в WhatsApp, Instagram и в умных очках компании.

Хотя Meta долгое время придерживалась стратегии open source (открытого кода), позволяя разработчикам использовать свои модели (семейство Llama), Muse Spark — закрытая модель. Её код останется приватным, хотя в компании не исключают частичного открытия доступа в будущем.

Цукерберг реорганизовал ИИ-подразделение после того, как предыдущая модель, Llama 4, не оправдала ожиданий при запуске год назад. Руководители, отвечавшие за прошлые проекты, покинули компанию, а их места заняли Александр Ванг и выходцы из OpenAI.

Прошлым летом Цукерберг провозгласил новую цель: создание «суперинтеллектуального» ИИ — почти «божественной» технологии, способной стать идеальным персональным помощником. Ради этой цели Meta сократила сотни сотрудников и урезала инвестиции в такие направления, как метавселенная и виртуальная реальность.

Внутри компании создание Muse Spark превратилось в девятимесячный спринт, сопровождавшийся внутренними трениями и задержками. В последние месяцы Цукерберг старался сдерживать ожидания, заявляя в январе, что модель «покажет стремительную траекторию развития», но не станет революционным прорывом.

В среду Meta подтвердила этот настрой, заявив, что продолжает работу над улучшением навыков кодинга, и что в разработке уже находятся более мощные системы. Следующая модель получила внутреннее название Watermelon («Арбуз»).

— Эта стартовая модель по задумке небольшая и быстрая, но при этом достаточно мощная, чтобы решать сложные задачи в области науки, математики и медицины, — заявили в Meta. — Это прочный фундамент, и следующее поколение уже на подходе.

Для обучения модели медицинскому анализу компания привлекла более тысячи врачей. Результаты в тесте HealthBench Hard (бенчмарк для сложных медицинских вопросов) поражают: Muse Spark набрала 42,8 балла, в то время как GPT 5.4 набрала 40,1, а Gemini 3.1 Pro — всего 20,6. И это не просто статистическая погрешность, а серьезный отрыв.

В агентном поиске (DeepSearchQA) Muse Spark также лидирует с результатом 74,8, обходя Gemini (69,7) и GPT 5.4 (73.6). В тесте CharXiv Reasoning (понимание графиков из научных статей) модель набрала 86,4 балла — самый высокий показатель среди всех участников сравнения.

Впрочем, любители «джейлбрейка» взломали ограничения модели в считанные минуты: (здесь могла быть иллюстрация или пример взлома).

Но «хорошо» — не значит «лучше всех». Общая картина бенчмарков показывает, что Gemini 3.1 Pro по-прежнему лидирует в большинстве категорий. Разрыв наиболее заметен в тесте ARC AGI 2 (головоломки на абстрактное мышление): Gemini набрала 76,5 против 42,5 у Muse Spark.

В программировании (LiveCodeBench Pro) результат Gemini (82,9) также выше, чем у Meta (80,0). В мультимодальном понимании (MMMU Pro) Gemini набрала 83,9 против 80,4. В блоге самой Meta признаются текущие пробелы в работе с долгосрочными агентными системами и сложными рабочими процессами кодинга.

«Режим размышления» (Contemplating mode) использует параллельную оркестровку агентов, чтобы поднять «потолок» возможностей модели. В этой конфигурации Muse Spark достигла 58% в тесте Humanity’s Last Exam («Последний экзамен человечества») и 38% в FrontierScience Research. Такие показатели делают её конкурентоспособной не просто со стандартными версиями Gemini и GPT, а с их самыми продвинутыми модификациями.

За этим запуском стоит и важный стратегический сдвиг. Muse Spark — закрытая модель, её архитектура и веса не будут опубликованы. Это резкий отход от политики Llama, которая принесла Meta авторитет в кругах сторонников открытого ИИ. После прохладного приема Llama 4 в начале года Meta, похоже, решила, что следующая глава должна писаться по другим правилам.

Компания надеется открыть исходный код будущих версий Muse, но пока он остается внутри корпорации. Акции техногиганта подскочили почти на 9% в среду после анонса, завершив торги ростом на 6,5% при цене $612,42.

Дополнения и примечания:

Мультимодальность (Natively multimodal): Это означает, что модель изначально обучалась понимать и текст, и изображения, и звук одновременно, а не просто «склеивала» разные модули. Это делает восприятие информации более глубоким и «человечным».
Агентный поиск (Agentic search): Речь идет о способности ИИ не просто выдавать ответ, а действовать как агент: планировать поиск, заходить на разные сайты, сопоставлять данные и проверять факты, прежде чем выдать итоговый результат.
Бенчмарки (HealthBench, ARC AGI 2 и др.): Это стандартизированные тесты для ИИ. Особенно интересен ARC AGI 2 — он проверяет способность модели решать задачи, которые она никогда не видела в обучающей выборке (тест на интеллект, а не на память).
Кодовые имена (Avocado, Watermelon): Использование названий фруктов и ягод — типичная внутренняя традиция в IT-компаниях. Это помогает избежать утечек конкретных данных о продукте до анонса.
Закрытая vs Открытая модель: Meta долгое время была «любимицей» сообщества, потому что давала скачивать свои модели бесплатно (Llama). Переход к закрытой модели Muse Spark говорит о том, что конкуренция стала слишком острой, и компания не хочет дарить свои секреты Google и OpenAI.

Рекомендации:

Александр Ванг: Миллиардер, основатель компании Scale AI, и его переход в Meta стал «тектоническим сдвигом» в индустрии.
Что попробовать: Если вы используете ИИ для здоровья, обратите внимание на акцент на medical reasoning. Похоже, Meta метит в нишу профессионального медицинского ассистента.
Инвестиционный аспект: Рост акций на 9% на одном анонсе показывает, что рынок по-прежнему крайне чувствителен к любым новостям об ИИ-прорывах Meta.

Смотреть комментарии → Комментариев нет

Добавить комментарий


Имя обязательно	E-mail обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam