Конец эпохи программистов и защитников данных? Разбираем слив секретной нейросети Anthropic
«Самая мощная» ИИ-модель Claude Mythos от Anthropic утекла в сеть: ее уже назвали главной угрозой кибербезопасности
Новое поколение нейросетей от Anthropic, получившее название Claude Mythos, считается «качественным скачком» в развитии ИИ — и потенциально плохой новостью для индустрии киберзащиты.
Создатель нейросети Claude, компания Anthropic, разрабатывает новую ИИ-модель под названием Claude Mythos. Внутри компании ее называют самым совершенным алгоритмом на сегодняшний день. На этой неделе черновики материалов об этой закрытой системе утекли в сеть.
О существовании модели впервые сообщило издание Fortune в четверг, после того как неопубликованные файлы, связанные с блогом Anthropic, были обнаружены в открытом кэше данных. Представитель компании подтвердил журналистам факт разработки модели.
— Мы разрабатываем модель общего назначения со значительными улучшениями в области логического мышления, написания кода и кибербезопасности, — заявил представитель Anthropic изданию Fortune. — Учитывая невероятную мощь ее возможностей, мы крайне осторожно подходим к релизу. Как это принято в индустрии, сейчас мы тестируем алгоритм с небольшой закрытой группой клиентов. Мы считаем эту модель качественным скачком и самым сильным продуктом из всех, что мы создали на данный момент.
В архивной версии страницы разработчиков, с которой ознакомилось издание Decrypt, Anthropic называет Mythos «самой мощной ИИ-моделью, которую мы когда-либо разрабатывали».
— Mythos — это новое имя для совершенно нового уровня: более масштабного и умного, чем наши модели линейки Opus, которые до сих пор были нашими флагманами, — пишет Anthropic. — Мы выбрали это название, чтобы подчеркнуть глубокие внутренние связи, объединяющие знания и идеи.
По заявлениям разработчиков, Mythos набрала «кардинально более высокие» баллы, чем модель Claude Opus 4.6, в тестах на написание программного кода, академическое мышление и кибербезопасность.
Судя по всему, утечка Mythos произошла из-за черновых текстов, хранившихся в незащищенной системе управления контентом (CMS). По данным Fortune, Anthropic закрыла публичный доступ к хранилищу данных сразу после того, как получила уведомление о том, что файлы индексируются в поиске. Компания списала инцидент на человеческий фактор при настройке конфигурации CMS-инструментов.
При этом в документах Anthropic модель Mythos обозначается лишь как первая версия нового поколения алгоритмов. Вторая версия фигурирует во внутренних файлах под кодовым названием Capybara («Капибара») — ее компания также позиционирует выше своей текущей топовой линейки Opus.
В утекших черновиках особо подчеркиваются опасения по поводу потенциальных последствий применения системы в сфере кибербезопасности.
— Хотя в настоящее время Mythos значительно опережает любую другую ИИ-модель в кибер-возможностях, она предвещает грядущую волну нейросетей, способных использовать уязвимости систем такими способами, которые далеко превзойдут возможности защитников, — говорится в документах компании. Из-за этих рисков Anthropic планирует выпускать модель предельно дозированно. Релиз начнется с ограниченного раннего доступа исключительно для организаций, занимающихся киберзащитой.
И хотя Anthropic быстро удалила пост из блога, новость об утечке молниеносно отразилась на финансовых рынках. Акции сразу нескольких крупных компаний в сфере кибербезопасности рухнули на фоне этих сообщений. По данным Yahoo Finance, на пятничных торгах ценные бумаги Palo Alto Networks (PANW) упали примерно на 7%, CrowdStrike (CRWD) — на 6,4%, Zscaler (ZS) снизились на 5,8%, а Fortinet (FTNT) просели на 4%.
Эта паническая распродажа акций перекликается с аналогичной реакцией рынка на презентацию другого продукта Anthropic. В феврале компания представила Claude Cowork — ИИ-систему для автоматизации сложных рабочих задач (включая проверку контрактов и комплаенс). Тогда этот анонс спровоцировал массовый сброс акций компаний, занимающихся разработкой софта и оказанием консалтинговых услуг.
Тот обвал уничтожил около 285 миллиардов долларов рыночной капитализации, поскольку инвесторы начали переоценивать долгосрочное влияние ИИ-агентов на корпоративный бизнес.
— Реакция рынка стала сигналом: дело не в том, что ИИ-агенты немедленно заменят эти бизнесы, а в том, что инвесторы наконец-то начали закладывать в цену структурный риск. Разработчики базовых ИИ-моделей теперь могут напрямую конкурировать с создателями корпоративного софта, — отмечал тогда основатель Nexatech Ventures Скотт Дилан. — Если говорить прямо: раз Anthropic способна самостоятельно создать инструмент для ведения юридического документооборота, то что мешает им сделать то же самое для финансов, закупок или HR?.
Примечания:
- Anthropic — американская ИИ-компания, основанная в 2021 году бывшими ключевыми сотрудниками OpenAI, включая Дарио и Даниэлу Амодеи. Компания позиционирует себя как разработчика «безопасного ИИ» и привлекла инвестиции от Amazon (до 4 млрд долларов), Google и других. Ирония ситуации — в том, что компания, строящая свой бренд на ответственном подходе к ИИ, допустила утечку информации о модели, которую сама же считает потенциально опасной.
- Иерархия моделей Claude. Для понимания значимости Mythos полезно знать линейку:
- Haiku — лёгкая, быстрая, дешёвая модель для простых задач.
- Sonnet — средний уровень, баланс скорости и качества.
- Opus — до сих пор самая мощная модель Anthropic, предназначенная для сложных рассуждений и анализа.
- Mythos — заявлена как новый уровень выше Opus, что представляет собой принципиальный скачок.
- Угроза кибербезопасности — двусторонняя. Когда Anthropic пишет, что модель «далеко опережает усилия защитников», это означает классическую проблему ИИ в сфере безопасности: одни и те же возможности могут использоваться как для обнаружения уязвимостей (защита), так и для их эксплуатации (атака). Исторически атакующая сторона получает преимущество первой, поскольку защитникам приходится закрывать все уязвимости, тогда как атакующему достаточно найти одну. ИИ-модель, радикально ускоряющая обнаружение уязвимостей, может критически нарушить этот баланс.
- Реакция фондового рынка заслуживает осмысления. Падение акций кибербезопасных компаний на 4–7% может показаться парадоксальным: казалось бы, рост киберугроз должен повышать спрос на их услуги. Однако логика инвесторов иная: если ИИ-модели нового поколения способны находить и эксплуатировать уязвимости быстрее, чем существующие инструменты защиты, это ставит под вопрос эффективность всей текущей архитектуры кибербезопасности — а значит, и стоимость компаний, которые её обеспечивают.
- Кодовое название «Capybara» для второй версии — продолжение традиции Anthropic давать моделям имена, навевающие определённые ассоциации. Капибара — крупнейший в мире грызун, известный своим миролюбивым нравом и способностью уживаться с самыми разными видами. Выбор этого имени может быть ироничным комментарием к модели, которую сама компания считает потенциально опасной.
- Сопоставление с утечкой OpenAI Sora. Интересно сравнить эту утечку с ситуацией вокруг Sora: в обоих случаях внутренняя информация о ключевых продуктах ведущих ИИ-компаний оказалась в открытом доступе. Однако если закрытие Sora было осознанным бизнес-решением, утечка Mythos — результат технической ошибки, что поднимает вопрос о том, насколько надёжно компании, разрабатывающие «самый мощный ИИ в истории», защищают собственную инфраструктуру.
- Claude Cowork и $285 млрд — упоминание февральской распродажи важно для понимания того, что ИИ-компании уже не просто конкурируют друг с другом: они начинают конкурировать со всей экосистемой корпоративного программного обеспечения — от Salesforce и ServiceNow до юридических и бухгалтерских фирм. Каждый новый анонс возможностей ИИ-моделей потенциально обесценивает целые отрасли.