Станет ли GPT-5 неожиданным хитом лета? Вот чего стоит ожидать

04.07.2025, 5:53, Технологии
Теги: Бизнес, Кино, Образование, Промышленность, Технологии

Ожидается, что GPT-5 от OpenAI выйдет этим летом. Будет ли это блокбастер с искусственным интеллектом?

Сэм Альтман подтвердил этот план в июне во время первого эпизода подкаста компании, вскользь упомянув, что модель, которая, по его словам, объединит возможности предыдущих моделей, появится «вероятно, этим летом».

Некоторые наблюдатели за OpenAI прогнозируют, что он появится в течение следующих нескольких недель. Анализ истории выпуска моделей OpenAI показал, что GPT-4 был выпущен в марте 2023 года, а GPT-4-Turbo (на котором работает ChatGPT) — позже, в ноябре 2023 года. GPT-4o, более быстрая мультимодальная модель, была запущена в мае 2024 года. Это означает, что OpenAI быстрее совершенствует и итергрирует модели.

Но недостаточно быстро для стремительно развивающегося и конкурентного рынка искусственного интеллекта. В феврале, отвечая на вопрос на X, когда будет выпущена GPT-5, Альтман ответил: «недели/месяцы». Недели действительно превратились в месяцы, а тем временем конкуренты быстро сокращают разрыв, а Meta потратила миллиарды долларов за последние 10 дней, чтобы переманить некоторых из ведущих ученых OpenAI.

По данным Menlo Ventures, доля OpenAI на корпоративном рынке упала с 50% до 34%, а Anthropic удвоилась с 12% до 24%. Gemini 2.5 Pro от Google полностью уничтожил конкурентов в математическом мышлении, а DeepSeek R-1 стал синонимом «революционного», обойдя альтернативы с закрытым исходным кодом, и даже Grok от xAI (ранее известный просто своей конфигурацией «веселого режима») начал восприниматься всерьез среди программистов.

Предстоящая модель GPT, по словам Альтмана, фактически будет одной моделью, которая будет управлять ими всеми.

Ожидается, что GPT-5 объединит различные модели и инструменты OpenAI в единую систему, устранив необходимость в «выборе моделей». Пользователям больше не придется выбирать между различными специализированными моделями — одна система будет обрабатывать текст, изображения, аудио и, возможно, видео.

До сих пор эти задачи распределялись между GPT-4.1, Dall-E, GPT-4o, o3, Advanced Voice, Vision и SORA. Сконцентрировать все в единой, по-настоящему мультимодальной модели – это довольно большое достижение.

GPT 5 = уровень 4 по шкале AGI. Теперь вычисления — это все, что нужно, чтобы умножить агентов в 1000 раз, и они могут автономно работать на Organisatzions.

Технические характеристики также выглядят амбициозными. По прогнозам, модель будет иметь значительно расширенное контекстное окно, потенциально превышающее 1 миллион токенов, а некоторые отчеты предполагают, что оно даже достигнет 2 миллионов токенов. Для сравнения, GPT-4o имеет максимум 128 000 токенов. В этом разница между обработкой главы и перевариванием всей книги.

В 2024 году OpenAI начала внедрять экспериментальные функции памяти в GPT-4-Turbo, что позволяет помощнику запоминать такие детали, как имя пользователя, предпочтения в тоне и текущие проекты. Пользователи могут просматривать, обновлять или удалять эти воспоминания, которые создаются постепенно с течением времени, а не на основе отдельных взаимодействий.

Ожидается, что в GPT-5 память станет более глубоко интегрированной и бесшовной — в конце концов, модель сможет обрабатывать почти в 100 раз больше информации о вас, потенциально имея 2 миллиона токенов вместо 80 000. Это позволило бы модели вспоминать разговоры через несколько недель, накапливать контекстуальные знания с течением времени и обеспечивать непрерывность, более похожую на персонализированного цифрового помощника.

Улучшения в рассуждении звучат столь же амбициозно. Ожидается, что этот прогресс проявится в переходе к «структурированной цепочке мыслей», что позволит модели анализировать сложные проблемы на логические, многоступенчатые последовательности, отражая человеческие процессы совещательного мышления.

Что касается параметров, то консенсусные слухи колеблются от 10 до 50 триллионов, вплоть до одного квадриллиона. Однако, как сказал сам Альтман, «эра масштабирования параметров уже закончилась», поскольку методы обучения ИИ смещают акцент с количества на качество, а лучшие подходы к обучению делают меньшие модели чрезвычайно мощными.

И это еще одна фундаментальная проблема для OpenAI: у него заканчиваются интернет-данные для обучения. Решение? Если ИИ генерирует собственные обучающие данные, это может ознаменовать новую эру в обучении ИИ.

— Следующим скачком станет генерация синтетических данных в проверяемых доменах, — сказал Decrypt Эндрю Хилл, генеральный директор AI-агентов на арене Recall. — Мы упираемся в стены данных в масштабе Интернета, но прорывы в области рассуждений показывают, что модели могут генерировать высококачественные обучающие данные, когда у вас есть механизмы верификации. Простейшими примерами являются математические задачи, где вы можете проверить, верен ли ответ, и код, где вы можете выполнять модульные тесты.

Хилл видит в этом преобразующий фактор:

— Скачок заключается в создании новых данных, которые на самом деле лучше, чем данные, созданные человеком, потому что они итеративно уточняются с помощью циклов верификации и создаются гораздо быстрее.

Эксперт по искусственному интеллекту и преподаватель Дэвид Шапиро ожидает, что модель достигнет 95% на MMLU и вырастет с 32% до 82% на SWEBench — по сути, это модель искусственного интеллекта уровня бога. Если хотя бы половина этого верна, GPT-5 попадет в заголовки газет. И внутри компании есть реальная уверенность, и даже некоторые исследователи OpenAI раскручивают модель перед выпуском.

Эксперты, опрошенные Decrypt, предупредили, что любой, кто ожидает, что GPT-5 достигнет уровня способностей AGI, должен сдержать свой энтузиазм. Хилл сказал, что ожидает «постепенного шага, маскирующегося под революцию».

Уайатт Мэйхэм, генеральный директор Northwest AI Consulting, пошел немного дальше, предсказав, что GPT-5, скорее всего, будет «значимым скачком, а не инкрементальным», добавив:

— Я ожидаю более длинных контекстных окон, более нативной мультимодальности и сдвигов в том, как агенты могут действовать и рассуждать. Я ни в коем случае не ставлю на серебряную пулю, но я думаю, что GPT-5 должен расширить тип инструментов, которые мы можем с уверенностью поставлять пользователям.

Кроме того, было подтверждено, что GPT-5 является основной омнимодальной моделью рассуждений, способной как к быстрым ответам, так и к длительным рассуждениям.

С каждыми двумя шагами вперед приходит отступление, говорит Мэйхэм: «Каждый крупный релиз устраняет наиболее очевидные ограничения предыдущего поколения, вводя новые».

GPT-4 исправил пробелы в рассуждениях GPT-3, но уперся в стены данных. Модели рассуждений (о3) фиксируют логическое мышление, но являются дорогостоящими и медленными.

Тони Тонг, технический директор Intellectia AI — платформы, предоставляющей инвесторам информацию об искусственном интеллекте, — также осторожен, ожидая лучшей модели, но не чего-то, что изменит мир, как это делают многие гипертехнологии искусственного интеллекта. «Я ставлю на то, что GPT-5 будет сочетать в себе более глубокие мультимодальные рассуждения, лучшую основу в инструментах или памяти, а также значительные шаги вперед в выравнивании и контроле поведения агентов. — сказал Тонг Decrypt. Подумайте: более управляемый, более надежный и более адаптивный».

А Патрис Уильямс-Линдо, генеральный директор Career Nomad, предсказал, что GPT-5 будет не более чем «инкрементальной революцией». Однако она подозревает, что это может быть особенно хорошо для повседневных пользователей ИИ, а не для корпоративных приложений.

— Совокупные эффекты надежности, контекстуальной памяти, мультимодальности и более низкого уровня ошибок могут изменить то, как люди на самом деле доверяют этим системам и используют их ежедневно. Это само по себе может быть огромной победой, — сказал Уильямс-Линдо.

Некоторые эксперты просто скептически относятся к тому, что GPT-5 — или любая другая LLM — вообще запомнят чем-то особенным.

Исследователь искусственного интеллекта Гэри Маркус, который критически относится к чистым подходам к масштабированию (для лучших моделей требуется больше параметров), написал в своих обычных прогнозах на год:

— В течение 2025 года не может быть модели «уровня GPT-5» (что означает огромный, повсеместный квантовый скачок вперед, если судить по консенсусу сообщества).

Маркус делает ставку на анонсы обновлений, а не на совершенно новые базовые модели. Тем не менее, это одна из его недостоверных догадок.

— Это определенно замедляет их усилия, — сказал Decrypt Дэвид А. Джонстон, ведущий разработчик кода в децентрализованной сети искусственного интеллекта Morpheus. Джонстон считает, что помимо денег, лучшие таланты морально мотивированы работать над инициативами с открытым исходным кодом, такими как Llama, а не над альтернативами с закрытым исходным кодом, такими как ChatGPT или Claude.

Тем не менее, некоторые эксперты считают, что проект уже настолько развит, что утечка талантов на него не повлияет.

Мэйхэм считает, что «релиз в июле 2025 года выглядит реалистичным. Даже с учетом того, что некоторые ключевые таланты перешли в Meta, я думаю, что OpenAI все еще находится на правильном пути. Они сохранили основное лидерство и скорректировали состав, так что, похоже, они немного ослабевают».

Уильямс-Линдо добавил:

— Импульс и капиталовложения OpenAI сильны. Что более важно, так это не то, кто ушел, а то, как те, кто остался, пересматривают приоритеты, особенно если они удваивают усилия по производству продукции или делают паузу, чтобы решить проблемы безопасности или юридические проблемы.

Если история чему-то учит, мир скоро получит свой GPT-5, а также шквал заголовков, горячих моментов и моментов «Это все?». И тогда вся отрасль начнет задавать следующий большой вопрос, который имеет значение: когда GPT-6?

Смотреть комментарии → Комментариев нет

Добавить комментарий


Имя обязательно	E-mail обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam