Новая модель ИИ Qwen от Alibaba устанавливает рекорды

25.07.2025, 20:42, Технологии
Теги: Бизнес, Технологии

Команда Qwen из Alibaba только что выпустила новую версию своей модели разумного искусственного интеллекта с открытым исходным кодом и некоторыми впечатляющими тестами.

Познакомьтесь с Qwen3-235B-A22B-Thinking-2507. В течение последних трех месяцев команда Qwen усердно работала над расширением того, что они называют «мыслительной способностью» своего ИИ, стремясь улучшить как качество, так и глубину его рассуждений.

Результатом их усилий стала модель, которая превосходна в действительно сложных вещах: логическое мышление, сложная математика, научные задачи и продвинутое кодирование. В тех областях, которые обычно требуют участия человека-эксперта, эта новая модель Qwen теперь устанавливает стандарт для моделей с открытым исходным кодом.

Что касается тестовых показателей, то последняя модель искусственного интеллекта Qwen с открытым исходным кодом достигает 92,3 на AIME25 и 74,1 на LiveCodeBench v6 для кодирования. Он также занимает достойное место в более общих тестах возможностей, набрав 79,7 балла на Arena-Hard v2, который измеряет, насколько хорошо он соответствует предпочтениям человека.

По своей сути это массивная модель разумного ИИ от команды Qwen с 235 миллиардами параметров. Тем не менее, он использует Mix-of-Experts (MoE), что означает, что он активирует только часть этих параметров — около 22 миллиардов — в любой момент времени. Представьте себе, что у вас есть огромная команда из 128 специалистов по вызову, но только восемь наиболее подходящих для конкретной задачи привлекаются для работы над ней.

Возможно, одной из его самых впечатляющих особенностей является огромная память. Модель ИИ Qwen с открытым исходным кодом имеет собственную длину контекста 262 144 токена; Огромное преимущество для задач, требующих понимания огромных объемов информации.

Для разработчиков и мастеров команда Qwen упростила начало работы. Модель доступна на сайте Hugging Face. Вы можете развернуть его с помощью таких инструментов, как sglang или vllm, чтобы создать собственную конечную точку API. Команда также указывает на свою инфраструктуру Qwen-Agent как на лучший способ использовать навыки вызова инструментов модели.

Чтобы получить максимальную производительность от своей модели рассуждений на основе искусственного интеллекта с открытым исходным кодом, команда Qwen поделилась несколькими советами. Они предполагают длину вывода около 32 768 токенов для большинства задач, но для действительно сложных задач вы должны увеличить ее до 81 920 токенов, чтобы дать ИИ достаточно пространства для «размышлений». Они также рекомендуют дать модели конкретные инструкции в подсказке, например, попросить ее «аргументировать шаг за шагом» для математических задач, чтобы получить наиболее точные и хорошо структурированные ответы.

Выпуск этой новой модели Qwen предоставляет мощный, но открытый интеллектуальный интеллект, который может соперничать с некоторыми из лучших проприетарных моделей, особенно когда речь идет о сложных, умственных задачах. Будет интересно посмотреть, что разработчики в конечном итоге создадут с его помощью.

Смотреть комментарии → Комментариев нет

Добавить комментарий


Имя обязательно	E-mail обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam