Tencent выпускает универсальные модели искусственного интеллекта Hunyuan с открытым исходным кодом - Такое кино
 

Tencent выпускает универсальные модели искусственного интеллекта Hunyuan с открытым исходным кодом

05.08.2025, 2:06, Технологии
Теги: ,

Компания Tencent расширила свое семейство моделей искусственного интеллекта Hunyuan с открытым исходным кодом, которые достаточно универсальны для широкого использования.

Это новое семейство моделей разработано для обеспечения высокой производительности в вычислительных средах, от небольших периферийных устройств до требовательных производственных систем с высоким уровнем параллелизма.

Релиз включает в себя полный набор предварительно обученных и настроенных моделей, доступных на платформе разработчика Hugging Face. Модели выпускаются в нескольких размерах, в частности, со шкалами параметров 0,5B, 1,8B, 4B и 7B, что обеспечивает значительную гибкость для разработчиков и бизнеса.

Tencent указала, что эти модели были разработаны с использованием стратегий обучения, аналогичных более мощной модели Hunyuan-A13B, что позволяет им унаследовать ее эксплуатационные характеристики. Такой подход позволяет пользователям выбирать оптимальную модель для своих потребностей, будь то меньший вариант для периферийных вычислений с ограниченными ресурсами или более крупная модель для производственных рабочих нагрузок с высокой пропускной способностью, обеспечивая при этом широкие возможности.

Одной из наиболее примечательных особенностей серии Hunyuan является встроенная поддержка сверхдлинного контекстного окна 256K. Это позволяет моделям обрабатывать и поддерживать стабильную производительность при выполнении задач с длинными текстами, что является жизненно важной возможностью для анализа сложных документов, расширенных разговоров и создания углубленного контента. Модели поддерживают то, что Tencent называет «гибридным мышлением», которое позволяет использовать как быстрые, так и медленные режимы мышления, которые пользователи могут выбирать в зависимости от своих конкретных требований.

Компания также уделяет большое внимание агентным возможностям. Модели были оптимизированы для задач, основанных на агентах, и продемонстрировали лучшие результаты в установленных бенчмарках, таких как BFCL-v3, τ-Bench и C3-Bench, что свидетельствует о высокой степени мастерства в решении сложных многоступенчатых задач. Например, на C3-Bench модель Hunyuan-7B-Instruct набирает 68,5 балла, в то время как модель Hunyuan-4B-Instruct набирает 64,3 балла.

Производительность сериала сосредоточена на эффективном выводе. В моделях Hunyuan от Tencent используется Group Query Attention (GQA) — метод, известный как повышение скорости обработки и снижение вычислительных затрат. Эта эффективность дополнительно повышается за счет расширенной поддержки квантования, ключевого элемента архитектуры Hunyuan, разработанной для снижения барьеров развертывания.

Компания Tencent разработала собственный набор инструментов для сжатия, AngleSlim, чтобы создать более удобное и эффективное решение для сжатия моделей. Используя этот инструмент, компания предлагает два основных типа квантования для серии Hunyuan.

Первый — это статическое квантование FP8, в котором используется 8-битный формат с плавающей запятой. Этот метод использует небольшое количество калибровочных данных для предварительного определения шкалы квантования без необходимости полного повторного обучения, преобразуя веса модели и значения активации в формат FP8 для повышения эффективности вывода.

Второй метод — квантование INT4, при котором достигается квантование W4A16 с помощью алгоритмов GPTQ и AWQ:

Подход GPTQ обрабатывает веса модели слой за слоем, используя данные калибровки для минимизации ошибок в квантованных весах. Этот процесс позволяет избежать необходимости повторного обучения модели и повышает скорость вывода.
Алгоритм AWQ работает путем статистического анализа амплитуды значений активации на основе небольшого набора калибровочных данных. Затем он вычисляет коэффициент масштабирования для каждого весового канала, который расширяет числовой диапазон важных весов, чтобы сохранить больше информации в процессе сжатия.
Разработчики могут либо использовать инструмент AngleSlim самостоятельно, либо загрузить предварительно квантованные модели напрямую.

Тесты производительности подтверждают сильные возможности моделей Tencent Hunyuan для решения целого ряда задач. Например, предварительно обученная модель Hunyuan-7B набирает 79,82 балла в бенчмарке MMLU, 88,25 в GSM8K и 74,85 в бенчмарке MATH, демонстрируя солидные рассуждения и математические способности.

Варианты, адаптированные к инструкции, показывают впечатляющие результаты в специализированных областях. По математике модель Hunyuan-7B-Instruct набирает 81,1 балла в бенчмарке AIME 2024, а версия 4B — 78,3. В естественных науках модель 7B достигает 76,5 баллов на OlympiadBench, а в программировании — 42 балла на Livecodebench.

— Мы расширяем экосистему LLM с открытым исходным кодом от Tencent Hunyuan четырьмя компактными моделями (0,5 млрд байт, 1,8 млрд байт, 4 млрд и 7 млрд байтов)! Эти модели, разработанные для сценариев с низким энергопотреблением, таких как графические процессоры потребительского класса, умные транспортные средства, устройства умного дома, мобильные телефоны и ПК, поддерживают экономичную тонкую настройку…
— Хуньюань (@TencentHunyuan) 4 августа, 2025

Тесты квантования показывают минимальное снижение производительности. В бенчмарке DROP модель Hunyuan-7B-Instructions набирает 85,9 балла в базовом формате B16, 86,0 балла в FP8 и 85,7 балла в Int4 GPTQ, что указывает на то, что повышение эффективности не происходит за счет точности.

Для развертывания Tencent рекомендует использовать устоявшиеся фреймворки, такие как TensorRT-LLM, vLLM или SGLang, для обслуживания моделей Hunyuan и создания конечных точек API, совместимых с OpenAI, обеспечивая их плавную интеграцию в существующие рабочие процессы разработки. Такое сочетание производительности, эффективности и гибкости развертывания делает серию Hunyuan непреходящим мощным конкурентом в области искусственного интеллекта с открытым исходным кодом.


Смотреть комментарии → Комментариев нет


Добавить комментарий

Имя обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam

Политика конфиденциальности - GDPR

Карта сайта →

По вопросам информационного сотрудничества, размещения рекламы и публикации объявлений пишите на адрес: [email protected]

Поддержать проект:

PayPal - [email protected]; Payeer: P1124519143; WebMoney – Z399334682366, E296477880853, X100503068090

18+ © 2025 Такое кино: Самое интересное про кино, телевидение, культуру и технологии