Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Отдел разработки систем искусственного интеллекта Alibaba Qwen продуктивно провёл это лето, выпустив целый ряд моделей, которые не уступают, а то и превосходят аналоги ведущих американских лабораторий, в том числе Google, OpenAI и Anthropic. Крупнейшим проектом стала большая языковая модель Qwen3-Max-Preview (Instruct) с более чем 1 триллионом параметров.

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Обзор планшета HUAWEI MatePad 11,5» (2025): апгрейд без бликов

В чем уникальность зум-камеры HUAWEI Pura 80 Ultra?

Обзор ноутбука HONOR MagicBook Pro 16 HUNTER 2025. Для игр? Для работы? Для игр и работы!

Ноутбуки HONOR MagicBook: технологии, дизайн и производительность для любых задач

Обзор смартфона HUAWEI Pura 80 Pro: разумный флагман с мощнейшей камерой

Параметры — это внутренние настройки, которые управляют поведением большой языковой модели, и чем их больше, тем обычно мощнее модель. Есть версия, что примерно то же число параметров у OpenAI GPT-4o, но в последнее время многие ведущие лаборатории ИИ стали выпускать модели меньшего размера, так что решение авторов Qwen увеличить этот показатель примечательно. Опубликованные китайскими разработчиками результаты тестов Qwen-3-Max-Preview указывают, что она превосходит предыдущую флагманскую модель компании Qwen3-235B-A22B-2507 и выступает серьёзным конкурентом другим ведущим моделям во всей отрасли. В тестах SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2, and LiveBench (20241125) новая Qwen3-Max-Preview держится стабильно выше Claude Opus 4, Kimi K2 и Deepseek-V3.1.

Новая модель уже доступна на собственном сайте разработчика Qwen Chat, через API в Alibaba Cloud, на платформах OpenRouter и AnyCoder. В отличие от других систем Alibaba, новая Qwen3-Max-Preview пока не доступна по лицензии с открытым исходным кодом, и для её подключения к приложениям разработчикам пока придётся довольствоваться платным API самой компании или её партнёров. На практике модель реже даёт сбои в таких задачах с подвохом как, например, сравнение одинаковых чисел или подсчёт количества заданных букв в указанном слове — не все современные ИИ пока на это способны. На платформе Qwen Chat она также работает быстрее, чем ChatGPT.

Alibaba Qwen3-Max-Preview поддерживает контекстное окно длиной 262 144 токенов, максимальный объём запроса — 258 048 токенов, максимальная длина ответа — 32 768 токенов. Поддерживается кеширование контекста, что помогает оптимизировать производительность при длительных сессиях. Модель предназначается для сложных рассуждений (но режим «Мышление» в Qwen Chat пока недоступен), написания программного кода, обработки структурированных форматов данных, включая JSON, а также для задач творческого характера. Она одинаково эффективна в диалогах на разнообразные темы и в работе в качестве агента; ей могут пользоваться корпоративные клиенты и исследовательские лаборатории.

Читать также:
«Это такая внесезонная первоапрельская шутка?»: Bethesda раскрыла дату выхода мобильной игры The Elder Scrolls: Castles, и фанаты не рады

Стоимость работы с Alibaba Qwen3-Max-Preview через API в Alibaba Cloud зависит от количества токенов:

  • 0–32 тыс. токенов — $0,861 за 1 млн входящих и $3,441 за 1 млн исходящих токенов;
  • 32 тыс.–128 тыс. токенов — $1,434 за 1 млн входящих и $5,735 за 1 млн исходящих токенов;
  • 128 тыс.–252 тыс. токенов — $2,151 за 1 млн входящих и $8,602 за 1 млн исходящих токенов.

В соцсетях анонс Alibaba Qwen3-Max-Preview вызвал бурную реакцию. Авторы проекта отметили, что им удалось увеличить масштаб модели ИИ до 1 трлн параметров, и работа продолжается; более того, на предстоящей неделе они намереваются выпустить что-то ещё. Некоторые ограничения на длину контекста связаны с интерфейсом чата, а не особенностями самой модели, добавили они, и уже «в разработке» находится режим рассуждений для неё. Первые испытавшие модель пользователи выразили удовлетворение полученными в ходе начальных тестов результатами; некоторые заинтересовались, как она будет решать задачи, требующие сложных логических рассуждений.

По запросу руководителя направления развития машинного обучения Ахсена Калика (Ahsen Khaliq) модель Alibaba Qwen3-Max-Preview построила на платформе AnyCoder воксельное изображение — модель сада в стиле Minecraft. Она, обратили внимание другие экспериментаторы, справилась с предложенными с арифметическими задачами, решила математическую «головоломку 24» и даже некую задачу, перед которой спасовали такие тяжеловесы как рассуждающая OpenAI GPT-5 и Google Gemini 2.5 Pro. Получив сложный запрос, она, как показывают наблюдения, переходит в похожий на рассуждения режим, в котором строит структурированные пошаговые ответы.

Для корпоративных клиентов ценность Qwen3-Max-Preview будет определяться не бенчмарками, а тем, как она на практике справляется с конкретными задачами. Располагая триллионом параметров, она меньше нуждается в постоянной тонкой настройке при развёртывании в приложениях, но сдерживающим фактором для бизнес-клиентов может стать многоуровневая система ценообразования. Сильными её сторонами является схожесть API с интерфейсом OpenAI и поддержка кеширования. Следует учитывать, что Qwen3-Max-Preview, как видно из названия, пока является предварительной версией модели, и поспешное её развёртывание может быть сопряжено с рисками.

Разработчики из лаборатории Alibaba Qwen также подчеркнули, что это ещё не финальная версия модели — её общедоступный вариант, вероятно, сможет похвастаться ещё более внушительными показателями. Это укрепит позиции Qwen в среде сверхбольших языковых моделей.

НОВОЕ НА САЙТЕ

Инспекторов МАГАТЭ проинформируют об ударах дронов ВСУ по ЗАЭС

Дзен Инспекторов Международного агентства по атомной энергии (МАГАТЭ) проинформируют об атаке дронов ВСУ по учебно-тренировочному центру Запорожской АЭС, сообщила РИА Новости директор по коммуникациям ЗАЭС Евгения Яшина. Ранее пресс-служба станции сообщала, что дроны ВСУ...

Атаки ВСУ создают прямую угрозу инфраструктуре ЗАЭС, заявила Яшина

Дзен Атаки ВСУ создают прямую угрозу инфраструктуре Запорожской АЭС, сообщила РИА Новости директор по коммуникациям ЗАЭС Евгения Яшина. Ранее в субботу сообщалось, что дроны ВСУ атаковали учебно-тренировочный центр Запорожской АЭС, удар пришелся по крыше,...

Пушков заявил о росте популярности правых партий в Европе

Дзен Правоориентированные партии, декларирующие защиту национальных интересов, набирают все большую популярность в Европе, считает сенатор Алексей Пушков. Правая партия "Альтернатива для Германии" (АдГ) стала самой популярной партией в немецкой земле Саксония-Анхальт, оставив далеко позади...

Microsoft сообщила о повреждении кабелей в Красном море

Дзен Американская компания Microsoft сообщила, что несколько ее подводных кабелей оборваны в Красном море, это может повлиять на работу сервиса Microsoft Azure. В заявлении на сайте компании в разделе про сервис Azure указывается, что...

Лето 2025 года стало рекордно жарким в Китае, сообщил Вильфанд

Дзен Лето 2025 года стало рекордно жарким в Китае, третьим самым теплым в Европе и, предварительно, во всем Северном полушарии, сообщил РИА Новости научный руководитель Гидрометцентра России Роман Вильфанд. "По предварительным расчетам, по Северному...