Nous Research бросил вызов OpenAI — открытая модель Hermes 4 работает быстрее всех и без цензуры

Стартап в области искусственного интеллекта Nous Research без громких анонсов представил семейство больших языковых моделей искусственного интеллекта Hermes 4, способных, по словам разработчика, сравниться с ведущими закрытыми аналогами. Пользователю предлагается всесторонний контроль над ИИ, который в исходном виде почти лишён цензурных ограничений.

Nous Research бросил вызов OpenAI — открытая модель Hermes 4 работает быстрее всех и без цензуры

Обзор рейтингового режима Warface: просто освоиться, сложно оторваться

Пять причин полюбить HONOR 400

Обзор ноутбука Acer Swift Go 14 (SFG14-63-R7T4) с процессором Ryzen 9 8945HS и OLED-экраном

Обзор смартфона HUAWEI Pura 80 Ultra: зум, которому нет равных

HUAWEI Pura 80 Ultra глазами фотографа

Обзор смартфона HONOR 400: реаниматор

В отличие от аналогов в исполнении OpenAI, Google или Anthropic, модель Hermes 4 разрабатывалась для работы с практически любыми запросами без введённых в целях безопасности ограничений, ставших стандартными для коммерческих систем. Hermes 4 работает с использованием механизма гибридных рассуждений, позволяющего пользователю переключаться между быстрыми ответами и глубокими, пошаговыми мыслительными процессами ИИ. При работе ход рассуждений заключается в теги <think> — схожим образом работает OpenAI o1, но в случае моделей от Nous Research обеспечивается полная прозрачность «мыслительного» процесса.

В тесте MATH-500 с активным режимом рассуждений крупнейшая в семействе модель Hermes 4 с 405 млрд параметров набрала 96,3 % и 81,9 % в математическом бенчмарке AIME’24 — не хуже, а то и лучше многих закрытых систем, разработка которых обошлась в миллионы долларов. Она также показала результат 57,1 % в новом тесте RefusalBench, который Nous Research разработала самостоятельно для измерения частоты отказа систем ИИ отвечать на вопросы; GPT-4o показала в нём 17,67 %, Claude Sonnet 4 — 17 %.

Важным нововведением стало применение двух новых обучающих систем: DataForge — генератора синтетических данных на основе графов; и Atropos — фреймворка обучения с подкреплением. В DataForge производятся «случайные блуждания» по ориентированным графам и осуществляются преобразования простых исходных данных в сложные ответы на основе инструкций. Так, система может взять статью из «Википедии» и превратить её в рэп-стихи, а затем сгенерировать вопросы и ответы на основе этого преобразования. Atropos работает как несколько сотен обучающих сред, в которых ИИ отрабатывает определённые навыки — математику, программирование, работу с инструментами и творческие задания; обратная связь поступает только в случае принятия правильных решений. В обучающие данные попадают только проверенные и высококачественные ответы.

Читать также:
Первый в Великобритании поезд на аккумуляторах проехал 70 км на скорости 120 км/ч и превзошёл по эффективности дизельный

При обучении использовались 3,5 млн примеров, требующих рассуждений, и 1,6 млн примеров без рассуждений. Потребовались 192 ИИ-ускорителя Nvidia B200 и 71 616 GPU-часов, то есть при полной загрузке потребовались около 15,5 дня. Nous Research намеренно не стала включать средства цензуры в свои модели, исходя из того, что пользователь должен решать данный вопрос самостоятельно, и это важнее корпоративных политик в отношении контента.

Важным техническим достижением стало решение проблемы со слишком большим объёмом рассуждений. Авторы Hermes 4 обнаружили, что младшая модель с 14 млрд параметров в 60 % случаев рассуждений достигала максимальной длины контекста, попадая, таким образом, в бесконечный цикл. Поэтому на втором этапе обучения модель получила навык останавливать процесс рассуждения на позиции 30 000 токенов. Это помогло сократить число таких инцидентов на значение 65–79 % — при этом качество ответов удалось преимущественно сохранить.

Но некоторые ограничения, характерные для открытых моделей, Nous Research преодолеть не смогла. Несмотря на достойные результаты тестов, модели Hermes 4 требуют значительных вычислительных ресурсов, а пользоваться ими сложнее, чем коммерческими системами. Веса моделей можно бесплатно загрузить с платформы Hugging Face; есть доступ к API через обновлённый интерфейс чата; разработчик также заручился поддержкой Chutes, Nebius и Luminal — компаний, которые специализируются на выводе ИИ.

Hermes 4 — новый кандидат на звание взявшегося ниоткуда перспективного игрока, представляющего альтернативу крупным компаниям. Особый интерес представляет отсутствие ограничений по контенту — Nous Research настаивает, что прозрачность и свобода для пользователя важнее корпоративных ценностей.

НОВОЕ НА САЙТЕ

Европа поощряет Украину на несговорчивость, заявил Песков

Дзен Европейцы поощряют киевский режим на абсурдное продолжение линии на несговорчивость, заявил пресс-секретарь президента России Дмитрий Песков."Европейцы всячески потворствуют и, наверное, поощряют киевский режим на совершенно абсурдное продолжение линии на несговорчивость", - сказал Песков...

Песков сравнил действия европейских политиков с подходом Путина и Трампа

Дзен Действия европейских политиков ярко контрастируют с подходом президента РФ Владимира Путина и президента США Дональда Трампа, сообщил пресс-секретарь президента РФ Дмитрий Песков.Песков, комментируя резкие заявления западноевропейских лидеров, сообщил, что европейская партия войны "сохраняет...

В Болгарии проходит протест на фоне визита главы Еврокомиссии

Дзен Протест сторонников болгарской партии "Возрождение" проходит в городе Сопот на фоне визита в Болгарию главы Европейской комиссии Урсулы фон дер Ляйен, передает агентство БТА. Ранее в воскресенье лидер партии "Величие" Ивелин Михайлов заявлял,...

«Иная картина». НАТО напугала ЕС, раскрыв новые данные о военных расходах

ДзенШтаб-квартира НАТО в Брюсселе раскрыла актуальные данные о расходах государств-членов на вооружение, сообщается в публикации Junge Welt.В статье отмечается, что многие западные СМИ в последнее время начали сообщать, что страны НАТО снижают темпы роста...

Мерц рассказал, сколько может продлиться конфликт на Украине

Дзен Канцлер Германии Фридрих Мерц считает, что конфликт на Украине может продлиться еще долго. "Если посмотреть в истории, как заканчиваются войны, по сути, есть две возможности. Или путем военного поражения... Такого я сейчас не...