DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Китайский стартап DeepSeek прославился в начале года, выпустив рассуждающую модель R1, которая смогла конкурировать с ИИ-моделями американских технологических гигантов, несмотря на скромный бюджет. Теперь DeepSeek опубликовал в сотрудничестве с исследователями университета Цинхуа статью с подробным описанием нового подхода к обучению моделей с подкреплением, позволяющего значительно повысить их эффективность. Об этом сообщил ресурс SCMP.

DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Согласно публикации, новый метод направлен на то, чтобы помочь ИИ-моделям лучше соответствовать человеческим предпочтениям, используя механизм вознаграждений за более точные и понятные ответы. Обучение с подкреплением доказало свою эффективность в ускорении решения задач ИИ в ограниченных сферах и приложениях. Однако его использование для более общих задач оказалось не столь эффективным. Команда DeepSeek пытается решить этот вопрос, объединив генеративное моделирование вознаграждения (GRM) и так называемую настройку самокритики на основе принципов. Как утверждается в статье, новый подход с целью улучшения возможностей рассуждений больших языковых моделей (LLM) превзошёл существующие методы, что подтверждено проверкой моделей в различных тестах, и позволил получить самую высокую производительность для общих запросов при использовании меньших вычислительных ресурсов.

Читать также:
Разработчики Titan Quest 2 анонсировали эксклюзивное тестирование — допустят только избранных

Новые модели получили название DeepSeek-GRM — сокращение от термина Generalist Reward Modeling (универсальное моделирование вознаграждения). Компания сообщила, что новые модели будут с открытым исходным кодом, однако сроки их выхода пока не объявлены. В прошлом месяце агентство Reuters сообщило со ссылкой на информированные источники, что в апреле компания также выпустит DeepSeek-R2, преемника рассуждающей модели R1.

Другие ведущие разработчики в сфере ИИ, включая китайскую Alibaba Group Holding и OpenAI из Сан-Франциско (США), также работают над улучшением возможностей рассуждения и самосовершенствования ИИ-моделей, отметил Bloomberg.

НОВОЕ НА САЙТЕ

Nvidia до последнего скрывала от китайских клиентов, что ИИ-чипы H20 они больше не получат

Американские власти уведомили Nvidia о необходимости отныне обзавестись экспортной лицензией на поставку в Китай ускорителей вычислений H20 ещё 9 апреля, но некоторым своим китайским клиентам она передала эту информацию в самый последний момент. По...

Наша Вселенная вращается, показало моделирование, и это объясняет многое

Легендарную фразу Галилео Галилея «И всё-таки она вертится!», якобы сказанную после суда инквизиции над ним за опровержение геоцентрической модели Солнечной системы, возможно, вскоре можно будет применить ко всей Вселенной. Признаки её вращения уже выявлялись...

Nvidia выпустила драйвер, в котором исправила 40 проблем и добавила поддержку GeForce RTX 5060 Ti

Компания Nvidia выпустила графический драйвер GeForce Game Ready 576.02 WHQL. Он добавляет поддержку видеокарт GeForce RTX 5060 Ti с 16 и 8 Гбайт памяти. Свежая версия программного обеспечения также содержит один из самых больших...

Вышли обзоры GeForce RTX 5060 Ti 16GB — фантастическая видеокарта для 1080p, если цена не подведёт

Сегодня начинаются продажи видеокарт GeForce RTX 5060 Ti с 16 и 8 Гбайт памяти. Обе новинки построены на базе одного и того же графического процессора GB206-300 с 4608 ядрами CUDA, 144 текстурными блоками, 48...

GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей

Сегодня в 16:00 по московскому времени начались продажи потенциального бестселлера 50-й серии видеокарт Nvidia — GeForce RTX 5060 Ti. В отечественных магазинах карты тоже появились, правда, далеко не во всех и в весьма скромном...