Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах

Китайская лаборатория искусственного интеллекта (ИИ) DeepSeek представила открытую версию своей модели искусственного интеллекта R1 со способностью к рассуждению, которая, по заявлению разработчиков, превосходит ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах

Как сообщает издание TechCrunch, модель R1 превосходит OpenAI o1 в таких бенчмарках, как AIME, MATH-500 и SWE-bench Verified. Эти тесты охватывают различные области, включая математические задачи, программирование и общую производительность модели. AIME оценивает производительность моделей с помощью других ИИ-моделей, MATH-500 представляет собой набор задач по математике, а SWE-bench Verified ориентирован на программирование.

Особенностью R1 является её способность к самопроверке, что помогает исключить ошибки, характерные для других моделей. Однако этот подход требует больше времени для получения ответа — от нескольких секунд до нескольких минут. Тем не менее, такие модели считаются более надёжными в сложных областях, таких как математика, физика и различные науки.

В DeepSeek заявили, что R1 содержит 671 миллиард параметров, что делает её одной из крупнейших моделей в мире. Для удобства пользователей компания также выпустила упрощённые версии R1 с объёмом параметров от 1,5 до 70 миллиардов. При этом, самая компактная версия может работать даже на обычном ноутбуке, в то время как для полного варианта требуется более мощное оборудование. Тем не менее, R1 доступна через API компании по цене, которая, как утверждается, на 90–95% ниже, чем у OpenAI o1.

Читать также:
NASA обработало снимки Сатурна с телескопа «Джеймс Уэбб» — фотогеничность планеты зашкаливает

Отмечается, что у R1 есть и некоторые недостатки. Поскольку модель разработана в Китае, она подлежит обязательной проверке со стороны регуляторов на соответствие «основным социалистическим ценностям». Например, R1 отказывается отвечать на вопросы о событиях на площади Тяньаньмэнь или о независимости Тайваня, что характерно для многих китайских ИИ-моделей, которые избегают обсуждения острых для Поднебесной политических тем.

Стоит сказать, что DeepSeek стала первой китайской лабораторией, вступившей в реальную конкуренцию с OpenAI o1, представив предварительный вариант R1 ещё в ноябре. Однако за ней последовали и другие игроки, включая Alibaba и Kimi, принадлежащую компании Moonshot AI. По мнению исследователя искусственного интеллекта из Университета Джорджа Мейсона Дина Балла (Dean Ball), всё это свидетельствует о том, что китайские ИИ-компании продолжают оставаться «быстрыми последователями» в технологической гонке. «Успех упрощённых версий DeepSeek […] показывает, что мощные рассуждающие модели будут становиться всё более доступными и смогут работать даже на локальном оборудовании», — отметил Балл в своём посте на X.

НОВОЕ НА САЙТЕ

ISD назвал РИА Новости самым эффективным российским СМИ в ЕС

Дзен РИА Новости в мае, вопреки попыткам стран ЕС блокировать доступ к СМИ РФ, собрало наибольшее число уникальных пользователей в Евросоюзе и за его пределами среди подсанкционных российских медиа, выяснил британский аналитический центр Institute...

Спецоперация, 5 августа: потери ВСУ составили 1295 боевиков

Дзен Российские группировки войск, участвующие в спецоперации, нанесли поражение формированиям ВСУ, улучшили положение по переднему краю и тактическое положение, продолжили продвижение в глубину обороны противника, украинские войска при этом потеряли до 1295 военнослужащих, говорится...

Посольство России прокомментировало закупку Данией оружия для Украины

Дзен Решение датских властей участвовать в закупках американских вооружений для ВСУ подтверждает, что страна по-прежнему делает ставку на продолжение боевых действий, заявили РИА Новости в посольстве России в Копенгагене.Швеция, Норвегия и Дания объявили во...

Миронов назвал заявления МИД по РСМД сигналом США и Европе

Дзен Заявления МИД РФ о снятии моратория на размещение ракет средней и меньшей дальности - сигнал США и Европе о готовности России защищать свои национальные интересы, заявил РИА Новости лидер партии "Справедливая Россия -...

Премьер Франции оценил рост госдолга страны

Дзен Государственный долг Франции увеличивается каждую секунду на пять тысяч евро, заявил премьер-министр страны Франсуа Байру. "Когда сумма долга достигает 3 400 миллиардов евро, эту сумму невозможно себе представить. Однако есть цифра, которую можно...