Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле

Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие.

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле

DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta✴ Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов.

Модель была обучена на наборе данных в 14,8 трлн проектов; будучи развёрнутой на платформе Hugging Face, DeepSeek V3 показала размер в 685 млрд параметров — примерно в 1,6 раза больше, чем Llama 3.1 405B, у которой, как можно догадаться, 405 млрд параметров. Как правило, число параметров, то есть внутренних переменных, которые используются моделями для прогнозирования ответов и принятия решений, коррелирует с навыками моделей: чем больше параметров, тем она способнее. Но для запуска таких систем ИИ требуется больше вычислительных ресурсов.

Читать также:
Энтузиаст собрал царь-ноутбук на Ryzen 9 7950X3D и десктопной RTX 4090, и он даже влезает в рюкзак

DeepSeek V3 была обучена за два месяца в центре обработки данных на ускорителях Nvidia H800 — сейчас их поставки в Китай запрещены американскими санкциями. Стоимость обучения модели, утверждает разработчик, составила $5,5 млн, что значительно ниже расходов OpenAI на те же цели. При этом DeepSeek V3 политически выверена — она отказывается отвечать на вопросы, которые официальный Пекин считает щекотливыми.

В ноябре тот же разработчик представил модель DeepSeek-R1 — аналог «рассуждающей» OpenAI o1. Одним из инвесторов DeepSeek является китайский хедж-фонд High-Flyer Capital Management, который принимает решения с использованием ИИ. В его распоряжении есть несколько собственных кластеров для обучения моделей. Один из последних, по некоторым сведениям, содержит 10 000 ускорителей Nvidia A100, а его стоимость составила 1 млрд юаней ($138 млн). High-Flyer стремится помочь DeepSeek в разработке «сверхразумного» ИИ, который превзойдёт человека.

НОВОЕ НА САЙТЕ

Учёные ускорили транзисторы, обойдя законы физики — отрицательная ёмкость пробила предел Шоттки

Учёные из США смогли поставить на службу микроэлектронике парадоксальное физическое явление, названное отрицательной ёмкостью. Команда более 20 лет исследовала это явление, всё это время подвергаясь привычной критике. Однако целый ряд публикаций в научных журналах...

Продажи умных очков Ray-Ban Meta✴ выросли втрое в первом полугодии 2025 года

Крупнейший в мире производитель очков, франко-итальянская компания EssilorLuxottica, владеющая брендами Ray-Ban и Oakley, опубликовала результаты работы за второй квартал 2025 года. Выручка компании выросла на 7,3 % в годовом выражении и достигла €7,18 млрд...

Китайцы представили компьютерный корпус с дизайном в стиле GeForce RTX 5000 Founders Edition

Китайский производитель Golden Field представил новую серию компьютерных корпусов Nano, главной особенностью которых стал необычный дизайн фронтальной панели. Очевидно, что при его разработке дизайнеры вдохновлялись внешним видом эталонных версий видеокарт Nvidia GeForce RTX 40-й...

Windows 10 сегодня исполнилось 10 лет — вспоминаем 10 спорных и определяющих моментов в истории ОС

Первая стабильная версия Windows 10 увидела свет 29 июля 2015 года. Тогда Microsoft сделала шаг в правильном направлении, особенно если учесть катастрофу, которая постигла Windows 8. В честь этого юбилея мы вспоминаем 10 важных...

«Благослови богов PlayStation»: Sony обрадовала фанатов анонсом линейки игр PS Plus на август

Хотя на дворе лишь последний вторник июля, японское издательство Sony Interactive Entertainment уже представило подборку игр на август для подписчиков базового тарифа сервиса PlayStation Plus. ...