DeepSeek упёрся в санкции: разработка модели R2 забуксовала из-за нехватки чипов Nvidia

В начале этого года китайская компания DeepSeek удивила всех выпуском своей языковой модели R1, которая достигала сопоставимых с лучшими западными образцами результатов в сфере ИИ, но требовала от разработчиков предположительно меньших затрат. Создание более новой модели R2, по некоторым данным, упёрлось в доступность ускорителей вычислений Nvidia, которые сложно найти на территории Китая.

DeepSeek упёрся в санкции: разработка модели R2 забуксовала из-за нехватки чипов Nvidia

Как напоминает Reuters со ссылкой на The Information, первоначально DeepSeek планировала представить R2 в конце мая, но руководство компании было недовольно достигаемым ею уровнем быстродействия, поэтому доводка этой языковой модели затянулась во времени. По данным источника, прогресс в известной степени тормозится отсутствием в Китае достаточного количества производительных ускорителей вычислений, а DeepSeek пока предпочитает полагаться главным образом на решения Nvidia, поставки которых в КНР серьёзно ограничены из-за санкций США.

Облачная инфраструктура на территории Китая, которая сейчас используется для работы с языковой моделью R1, опирается преимущественно на ускорители Nvidia H20, которые до апреля этого года можно было поставлять вполне легально. В своей отчётности Nvidia отметила, что весенний запрет на поставки ускорителей H20 будет стоить ей нескольких миллиардов долларов США, поскольку предусмотреть иное назначение для такой продукции не получится, и весь запас придётся просто списать. Одновременно с этим Nvidia пытается найти возможность поставлять в Китай менее производительные ускорители, которые соответствовали бы существующим требованиям США в данной сфере. Предполагается, что эти ускорители будут созданы с использованием архитектуры Blackwell и памяти типа GDDR7.

Читать также:
Nissan осталось жить всего год, если автопроизводитель не найдёт инвестора

НОВОЕ НА САЙТЕ

Домашний спа: как устроить себе расслабляющий вечер с подручными средствами

В современном ритме жизни важно не забывать о себе — уделять внимание не только делам, но и отдыху. Домашний спа помогает восстановиться, снять напряжение и просто побыть наедине с собой. Вам не нужно дорогое...

Проекты коммерческих зданий из сэндвич-панелей: преимущества и особенности

Сэндвич-панели становятся все более популярным выбором для строительства коммерческих зданий, благодаря своим многим преимуществам. Быстрый монтаж, экономичность, высокая тепло- и звукоизоляция – вот лишь некоторые из причин, по которым сэндвич-панели выходят на передний план....

Конец эпохи: Microsoft «похоронила» синий экран смерти в Windows 11

«Синий экран смерти» (Blue Screen of Death — BSoD), который почти четыре десятилетия появлялся перед пользователями Windows при критических сбоях, скоро уйдёт в прошлое. Microsoft подтвердила, что в Windows 11 его заменит «Чёрный экран...

Российские геймеры не смогли зайти в Steam в разгар распродажи

Игровой сервис Steam временно перестал работать в некоторых регионах России, о чём свидетельствуют данные платформы Downdetector, предоставляющей информацию о статусе работы онлайн-сервисов, социальных сетей и любых других сайтов. ...

В США начали строить горизонтальный ветрогенератор будущего — дешевле и эффективнее классических ветряков

Компания Airloom Energy сообщила о начале строительства первой коммерческой ветровой электростанции необычной конструкции. В эту разработку первым инвестировал фонд Breakthrough Energy Ventures Билла Гейтса (Bill Gates), увидев в ней революционные перспективы. Теперь пилотный проект...