GeForce RTX 5090 стали зависать в рабочих станциях — причина не ясна, а помогает только перезагрузка

Видеокарты Nvidia GeForce RTX 5090 и RTX Pro 6000 столкнулись с воспроизводимой ошибкой сброса функции виртуализации, из-за которой графические ускорители могут полностью перестать отвечать до физической перезагрузки хост-системы.

GeForce RTX 5090 стали зависать в рабочих станциях — причина не ясна, а помогает только перезагрузка

Обзор видеокарты Acer Nitro Intel Arc B580 OC

Обзор планшета HUAWEI MatePad 11,5» (2025): апгрейд без бликов

Ноутбуки HONOR MagicBook: технологии, дизайн и производительность для любых задач

Компьютер месяца — сентябрь 2025 года

Обзор смартфона HUAWEI Pura 80 Pro: разумный флагман с мощнейшей камерой

Шестиядерники за 10 тысяч рублей — сравнение и тесты

В чем уникальность зум-камеры HUAWEI Pura 80 Ultra?

Обзор ноутбука HONOR MagicBook Pro 16 HUNTER 2025. Для игр? Для работы? Для игр и работы!

Компания CloudRift, провайдер облачных вычислений с графическими процессорами, опубликовала подробное описание проблемы, обнаруженной на нескольких системах, оборудованных ускорителями Blackwell. Компания даже объявила о публичной награде в размере $1000 за решение ошибки или обнаружение её первопричины. По данным CloudRift, ошибка возникает после того, как графический процессор был подключён к виртуальной машине с помощью KVM и VFIO. При выключении гостевой системы или переназначении графического процессора хост выполняет сброс на уровне функций PCIe (FLR), что является стандартной процедурой очистки устройства, подключённого к хост-системе. Но вместо того чтобы вернуться в заведомо исправное состояние, графический процессор не отвечает, и появляется ошибка ядра: «не завершено через 65535 мс после FLR; сдаюсь» (not ready 65535ms after FLR; giving up). В этот момент карта также становится нечитаемой для lspci, что приводит к ошибкам «неизвестный тип заголовка 7f». CloudRift отмечает, что единственный способ восстановить нормальную работу — это выключить и снова включить всю систему.

Читать также:
Издателем Heroes of Might & Magic: Olden Era стала компания, которая до сих пор продаёт игры в России — новый геймплейный трейлер

Tiny Corp, стартап в области искусственного интеллекта, разработчик фреймворка tinygrad для глубокого обучения, привлёк внимание к этой проблеме, опубликовав результаты CloudRift на X.com с вопросом: «Есть ли у RTX 5090 и RTX Pro 6000 аппаратный дефект? Мы изучили этот вопрос, но не нашли решения».

Обсуждения на форумах Proxmox и в сообществе Level1Techs свидетельствуют о том, что домашние пользователи и другие владельцы карт RTX 5090 также сталкиваются с похожим поведением. Так, в одном случае пользователь сообщил о полном зависании хоста после выключения гостевой системы Windows, при этом графический процессор не смог повторно инициализироваться даже после перезагрузки ОС. В другом случае пользователь сообщил: «Я обнаружил, что мой хост перестал отвечать. Дальнейшая отладка показала, что процессор хоста был заблокирован после тайм-аута FLR, который произошёл после выключения LinuxVM. С моей предыдущей картой RTX 4080 проблем не возникало».

Несколько пользователей подтвердили, что переключение настроек PCIe ASPM или ACS не устраняет проблему. С видеокартами Nvidia предыдущего поколения, такими как RTX 4090, проблем не наблюдалось, что позволяет предположить, что ошибка может быть связана только с актуальным семейством видеокарт Nvidia Blackwell.

FLR — критически важная функция в конфигурациях сквозного доступа к графическим процессорам, позволяющая безопасно сбрасывать устройство и переназначать его между гостевыми системами. Если в работе FLR есть проблемы, многопользовательские рабочие нагрузки ИИ и домашние лаборатории с использованием виртуализации становятся рискованными, особенно когда сбой одной видеокарты приводит к сбою всего хоста. Nvidia пока официально не признала наличие проблемы, и на момент публикации данной заметки не было известно о способах её решения.

НОВОЕ НА САЙТЕ

США прекратили действие меморандумов о борьбе с дезинформацией, пишут СМИ

Дзен США уведомили страны Европы, что прекращают действие меморандумов о взаимопонимании в сфере "борьбы с дезинформацией третьих стран", сообщает британская газета Financial Times со ссылкой на европейских чиновников. В апреле госсекретарь США Марко Рубио...

Слуцкий призвал к независимому расследованию подрыва «Северных потоков»

Дзен В ситуации вокруг подрыва "Северных потоков" необходимо проводить независимое международное расследование с привлечением высокопрофессиональных экспертов, считает глава комитета Госдумы по международным делам Леонид Слуцкий. Ранее издание Welt со ссылкой на неназванного немецкого следователя...

На Западе обсуждают создание «воздушного щита» на Украине, пишет FT

Дзен На Западе обсуждают обеспечение фактического прекращения огня на Украине посредством американского "воздушного щита", утверждает обозреватель британской газеты Financial Times Гидеон Рахман. «"Сейчас обсуждается создание "де-факто прекращения огня" через американский воздушный щит", — указано...

«Хромая утка»: в Германии резко ответили на план Макрона по Украине

ДзенПолитический крах президента Франции Эммануэля Макрона подрывает внешнюю политику всего Европейского союза, пишет немецкая газета Berliner Zeitung."Нестабильность во Франции также парализует внешнюю политику. Макрон возглавляет "Коалицию желающих", которая хочет отправить европейские войска на Украину...

Экономист оценил последствия отказа Европы от российских энергоресурсов

Дзен Полный отказ Европы от российских энергоресурсов не сможет произойти до 2030 года, а переход на нефть и газ из США негативно скажется на европейской промышленности, такое мнение высказал РИА Новости декан факультета финансовой...