NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

NVIDIA представила свою ИИ-модель для превращения текста в видео под названием VideoLDM, разработанную в сотрудничестве с исследователями из Корнельского университета. Модель способна генерировать видео в разрешении до 2048 × 1280 пикселей с частотой 24 кадра и длительностью до 4,7 секунд на основе текстового описания.

NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

В основе модели лежат наработки нейросети Stable Diffusion. Решение NVIDIA имеет до 4,1 млрд параметров, но только 2,7 млрд из этих них использовали видео для тренировки. Это весьма скромно по меркам современных ИИ. Тем не менее, с помощью эффективного подхода к модели скрытой диффузии (LDM — Latent diffusion model) разработчики смогли создавать разнообразные и согласованные во времени видео высокого разрешения с весьма высоким качеством.

Исследователи выделяют следующие особенности данной модели: генерацию персонализированного видео и свёрточный синтез во времени. Временные слои, которые были обучены в VideoLDM для превращения текста в видео, вставляются в опорные сети LDM изображений, которые заранее точно настроены в наборе изображений DreamBooth. Временные слои обобщаются контрольными точками DreamBooth, что позволяет персонализировать преобразование текста в видео. Применяя изученные временные слои сверточно во времени, можно получить клипы чуть большей продолжительности с незначительным ухудшением качества.

Читать также:
Meta✴ Quest 3S скрывает внутри себя Quest 2 — это подтвердило вскрытие iFixit

Модель также способна генерировать видео сцен вождения. Видеоролики имеют разрешение 1024 × 512 точек и длительностью до 5 минут. Есть возможность моделирования конкретного сценария вождения, когда за основу берутся ограничивающие рамки для создания интересующей обстановки, синтезируется соответствующий начальный кадр, а затем создаются правдоподобные видеоролики. Помимо этого, модель может сделать мультимодальное прогнозирование сценариев движения, сгенерировав несколько правдоподобных развертываний на основе одного начального кадра.

Данная исследовательская работа является участником Конференции по машинному зрению и распознаванию образов, которая проходит в Ванкувере с 18 по 22 июня. Пока что представленная нейросеть является лишь исследовательским проектом и не ясно, когда что-то подобное NVIDIA выпустит в открытый доступ.

НОВОЕ НА САЙТЕ

Сделка по выходу с биржи обернулась для Electronic Arts долгом на $20 миллиардов — новые владельцы собираются сокращать расходы за счёт ИИ

Анонсированная накануне сделка на $55 млрд по переходу в частный статус обернётся для американского издателя и разработчика Electronic Arts многомиллиардным долгом и необходимостью быстро адаптироваться. Компьютер месяца —...

Вторая глава, повышение максимального уровня, отключаемый интерфейс и многое другое: для Titan Quest 2 вышло первое крупное обновление

Как и было обещано, 30 сентября для находящегося в раннем доступе мифологического ролевого экшена Titan Quest 2 от издательства THQ Nordic и разработчиков из немецкой студии Grimlore Games вышло первое контентное обновление. ...

Windows 7 набирает популярность — пользователи не хотят переходить на Windows 11 после Windows 10

По данным сервиса StatCounter, глобальная доля компьютеров с Windows 7 среди всех устройств на базе разных версий операционной системы Microsoft за последний месяц существенно выросла. Такую динамику связывают с тем, что период поддержки Windows...

Китай запустил самую мощную в мире центрифугу для экспериментов над пространством и временем

29 сентября 2025 года в Китае официально была запущена самая мощная в мире центрифуга проекта CHIEF. Установка CHIEF1300 способна создавать ускорение 300g для полезной нагрузки до 22 т. Это на порядок превышает возможности самой...

ФИФА анонсировала первую FIFA после ухода Electronic Arts — это футбольная аркада FIFA Heroes для консолей и мобильных телефонов

Спустя два года после окончания сотрудничества с Electronic Arts международная федерация футбола (ФИФА) представила следующую официальную игру FIFA, однако она сильно отличается от того, к чему привыкли фанаты серии. ...