NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

NVIDIA представила свою ИИ-модель для превращения текста в видео под названием VideoLDM, разработанную в сотрудничестве с исследователями из Корнельского университета. Модель способна генерировать видео в разрешении до 2048 × 1280 пикселей с частотой 24 кадра и длительностью до 4,7 секунд на основе текстового описания.

NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

В основе модели лежат наработки нейросети Stable Diffusion. Решение NVIDIA имеет до 4,1 млрд параметров, но только 2,7 млрд из этих них использовали видео для тренировки. Это весьма скромно по меркам современных ИИ. Тем не менее, с помощью эффективного подхода к модели скрытой диффузии (LDM — Latent diffusion model) разработчики смогли создавать разнообразные и согласованные во времени видео высокого разрешения с весьма высоким качеством.

Исследователи выделяют следующие особенности данной модели: генерацию персонализированного видео и свёрточный синтез во времени. Временные слои, которые были обучены в VideoLDM для превращения текста в видео, вставляются в опорные сети LDM изображений, которые заранее точно настроены в наборе изображений DreamBooth. Временные слои обобщаются контрольными точками DreamBooth, что позволяет персонализировать преобразование текста в видео. Применяя изученные временные слои сверточно во времени, можно получить клипы чуть большей продолжительности с незначительным ухудшением качества.

Читать также:
«Это должно быть частью основной игры»: для Skyrim вышел платный фанатский аддон Bards College, который сравнивают с официальными DLC

Модель также способна генерировать видео сцен вождения. Видеоролики имеют разрешение 1024 × 512 точек и длительностью до 5 минут. Есть возможность моделирования конкретного сценария вождения, когда за основу берутся ограничивающие рамки для создания интересующей обстановки, синтезируется соответствующий начальный кадр, а затем создаются правдоподобные видеоролики. Помимо этого, модель может сделать мультимодальное прогнозирование сценариев движения, сгенерировав несколько правдоподобных развертываний на основе одного начального кадра.

Данная исследовательская работа является участником Конференции по машинному зрению и распознаванию образов, которая проходит в Ванкувере с 18 по 22 июня. Пока что представленная нейросеть является лишь исследовательским проектом и не ясно, когда что-то подобное NVIDIA выпустит в открытый доступ.

НОВОЕ НА САЙТЕ

В Молдавии предрекли новый энергетический кризис

Дзен Санкции США против Газпромбанка могут обернуться для Молдавии новым энергетическим кризисом, заявил в эксклюзивном комментарии РИА Новости молдавский политик и бизнесмен, лидер политблока "Победа" Илан Шор. США в четверг ввели санкции против Газпромбанка...

Медведев после применения Россией «Орешника» дал совет Европе

Дзен Заместитель председателя Совета безопасности России Дмитрий Медведев на фоне применения новейшей российской ракетной системы "Орешник" призвал Запад отказаться от поддержки конфликта на Украине. Об этом он написал в Telegram-канале.Он отметил, что гиперзвуковая баллистическая...

Советник Верховного лидера Ирана дал прогноз о конфликте на Украине

Дзен Помощь Запада Украине сократится, учитывая, что к власти в США пришло правительство с отличными от предыдущего кабинета взглядами, Россия, похоже, победит, заявил советник Верховного лидера Ирана по международным вопросам Али Акбар Велаяти. "Учитывая...

Симоньян рассказала, когда Запад остановится

Дзен Коллективный Запад остановится только тогда, когда по-настоящему испугается, заявила главный редактор медиагруппы "Россия сегодня" и телеканала RT Маргарита Симоньян в эфире программы "Вечер с Владимиром Соловьевым" на телеканале "Россия 1"."Пока они, я имею...

ЕБРР не поможет украинским олигархам в восстановлении страны

Дзен Европейский банк реконструкции и развития (ЕБРР) отказывается сотрудничать с украинскими олигархами, включая владельца System Capital Management (SCM) Holdings Рината Ахметова, в восстановлении Украины после конфликта, сообщила президент банка Одиль Рено-Басс в интервью итальянской...