NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

NVIDIA представила свою ИИ-модель для превращения текста в видео под названием VideoLDM, разработанную в сотрудничестве с исследователями из Корнельского университета. Модель способна генерировать видео в разрешении до 2048 × 1280 пикселей с частотой 24 кадра и длительностью до 4,7 секунд на основе текстового описания.

NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

В основе модели лежат наработки нейросети Stable Diffusion. Решение NVIDIA имеет до 4,1 млрд параметров, но только 2,7 млрд из этих них использовали видео для тренировки. Это весьма скромно по меркам современных ИИ. Тем не менее, с помощью эффективного подхода к модели скрытой диффузии (LDM — Latent diffusion model) разработчики смогли создавать разнообразные и согласованные во времени видео высокого разрешения с весьма высоким качеством.

Исследователи выделяют следующие особенности данной модели: генерацию персонализированного видео и свёрточный синтез во времени. Временные слои, которые были обучены в VideoLDM для превращения текста в видео, вставляются в опорные сети LDM изображений, которые заранее точно настроены в наборе изображений DreamBooth. Временные слои обобщаются контрольными точками DreamBooth, что позволяет персонализировать преобразование текста в видео. Применяя изученные временные слои сверточно во времени, можно получить клипы чуть большей продолжительности с незначительным ухудшением качества.

Читать также:
Raspberry Pi представила свои первые SSD

Модель также способна генерировать видео сцен вождения. Видеоролики имеют разрешение 1024 × 512 точек и длительностью до 5 минут. Есть возможность моделирования конкретного сценария вождения, когда за основу берутся ограничивающие рамки для создания интересующей обстановки, синтезируется соответствующий начальный кадр, а затем создаются правдоподобные видеоролики. Помимо этого, модель может сделать мультимодальное прогнозирование сценариев движения, сгенерировав несколько правдоподобных развертываний на основе одного начального кадра.

Данная исследовательская работа является участником Конференции по машинному зрению и распознаванию образов, которая проходит в Ванкувере с 18 по 22 июня. Пока что представленная нейросеть является лишь исследовательским проектом и не ясно, когда что-то подобное NVIDIA выпустит в открытый доступ.

НОВОЕ НА САЙТЕ

У российских производителей электроники простаивает половина цехов из-за бурного роста дешёвого контрактного производства

За последние два года в России открылось около трёх десятков контрактных производств электроники, включая серверы, системы хранения данных, компьютеры и др. Однако, как выяснил «Коммерсантъ», компании с собственным брендом и производством в России не...

Сегодня Microsoft исполнилось 50 лет: от программирования в гараже до самой популярной ОС и лидерства в ИИ

За несколько десятилетий Microsoft совершила настоящую революцию в рабочей среде, сделав массовыми и персональные компьютеры, и облачные ресурсы. В день её 50-летнего юбилея критики предупреждают, что искусственный интеллект может усилить доминирование технологического гиганта. ...

G.Skill представила самые быстрые в мире 64-Гбайт модули памяти для ПК

Компания G.Skill представила двухканальный комплект оперативной памяти DDR5-8000 большого объёма — 128 Гбайт (2 × 64 Гбайт). Производитель называет его первым на рынке комплектом ОЗУ с такой скоростью и ёмкостью. Ещё совсем недавно максимальный...

В Европе установили самый мощный в мире ветрогенератор — мощностью 21,5 МВт и диаметром 276 м

На днях компания Siemens Gamesa завершила установку самой мощной в мире ветряной турбины, тем самым бросив вызов китайским производителям. Пока европейские компании в большинстве своём выпускают ветрогенераторы мощностью 14–15 МВт, дочернее подразделение Siemens Energy...

Спустя 10 лет после релиза Ubisoft случайно ввела цензуру в Far Cry 4, но быстро исправила ошибку

Шутеру с открытым миром Far Cry 4 от Ubisoft и Ubisoft Montreal в ноябре исполнится уже 11 лет. Тем удивительнее фанатам франшизы показалась история, на днях развернувшаяся с игрой. ...