Новый ИИ Make-a-Video от Meta может создавать быстрые видеоклипы из текстовых подсказок.

MВ июле eta представила свой ИИ для преобразования текста в изображение Make-a-Scene, который, как и Dall-E и Середина пути, использует алгоритмы машинного обучения (и массивные базы данных скопированных онлайн-произведений искусства) для создания фантастических изображений письменных подсказок. В четверг генеральный директор Meta Марк Цукерберг представил более анимированную версию Make-a-Scene, Make-a-Video.

Как следует из названия, Make-a-Video — это «новая система искусственного интеллекта, которая позволяет людям превращать текстовые подсказки в короткие высококачественные видеоклипы», — написал Цукерберг в блоге Meta в четверг. Функционально Video работает так же, как и Scene — полагаясь на сочетание обработки естественного языка и генеративных нейронных сетей для преобразования невизуальных подсказок в изображения — он просто извлекает контент в другом формате.

«Наша интуиция проста: узнайте, как выглядит мир и как он описывается, из парных данных текст-изображение, и узнайте, как мир движется, из неконтролируемых видеозаписей», — написала группа исследователей Meta в исследовательской статье, опубликованной в четверг утром. Это позволило команде сократить время, необходимое для обучения видеомодели, и устранить необходимость в парных текстовых и видеоданных, сохранив при этом «обширность (разнообразие эстетики, фантастические изображения и т. д.) сегодняшних моделей генерации изображений. ”   

Как и большинство исследований Meta в области искусственного интеллекта, Make-a-Video выпускается как проект с открытым исходным кодом. «Мы хотим подумать о том, как мы создаем новые генеративные системы искусственного интеллекта, подобные этой», — отметил Цукерберг. «Мы открыто делимся этим генеративным исследованием и результатами ИИ с сообществом для получения отзывов и продолжим использовать нашу ответственную структуру ИИ для совершенствования и развития нашего подхода к этой новой технологии». 

Как и в случае с каждым выпущенным генеративным ИИ, возможность неправильного использования Make-a-Video не так уж и мала. Чтобы опередить любые потенциальные гнусные махинации, исследовательская группа предварительно очистила набор обучающих данных Make-a-Video от любых изображений NSFW, а также от токсичных фраз.     

Все продукты, рекомендованные Engadget, выбираются нашей редакционной группой независимо от нашей материнской компании. Некоторые из наших историй содержат партнерские ссылки. Если вы покупаете что-то по одной из этих ссылок, мы можем получить партнерскую комиссию. Все цены актуальны на момент публикации.

Источник