Meta 的全新 Make-a-Video AI 可以根据文本提示生成快速影片剪辑

Meta 在 7 月份推出了 Make-a-Scene 文本到图像生成人工智能,类似于 Dall-E 和 中途,利用机器学习算法(以及抓取的在线艺术品的大量数据库)来创建书面提示的奇幻描述。周四,Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 透露了 Make-a-Scene 的更动画化的当代产品 Make-a-Video。

顾名思义,Make-a-Video 是“一种新的人工智能系统,可以让人们将文本提示变成简短的高质量视频剪辑,”扎克伯格周四在 Meta 博客中写道。从功能上讲,视频的工作方式与场景相同 - 依靠自然语言处理和生成神经网络的混合将非视觉提示转换为图像 - 它只是以不同的格式提取内容。

“我们的直觉很简单:从配对的文本图像数据中了解世界是什么样子以及如何描述它,并从无监督的视频片段中了解世界如何移动,”Meta 研究人员团队在周四上午发表的一篇研究论文中写道。这样做使团队能够减少训练视频模型所需的时间,并消除对配对文本视频数据的需求,同时保留“当今图像生成模型的多样性(审美的多样性、梦幻般的描述等)”。 ”   

与 Meta 的大多数人工智能研究一样,Make-a-Video 也作为开源项目发布。扎克伯格指出:“我们希望认真思考如何构建这样的新的生成式人工智能系统。” “我们正在与社区公开分享这一生成式人工智能研究和结果,以征求他们的反馈,并将继续使用我们负责任的人工智能框架来完善和发展我们针对这一新兴技术的方法。” 

与几乎所有发布的生成式人工智能一样,滥用制作视频的机会也不小。为了避免任何潜在的邪恶恶作剧,研究团队先发制人地清除了所有 NSFW 图像和有毒措辞的制作视频训练数据集。     

Engadget 推荐的所有产品均由我们的编辑团队选择,独立于我们的母公司。 我们的一些故事包括附属链接。 如果您通过这些链接之一购买商品,我们可能会获得会员佣金。 所有价格在发布时都是正确的。

来源