Meta stellte im Juli seine Text-zu-Bild-Generierungs-KI Make-a-Scene vor, die wie Dall-E und Zwischendurch, verwendet maschinelle Lernalgorithmen (und riesige Datenbanken mit geschabten Online-Grafiken), um fantastische Darstellungen von schriftlichen Aufforderungen zu erstellen. Am Donnerstag enthüllte Mark Zuckerberg, CEO von Meta, den animierteren Zeitgenossen von Make-a-Scene, Make-a-Video.
Wie der Name schon sagt, ist Make-a-Video „ein neues KI-System, mit dem Menschen Textaufforderungen in kurze, qualitativ hochwertige Videoclips verwandeln können“, schrieb Zuckerberg am Donnerstag in einem Meta-Blog. Funktional funktioniert Video genauso wie Scene – es stützt sich auf eine Mischung aus natürlicher Sprachverarbeitung und generativen neuronalen Netzen, um nicht-visuelle Eingabeaufforderungen in Bilder umzuwandeln – es zieht nur Inhalte in ein anderes Format.
„Unsere Intuition ist einfach: Lernen Sie aus gepaarten Text-Bild-Daten, wie die Welt aussieht und wie sie beschrieben wird, und lernen Sie aus unbeaufsichtigtem Videomaterial, wie sich die Welt bewegt“, schrieb ein Team von Meta-Forschern in einem Forschungsbericht, der am Donnerstagmorgen veröffentlicht wurde. Auf diese Weise konnte das Team die zum Trainieren des Videomodells erforderliche Zeit reduzieren und die Notwendigkeit gepaarter Text-Video-Daten eliminieren, während „die Weite (Vielfalt in ästhetischen, fantastischen Darstellungen usw.) der heutigen Bilderzeugungsmodelle erhalten blieb. ”
Wie fast alle KI-Forschungen von Meta wird Make-a-Video als Open-Source-Projekt veröffentlicht. „Wir wollen gut darüber nachdenken, wie wir neue generative KI-Systeme wie dieses bauen“, bemerkte Zuckerberg. „Wir teilen diese generative KI-Forschung und -Ergebnisse offen mit der Community, um Feedback zu erhalten, und werden unser verantwortungsvolles KI-Framework weiterhin nutzen, um unseren Ansatz für diese neue Technologie zu verfeinern und weiterzuentwickeln.“
Wie bei scheinbar jeder veröffentlichten generativen KI ist die Möglichkeit des Missbrauchs von Make-a-Video nicht gering. Um potenziellen schändlichen Spielereien einen Schritt voraus zu sein, hat das Forschungsteam den Trainingsdatensatz „Make-a-Video“ präventiv mit allen NSFW-Bildern sowie giftigen Formulierungen bereinigt.
Alle von Engadget empfohlenen Produkte werden von unserem Redaktionsteam unabhängig von unserer Muttergesellschaft ausgewählt. Einige unserer Geschichten enthalten Affiliate-Links. Wenn Sie etwas über einen dieser Links kaufen, erhalten wir möglicherweise eine Affiliate-Provision. Alle Preise sind zum Zeitpunkt der Veröffentlichung korrekt.