Die neue Make-a-Video-KI von Meta kann schnelle Filmclips aus Texteingabeaufforderungen erstellen

Engadget
September 30
Beitrag teilen

Meta stellte im Juli seine Text-zu-Bild-Generierungs-KI Make-a-Scene vor, die wie Dall-E und Zwischendurch, verwendet maschinelle Lernalgorithmen (und riesige Datenbanken mit geschabten Online-Grafiken), um fantastische Darstellungen von schriftlichen Aufforderungen zu erstellen. Am Donnerstag enthüllte Mark Zuckerberg, CEO von Meta, den animierteren Zeitgenossen von Make-a-Scene, Make-a-Video.

Wie der Name schon sagt, ist Make-a-Video „ein neues KI-System, mit dem Menschen Textaufforderungen in kurze, qualitativ hochwertige Videoclips verwandeln können“, schrieb Zuckerberg am Donnerstag in einem Meta-Blog. Funktional funktioniert Video genauso wie Scene – es stützt sich auf eine Mischung aus natürlicher Sprachverarbeitung und generativen neuronalen Netzen, um nicht-visuelle Eingabeaufforderungen in Bilder umzuwandeln – es zieht nur Inhalte in ein anderes Format.

„Unsere Intuition ist einfach: Lernen Sie aus gepaarten Text-Bild-Daten, wie die Welt aussieht und wie sie beschrieben wird, und lernen Sie aus unbeaufsichtigtem Videomaterial, wie sich die Welt bewegt“, schrieb ein Team von Meta-Forschern in einem Forschungsbericht, der am Donnerstagmorgen veröffentlicht wurde. Auf diese Weise konnte das Team die zum Trainieren des Videomodells erforderliche Zeit reduzieren und die Notwendigkeit gepaarter Text-Video-Daten eliminieren, während „die Weite (Vielfalt in ästhetischen, fantastischen Darstellungen usw.) der heutigen Bilderzeugungsmodelle erhalten blieb. ”

Wie fast alle KI-Forschungen von Meta wird Make-a-Video als Open-Source-Projekt veröffentlicht. „Wir wollen gut darüber nachdenken, wie wir neue generative KI-Systeme wie dieses bauen“, bemerkte Zuckerberg. „Wir teilen diese generative KI-Forschung und -Ergebnisse offen mit der Community, um Feedback zu erhalten, und werden unser verantwortungsvolles KI-Framework weiterhin nutzen, um unseren Ansatz für diese neue Technologie zu verfeinern und weiterzuentwickeln.“

Wie bei scheinbar jeder veröffentlichten generativen KI ist die Möglichkeit des Missbrauchs von Make-a-Video nicht gering. Um potenziellen schändlichen Spielereien einen Schritt voraus zu sein, hat das Forschungsteam den Trainingsdatensatz „Make-a-Video“ präventiv mit allen NSFW-Bildern sowie giftigen Formulierungen bereinigt.

Alle von Engadget empfohlenen Produkte werden von unserem Redaktionsteam unabhängig von unserer Muttergesellschaft ausgewählt. Einige unserer Geschichten enthalten Affiliate-Links. Wenn Sie etwas über einen dieser Links kaufen, erhalten wir möglicherweise eine Affiliate-Provision. Alle Preise sind zum Zeitpunkt der Veröffentlichung korrekt.

Quelle

VORHERIGER ARTIKEL

NÄCHSTER ARTIKEL

Die neue Make-a-Video-KI von Meta kann schnelle Filmclips aus Texteingabeaufforderungen erstellen

Must-Have-Software im Jahr 2024

Top Kategorien

Aktuelle Bewertungen

Teaser-Video zum Samsung Galaxy Z Flip 5 im Vorfeld des Galaxy Unpacked-Events zeigt neues Scharnierdesign und neue Farboptionen

Twitter begrenzt die Anzahl der DMs, die nicht verifizierte Benutzer senden können

Mein Lieblings-Android-Telefon kann Dinge, die mein iPhone 14 Pro Max nicht kann

ChatGPT für Android startet nächste Woche und Sie können sich jetzt vorregistrieren

Xiaomi Smart TV 32A, Smart TV 40A, Smart TV 43A mit Google TV, 20-W-Lautsprecher in Indien eingeführt: : Preis, Spezifikationen

Diese essbare Batterie könnte die Welt der Diagnostik und nachhaltigen Energie antreiben