Nová umělá inteligence Make-a-Video od Meta dokáže generovat rychlé filmové klipy z textových výzev

MSpolečnost eta v červenci představila svou generaci AI Make-a-Scene pro převod textu na obrázek, která podobně jako Dall-E a Střední cesta, využívá algoritmy strojového učení (a rozsáhlé databáze seškrabovaných online uměleckých děl) k vytvoření fantastických zobrazení písemných výzev. Generální ředitel společnosti Meta Mark Zuckerberg ve čtvrtek odhalil animovanější současnost Make-a-Scene, Make-a-Video.

Jak název napovídá, Make-a-Video je „nový systém umělé inteligence, který lidem umožňuje přeměnit textové výzvy na krátké, vysoce kvalitní videoklipy,“ napsal Zuckerberg ve čtvrtek na blogu Meta. Funkčně funguje Video stejným způsobem jako Scene – spoléhá se na kombinaci zpracování přirozeného jazyka a generativních neuronových sítí pro převod nevizuálních výzev na obrázky – je to jen stahování obsahu v jiném formátu.

„Naše intuice je jednoduchá: naučte se, jak svět vypadá a jak je popsán, ze spárovaných textových a obrazových dat, a zjistěte, jak se svět pohybuje z nekontrolovaných videozáznamů,“ napsal tým výzkumníků z Meta ve výzkumném článku publikovaném ve čtvrtek ráno. To umožnilo týmu zkrátit množství času potřebného k trénování Video modelu a eliminovat potřebu párovaných textových a videodat a zároveň zachovat „rozsáhlost (rozmanitost v estetickém, fantastickém zobrazení atd.) dnešních modelů generování obrázků. “   

Stejně jako u většiny všech výzkumů AI společnosti Meta, Make-a-Video vychází jako open-source projekt. „Chceme být ohleduplní k tomu, jak vytváříme nové generativní systémy umělé inteligence, jako je tento,“ poznamenal Zuckerberg. „Otevřeně sdílíme tento generativní výzkum a výsledky umělé inteligence s komunitou za účelem jejich zpětné vazby a budeme i nadále používat náš odpovědný rámec umělé inteligence k vylepšování a rozvoji našeho přístupu k této vznikající technologii.“ 

Jako u zdánlivě každé generativní umělé inteligence, která je vydána, příležitost ke zneužití Make-a-Video není malá. Aby se výzkumný tým dostal před všechny potenciální hanebné podvody, preventivně vymazal tréninkovou datovou sadu Make-a-Video všech snímků NSFW a také toxických frází.     

Všechny produkty doporučené Engadget vybírá náš redakční tým, nezávislý na naší mateřské společnosti. Některé z našich příběhů obsahují přidružené odkazy. Pokud si něco koupíte prostřednictvím některého z těchto odkazů, můžeme získat provizi přidružené společnosti. Všechny ceny jsou správné v době zveřejnění.

Zdroj