Metas nye Make-a-Video AI kan generere raske filmklipp fra tekstmeldinger

Engadget
september 30
Del innlegg

Meta avduket sin Make-a-Scene tekst-til-bilde generasjon AI i juli, som i likhet med Dall-E og midt på reisen, bruker maskinlæringsalgoritmer (og massive databaser med skrapet nettkunstverk) for å lage fantastiske skildringer av skriftlige spørsmål. Torsdag avslørte Meta-sjef Mark Zuckerberg Make-a-Scene sin mer animerte samtid, Make-a-Video.

Som navnet tilsier, er Make-a-Video, "et nytt AI-system som lar folk gjøre tekstmeldinger om til korte videoklipp av høy kvalitet," skrev Zuckerberg i en Meta-blogg torsdag. Funksjonelt fungerer Video på samme måte som Scene gjør – avhengig av en blanding av naturlig språkbehandling og generative nevrale nettverk for å konvertere ikke-visuelle meldinger til bilder – det er bare å trekke innhold i et annet format.

"Vår intuisjon er enkel: lær hvordan verden ser ut og hvordan den beskrives fra sammenkoblede tekst-bildedata, og lær hvordan verden beveger seg fra uovervåket videoopptak," skrev et team av Meta-forskere i en forskningsartikkel publisert torsdag morgen. Dette gjorde det mulig for teamet å redusere tiden som trengs for å trene videomodellen og eliminere behovet for sammenkoblede tekst-video-data, samtidig som de bevarte «vidden (mangfoldet i estetikk, fantastiske avbildninger, etc.) til dagens bildegenereringsmodeller. ”

Som med det meste av Metas AI-forskning, blir Make-a-Video utgitt som et åpen kildekode-prosjekt. "Vi ønsker å være gjennomtenkte om hvordan vi bygger nye generative AI-systemer som dette," sa Zuckerberg. "Vi deler åpent denne generative AI-forskningen og resultatene med samfunnet for deres tilbakemelding, og vil fortsette å bruke vårt ansvarlige AI-rammeverk for å foredle og utvikle vår tilnærming til denne nye teknologien."

Som med tilsynelatende alle generative AI som utgis, er muligheten for misbruk av Make-a-Video ikke liten. For å komme i forkant av potensielle ondskapsfulle skjellsord, skrubbet forskerteamet preventivt Make-a-Video-treningsdatasettet til alle NSFW-bilder, så vel som giftige fraseringer.

Alle produkter anbefalt av Engadget er valgt ut av redaksjonen vår, uavhengig av vårt morselskap. Noen av historiene våre inkluderer tilknyttede lenker. Hvis du kjøper noe gjennom en av disse lenkene, kan vi tjene en tilknyttet provisjon. Alle priser er korrekte på publiseringstidspunktet.

kilde