Meta의 새로운 Make-a-Video AI는 텍스트 프롬프트에서 빠른 동영상 클립을 생성할 수 있습니다.

Meta는 XNUMX월에 Dall-E 및 중도, 기계 학습 알고리즘(및 스크랩한 온라인 아트워크의 방대한 데이터베이스)을 사용하여 서면 프롬프트의 환상적인 묘사를 만듭니다. 목요일, 메타의 CEO인 마크 주커버그는 메이크어씬의 보다 생생한 컨템포러리 작품인 메이크어비디오를 공개했다.

주커버그는 목요일 메타 블로그에서 이름에서 알 수 있듯이 "사람들이 텍스트 프롬프트를 짧은 고품질 비디오 클립으로 변환할 수 있는 새로운 AI 시스템"이라고 썼습니다. 기능적으로 비디오는 비시각적 프롬프트를 이미지로 변환하기 위해 자연어 처리와 생성 신경망을 혼합하여 사용하는 Scene과 동일한 방식으로 작동합니다. 단지 콘텐츠를 다른 형식으로 가져오는 것뿐입니다.

메타 연구원 팀은 목요일 아침에 발표된 연구 논문에서 "우리의 직관은 간단합니다. 쌍으로 된 텍스트-이미지 데이터에서 세상이 어떻게 생겼는지, 어떻게 설명되는지 배우고 감독되지 않은 비디오 장면에서 세상이 어떻게 움직이는지 배우십시오."라고 썼습니다. 그렇게 함으로써 팀은 비디오 모델을 훈련하는 데 필요한 시간을 줄이고 쌍으로 된 텍스트-비디오 데이터의 필요성을 제거하면서 오늘날 이미지 생성 모델의 "광대함(미학적, 환상적인 묘사 등의 다양성)을 보존할 수 있었습니다. "   

Meta의 모든 AI 연구와 마찬가지로 Make-a-Video는 오픈 소스 프로젝트로 출시되고 있습니다. Zuckerberg는 "우리는 이와 같은 새로운 생성 AI 시스템을 구축하는 방법에 대해 생각하고 싶습니다."라고 말했습니다. "우리는 이 생성적 AI 연구 및 결과를 커뮤니티와 공개적으로 공유하여 피드백을 받고 있으며 책임 있는 AI 프레임워크를 계속 사용하여 이 새로운 기술에 대한 접근 방식을 개선하고 발전시킬 것입니다." 

출시되는 모든 생성 AI와 마찬가지로 Make-a-Video의 오용 기회는 작지 않습니다. 잠재적인 사악한 속임수를 피하기 위해 연구팀은 모든 NSFW 이미지와 유해한 문구의 Make-a-Video 교육 데이터 세트를 선제적으로 스크러빙했습니다.     

Engadget에서 추천하는 모든 제품은 모회사와 무관한 편집 팀에서 선택합니다. 일부 스토리에는 제휴사 링크가 포함되어 있습니다. 이 링크 중 하나를 통해 무언가를 구매하면 제휴 수수료를 받을 수 있습니다. 모든 가격은 게시 당시에 정확합니다.

출처