OpenAI сарапшылары нейрондық желіні ойнауға үйретті Minecraft адам ойыншылары сияқты жоғары стандартқа.
Нейрондық желі 70,000 XNUMX сағаттық әр түрлі ойын ішіндегі кадрларға үйретілді, шағын бейнелермен толықтырылды. дерекқор мердігерлер нақты ойын тапсырмаларын орындаған бейнелер клавиатура және тышқан кірістер де жазылады.
Нақты баптаудан кейін OpenAI модельдің жүзуден бастап аң аулауға және олардың етін тұтынуға дейінгі барлық күрделі дағдыларды орындай алатынын анықтады. Ол сондай-ақ «бағаналық секіруді» түсінді, бұл қозғалыс арқылы ойыншы биіктікке жету үшін орта секіру кезінде астына материал блогын орналастырады.
Мүмкін, ең әсерлі, AI гауһар құралдарын жасай алды (дәйектілікпен орындалатын әрекеттердің ұзақ тізбегін талап етеді), оны OpenAI компьютерлік агент үшін «бұрын-соңды болмаған» жетістік деп сипаттады.
AI серпілісі?
Minecraft жобасының маңыздылығы мынада: ол AI үлгілерін оқытуда OpenAI қолданған жаңа әдістеменің тиімділігін көрсетеді - Video PreTraining (VPT) деп аталады - компания «жалпы компьютерді пайдаланатын агенттердің» дамуын жеделдете алады.
Тарихи тұрғыдан, AI үлгілерін үйрету үшін шикізат көзі ретінде пайдаланудың қиындығы осында болды не болған оқиға түсінуге жеткілікті қарапайым, бірақ міндетті емес қалай . Іс жүзінде, AI моделі қалаған нәтижелерді қабылдайды, бірақ оларға жету үшін қажетті кіріс комбинацияларын түсінбейді.
Дегенмен, VPT көмегімен OpenAI негізгі үлгіні құру үшін тиісті пернетақта мен тінтуірдің қозғалыстарымен белгіленген мұқият таңдалған кадрлар пулымен жалпыға қолжетімді веб-көздерден алынған үлкен бейне деректер жинағын жұптайды.
Негізгі үлгіні дәл баптау үшін команда арнайы тапсырмаларды үйретуге арналған кішірек деректер жиынын қосады. Осы контекстте OpenAI ойыншылардың ағаштарды кесу және қолөнер үстелдерін салу сияқты ойынның басында әрекеттерін орындаған бейнелерді пайдаланды, бұл модель осы тапсырмаларды орындай алатын сенімділікте «үлкен жақсартуға» әкелді.
Тағы бір әдіс тапсырмалар тізбегіндегі әрбір қадамға қол жеткізу үшін AI моделін «марапаттауды» қамтиды, бұл тәжірибені күшейтетін оқыту деп аталады. Бұл процесс нейрондық желіге гауһар тасқа арналған барлық ингредиенттерді адам деңгейіндегі табыстылық көрсеткішімен жинауға мүмкіндік берді.
«VPT агенттерге интернеттегі көптеген бейнелерді көру арқылы әрекет етуді үйренуге мүмкіндік береді. Генеративті бейне модельдеумен немесе тек репрезентативті предметтерді беретін контрасттық әдістермен салыстырғанда, VPT кең ауқымды мінез-құлық приоритеттерін тілден гөрі көбірек домендерде тікелей үйренудің қызықты мүмкіндігін ұсынады», - деп түсіндірді OpenAI. блог пост (жаңа қойындыда ашылады) .
«Біз тек Minecraft-та тәжірибе жасағанымызбен, ойын өте ашық және адам интерфейсі (тінтуір мен пернетақта) өте жалпы, сондықтан біздің нәтижелер басқа ұқсас домендерге, мысалы, компьютерді пайдалану үшін жақсы нәтиже береді деп сенеміз».
Ғарышта одан әрі эксперименттерді ынталандыру үшін OpenAI серіктестік орнатты MinerRL NeurIPS байқауы , күрделі Minecraft тапсырмаларын шешу үшін AI қолдануға әрекеттенетін сайыскерлерге мердігер деректері мен үлгі кодын сыйға тартты. Бас жүлде: $100,000 XNUMX.