Pakar ing OpenAI wis nglatih jaringan saraf kanggo muter Minecraft kanggo standar merata dhuwur minangka pemain manungsa.
Jaringan saraf dilatih ing 70,000 jam macem-macem rekaman ing game, ditambah karo gambar cilik. database video kang kontraktor nindakake tugas ing-game tartamtu, karo keyboard lan mouse input uga direkam.
Sawise fine-tuning, OpenAI nemokake model kasebut bisa nindakake kabeh katrampilan sing rumit, saka nglangi nganti mburu kewan lan ngonsumsi daging. Uga nangkep "lompat pilar", pamindhahan sing pemain nempatake blok materi ing ngisor mid-jump kanggo entuk elevasi.
Mbok menawa sing paling nggumunake, AI bisa nggawe alat berlian (mbutuhake senar dawa tumindak supaya bisa dieksekusi kanthi urutan), sing OpenAI diterangake minangka prestasi "durung ana sadurunge" kanggo agen komputer.
Terobosan AI?
Wigati proyek Minecraft yaiku nduduhake khasiat teknik anyar sing ditindakake dening OpenAI ing latihan model AI - sing diarani Video PreTraining (VPT) - sing dikandhakake perusahaan bisa nyepetake pangembangan "agen nggunakake komputer umum".
Sacara historis, kangelan nggunakake video mentah minangka sumber kanggo latihan model AI opo wis kedaden cukup prasaja kanggo ngerti, nanging ora kudu carane . Akibate, model AI bakal nyerep asil sing dikarepake, nanging ora ngerti kombinasi input sing dibutuhake kanggo nggayuh.
Nanging, kanthi VPT, OpenAI masangake set data video gedhe sing dijupuk saka sumber web umum kanthi kumpulan cuplikan sing dikurasi kanthi teliti kanthi label gerakan keyboard lan mouse sing cocog kanggo nggawe model dhasar.
Kanggo nyempurnakake model dhasar, tim banjur masang set data sing luwih cilik sing dirancang kanggo mulang tugas tartamtu. Ing konteks iki, OpenAI nggunakake cuplikan para pemain sing nindakake aksi awal game, kayata ngethok wit-witan lan mbangun meja kerajinan, sing diarani ngasilake "dandan gedhe" ing linuwih sing model kasebut bisa nindakake tugas kasebut.
Teknik liya kalebu "ngganti" model AI kanggo entuk saben langkah ing urutan tugas, praktik sing dikenal minangka pembelajaran penguatan. Proses iki ngidini jaringan saraf ngumpulake kabeh bahan kanggo pickaxe berlian kanthi tingkat sukses tingkat manungsa.
"VPT mbukak dalan kanggo ngidini agen sinau tumindak kanthi nonton video sing akeh banget ing internet. Dibandhingake karo model video generatif utawa metode kontrastif sing mung bakal ngasilake priors representasional, VPT nawakake kemungkinan sing nyenengake kanggo langsung sinau priors prilaku skala gedhe ing domain luwih saka mung basa, "jelas OpenAI ing a kirim blog (mbukak ing tab anyar) .
"Nalika kita mung eksprimen ing Minecraft, game iki mbukak banget lan antarmuka manungsa asli (mouse lan keyboard) umum banget, mula kita yakin asil kita apik kanggo domain liyane sing padha, kayata panggunaan komputer."
Kanggo nyurung eksperimen luwih lanjut ing papan kasebut, OpenAI wis kerja sama karo Kompetisi MineRL NeurIPS , nyumbang data kontraktor lan kode model kanggo kontestan sing nyoba nggunakake AI kanggo ngatasi tugas Minecraft sing rumit. Hadiah utama: $ 100,000.