ІІ зараз можа гуляць у Minecraft гэтак жа добра, як і вы - вось чаму гэта важна

Эксперты OpenAI навучылі нейронавую сетку гуляць Minecraft на такім жа высокім узроўні, як і гульцы-чалавечыя.

Нейронавая сетка была падрыхтавана на 70,000 XNUMX гадзінах рознага матэрыялу ў гульні, дапоўненага невялікім база дадзеных відэа, у якіх падрадчыкі выконвалі канкрэтныя задачы ў гульні, з клавіятура і мыш ўваходы таксама запісваюцца.

Пасля тонкай налады OpenAI выявіў, што мадэль здольная выконваць усе розныя складаныя навыкі, ад плавання да палявання на жывёл і спажывання іх мяса. Ён таксама зразумеў «скачок слупа», рух, пры якім гулец размяшчае блок матэрыялу пад сабой у сярэдзіне скачка, каб атрымаць вышыню.

Магчыма, самае ўражвае тое, што ІІ змог ствараць алмазныя інструменты (патрабуючы паслядоўнага выканання доўгага шэрагу дзеянняў), што OpenAI ахарактарызаваў як «беспрэцэдэнтнае» дасягненне для кампутарнага агента.

Прарыў ІІ?

Значэнне праекта Minecraft заключаецца ў тым, што ён дэманструе эфектыўнасць новай методыкі, разгорнутай OpenAI пры навучанні мадэляў штучнага інтэлекту - пад назвай Video PreTraining (VPT), - якая, па словах кампаніі, можа паскорыць распрацоўку «агентаў, якія выкарыстоўваюць агульныя кампутары».

Гістарычна складанасць з выкарыстаннем сырога відэа ў якасці крыніцы для навучання мадэляў ІІ заключалася ў тым, што што адбылося досыць проста зразумець, але не абавязкова як. Па сутнасці, мадэль ІІ будзе паглынаць жаданыя вынікі, але не мае разумення ўваходных камбінацый, неабходных для іх дасягнення.

З VPT, аднак, OpenAI спалучае вялікі набор відэаданых, узяты з агульнадаступных вэб-крыніц, з старанна адабраным наборам матэрыялаў, пазначаных адпаведнымі рухамі клавіятуры і мышы, каб стварыць асноватворную мадэль.

Каб дакладна наладзіць базавую мадэль, каманда затым падключае меншыя наборы даных, прызначаныя для навучання пэўным задачам. У гэтым кантэксце OpenAI выкарыстоўваў кадры гульцоў, якія выконваюць раннія дзеянні ў гульні, такія як высяканне дрэў і стварэнне столаў для крафта, што, як кажуць, прынесла «вялікае паляпшэнне» надзейнасці, з якой мадэль змагла выконваць гэтыя задачы.

Іншая методыка ўключае ў сябе «ўзнагароджанне» мадэлі ІІ за дасягненне кожнага кроку ў паслядоўнасці задач, практыка, вядомая як навучанне з падмацаваннем. Менавіта гэты працэс дазволіў нейроннай сеткі сабраць усе інгрэдыенты для алмазнай кіркі з паказчыкам поспеху на ўзроўні чалавека.

«VPT пракладае шлях да таго, каб дазволіць агентам навучыцца дзейнічаць, праглядаючы велізарную колькасць відэа ў Інтэрнэце. У параўнанні з генератыўным відэамадэляваннем або кантраснымі метадамі, якія даюць толькі рэпрэзентацыйныя апрыёры, VPT прапануе захапляльную магчымасць непасрэднага вывучэння буйнамаштабных паводніцкіх прыярытэтаў у большай колькасці абласцей, чым проста мова», — растлумачыў OpenAI у блог (адкрываецца ў новай укладцы).

«Хоць мы толькі эксперыментуем у Minecraft, гульня вельмі адкрытая, а родны чалавечы інтэрфейс (мыш і клавіятура) вельмі агульны, таму мы лічым, што нашы вынікі спрыяюць іншым падобным даменам, напрыклад, для выкарыстання кампутара».

Каб стымуляваць далейшыя эксперыменты ў прасторы, OpenAI супрацоўнічае з Конкурс MineRL NeurIPS, перадаючы свае дадзеныя падрадчыка і код мадэлі ўдзельнікам, якія спрабуюць выкарыстоўваць ІІ для вырашэння складаных задач Minecraft. Галоўны прыз: 100,000 XNUMX долараў.

крыніца

папярэдняе паведамленне

наступнае паведамленне

Keep Calm and Stay Smart

21:00

Наша каманда прафесійна тэстуе сотні праграмнага забеспячэння, паслуг і бізнес-стратэгій кожны год з дапамогай нашых уласных кансультантаў і групы бізнес-лідэраў.

Мы строга выбіраем рашэнні толькі з самым высокім суадносінамі выдаткаў і выгад, якія простыя ў выкарыстанні, якія годна інтэгруюцца ў любы тып арганізацыі і якія ўключаюць вядучыя функцыі, якія гарантуюць вам заставацца на вяршыні свайго бізнес-сектара.

ІІ зараз можа гуляць у Minecraft гэтак жа добра, як і вы - вось чаму гэта важна

Абавязковае праграмнае забеспячэнне ў 2024 годзе

Лепшыя катэгорыі

Апошнія водгукі

Відэа-тызер Samsung Galaxy Z Flip 5, напярэдадні мерапрыемства Galaxy Unpacked, дэманструецца новы дызайн завес, варыянты колеру

Twitter абмяжоўвае колькасць DM, якія могуць адпраўляць неправераныя карыстальнікі

Мой любімы тэлефон Android можа рабіць тое, чаго не можа мой iPhone 14 Pro Max

ChatGPT для Android запускаецца на наступным тыдні, і вы можаце папярэдне зарэгістравацца зараз

Xiaomi Smart TV 32A, Smart TV 40A, Smart TV 43A з Google TV, калонкі магутнасцю 20 Вт прадстаўлены ў Індыі: цана, тэхнічныя характарыстыкі

Гэтая ядомая батарэя магла б стаць крыніцай энергіі ў свеце дыягностыкі і ўстойлівай энергетыкі