DeepMind's 'Gato' jẹ mediocre, nitorina kilode ti wọn fi kọ?

deepmind-gato-slash-image-sunmọ-in.png

DeepMind's “Gato” nẹtiwọọki nkankikan bori ni awọn iṣẹ ṣiṣe lọpọlọpọ pẹlu ṣiṣakoso awọn apa roboti ti o to awọn bulọọki, ti ndun awọn ere Atari 2600, ati awọn aworan ifori.


Onigbagbo

A lo agbaye lati rii awọn akọle nipa aṣeyọri tuntun nipasẹ awọn ọna ikẹkọ jinlẹ ti oye atọwọda. Aṣeyọri tuntun ti pipin DeepMind ti Google, sibẹsibẹ, le ṣe akopọ bi, “Eto AI kan ti o ṣe iṣẹ bẹ-bẹ ni ọpọlọpọ awọn nkan.” 

Gato, bi a ti pe eto DeepMind, ti a si ni ose yi bi ohun ti a npe ni multimodal eto, ọkan ti o le mu fidio awọn ere, iwiregbe, kọ akopo, ifori awọn aworan, ati iṣakoso a roboti apa stacking awọn bulọọki. O jẹ nẹtiwọọki nkankikan ti o le ṣiṣẹ pẹlu awọn iru data lọpọlọpọ lati ṣe awọn iṣẹ ṣiṣe lọpọlọpọ. 

"Pẹlu eto kan ti awọn iwuwo, Gato le ṣe ibaraẹnisọrọ ni ijiroro, awọn aworan ifori, awọn bulọọki akopọ pẹlu apa robot gidi kan, ju eniyan lọ ni ṣiṣere awọn ere Atari, lilö kiri ni awọn agbegbe 3D ti a ṣe afiwe, tẹle awọn ilana, ati diẹ sii,” onkọwe oludari Scott Reed ati awọn ẹlẹgbẹ ninu iwe wọn, “Aṣoju Gbogbogbo kan,” Pipa lori Arxiv preprint olupin

Oludasile DeepMind Demis Hassabis yọ fun ẹgbẹ naa, exclaiming ni a tweet, “Aṣoju gbogbogbo wa sibẹsibẹ!! Iṣẹ ikọja lati ọdọ ẹgbẹ! ” 

tun: Idanwo tuntun: Njẹ AI mọ awọn ologbo tabi awọn aja gaan - tabi ohunkohun?

Awọn nikan apeja ni wipe Gato kosi ko ki nla lori orisirisi awọn iṣẹ-ṣiṣe. 

Ni ọwọ kan, eto naa ni anfani lati ṣe dara julọ ju eto ikẹkọ ẹrọ iyasọtọ ni ṣiṣakoso apa Sawyer roboti ti o di awọn bulọọki. Ni apa keji, o ṣe agbejade awọn akọle fun awọn aworan ti o ni ọpọlọpọ awọn ọran ko dara pupọ. Agbara rẹ ni ibaraẹnisọrọ iwiregbe boṣewa pẹlu olutọpa eniyan jẹ agbedemeji bakanna, nigbakan nfa awọn ọrọ ilodi ati awọn ọrọ isọkusọ. 

Ati ṣiṣere rẹ ti awọn ere fidio Atari 2600 ṣubu ni isalẹ ti awọn eto ML ti a ṣe iyasọtọ ti a ṣe apẹrẹ lati dije ni ala-ilẹ Olobiri Learning Ayika

Kini idi ti iwọ yoo ṣe eto ti o ṣe diẹ ninu awọn nkan lẹwa daradara ati opo awọn ohun miiran ko dara daradara? Precedent, ati ireti, ni ibamu si awọn onkọwe. 

Iṣaaju wa fun awọn iru awọn eto gbogbogbo diẹ sii di ipo ti aworan ni AI, ati pe ireti wa pe jijẹ awọn oye ti agbara iširo yoo ni ọjọ iwaju ṣe fun awọn aito. 

Gbogboogbo le ṣọ lati bori ni AI. Gẹgẹbi awọn onkọwe ṣe akiyesi, n tọka si ọmọwe AI Richard Sutton, “Ni itan-akọọlẹ, awọn awoṣe jeneriki ti o dara julọ ni iṣiro iṣiro ti tun nifẹ lati bori awọn isunmọ-ipa-pato pataki diẹ sii nikẹhin.”

Bi Sutton kowe ninu ara rẹ bulọọgi post, "Ẹkọ ti o tobi julo ti a le ka lati awọn ọdun 70 ti iwadi AI ni pe awọn ọna gbogbogbo ti o ṣe iṣiro iṣiro jẹ ti o munadoko julọ, ati nipasẹ ala ti o tobi."

Fi sinu iwe afọwọkọ ilana, Reed ati ẹgbẹ kọwe pe “a nibi idanwo idawọle pe ikẹkọ oluranlowo eyiti o lagbara ni gbogbogbo lori nọmba nla ti awọn iṣẹ ṣiṣe ṣee ṣe; ati pe aṣoju gbogbogbo yii le ṣe deede pẹlu data afikun diẹ lati ṣaṣeyọri ni nọmba awọn iṣẹ ṣiṣe paapaa ti o tobi julọ.”

tun: Meta's AI luminary LeCun ṣawari aala agbara ti ẹkọ ti o jinlẹ

Awoṣe, ninu ọran yii, jẹ, nitootọ, gbogbogbo. O jẹ ẹya ti Amunawa, iru pataki ti awoṣe ti o da lori akiyesi ti o ti di ipilẹ ti awọn eto lọpọlọpọ pẹlu GPT-3. Oluyipada kan ṣe apẹẹrẹ iṣeeṣe ti diẹ ninu awọn eroja ti a fun ni awọn eroja ti o yika gẹgẹbi awọn ọrọ ninu gbolohun ọrọ kan. 

Ninu ọran ti Gato, awọn onimọ-jinlẹ DeepMind ni anfani lati lo wiwa iṣeeṣe ipo kanna lori awọn iru data lọpọlọpọ. 

Bi Reed ati awọn ẹlẹgbẹ ṣe apejuwe iṣẹ-ṣiṣe ti ikẹkọ Gato, 

Lakoko ipele ikẹkọ ti Gato, data lati oriṣiriṣi awọn iṣẹ-ṣiṣe ati awọn ọna ṣiṣe ti wa ni lẹsẹsẹ sinu ọna alapin ti awọn ami ami, ti a ṣeto, ati ni ilọsiwaju nipasẹ nẹtiwọọki nkankikan ti oluyipada ti o jọra si awoṣe ede nla kan. Ipadanu naa jẹ boju-boju ki Gato nikan ṣe asọtẹlẹ iṣe ati awọn ibi-afẹde ọrọ.

Gato, ni awọn ọrọ miiran, ko tọju awọn ami iyasọtọ yatọ boya wọn jẹ awọn ọrọ ninu iwiregbe tabi awọn adaṣe gbigbe ni adaṣe-packing. O jẹ kanna. 

jin-bi o-gato-ni-oṣiṣẹ.png

Gato ikẹkọ ohn.


Reed et al. 2022

Sin laarin Reed ati egbe ká ilewq ni a corollary, eyun ti siwaju ati siwaju sii iširo agbara yoo win, bajẹ-. Ni bayi, Gato ni opin nipasẹ akoko idahun ti apa robot Sawyer ti o ṣe akopọ idina. Ni awọn aye nẹtiwọọki bilionu 1.18, Gato kere pupọ ju awọn awoṣe AI ti o tobi pupọ bii GPT-3. Bi awọn awoṣe ikẹkọ ti o jinlẹ ti n pọ si, ṣiṣe inference nyorisi lairi ti o le kuna ni agbaye ti kii ṣe ipinnu ti roboti gidi-aye kan. 

Ṣugbọn, Reed ati awọn ẹlẹgbẹ n reti pe iye to lati kọja bi ohun elo AI ti nyara ni iyara ni sisẹ.

"A ṣe idojukọ ikẹkọ wa ni aaye iṣẹ ti iwọn awoṣe ti o fun laaye iṣakoso akoko gidi ti awọn roboti gidi-aye, lọwọlọwọ ni ayika awọn ipele 1.2B ninu ọran ti Gato," wọn kọwe. “Bi ohun elo ohun elo ati awọn ayaworan awoṣe ṣe ilọsiwaju, aaye iṣẹ ṣiṣe yoo nipa ti ara pọ si iwọn awoṣe ti o ṣeeṣe, titari awọn awoṣe gbogbogbo ti o ga julọ ti ilana igbelosoke.”

Nitorinaa, Gato jẹ awoṣe gaan fun bii iwọn iṣiro yoo ṣe tẹsiwaju lati jẹ fekito akọkọ ti idagbasoke ikẹkọ ẹrọ, nipa ṣiṣe awọn awoṣe gbogbogbo tobi ati tobi. Tobi jẹ dara julọ, ni awọn ọrọ miiran. 

deepmind-n-dara-with-scale.png

Gato n dara si bi iwọn ti nẹtiwọọki nkankikan ni awọn aye ti n pọ si.


Reed et al. 2022

Ati awọn onkọwe ni diẹ ninu awọn ẹri fun eyi. Gato dabi ẹni pe o dara julọ bi o ti n pọ si. Wọn ṣe afiwe awọn ikun aropin kọja gbogbo awọn iṣẹ ṣiṣe ala-ilẹ fun awọn iwọn mẹta ti awoṣe ni ibamu si awọn ayeraye, 79 million, 364 million, ati awoṣe akọkọ, 1.18 bilionu. "A le rii pe fun iye ami ami deede, ilọsiwaju iṣẹ ṣiṣe pataki kan wa pẹlu iwọn ti o pọ si,” awọn onkọwe kọ. 

Ibeere iwaju ti o nifẹ si ni boya eto kan ti o jẹ alamọdaju jẹ eewu diẹ sii ju awọn iru awọn eto AI miiran lọ. Awọn onkọwe lo akoko pupọ ninu iwe ti n jiroro ni otitọ pe awọn ewu ti o pọju wa ti a ko ti loye daradara.  

Ero ti eto kan ti o mu awọn iṣẹ-ṣiṣe lọpọlọpọ ṣe imọran fun alabaṣepọ iru aṣamubadọgba eniyan, ṣugbọn iyẹn le jẹ aiṣedeede ti o lewu. "Fun apẹẹrẹ, irisi ti ara le ja si awọn olumulo anthropomorphizing aṣoju, ti o yori si igbẹkẹle aiṣedeede ninu ọran ti eto aiṣedeede, tabi jẹ ilokulo nipasẹ awọn oṣere buburu,” Reed ati ẹgbẹ kọ. 

Ni afikun, lakoko ti gbigbe imọ-agbelebu nigbagbogbo jẹ ibi-afẹde ninu iwadii ML, o le ṣẹda awọn abajade airotẹlẹ ati aifẹ ti awọn ihuwasi kan (fun apẹẹrẹ ija ere arcade) ti gbe lọ si ipo ti ko tọ.”

Nitorinaa, wọn kọwe, “Awọn ilana iṣe ati awọn ero aabo ti gbigbe imọ le nilo iwadii tuntun ti o ni idaran bi awọn eto gbogbogbo gbogbogbo.”

(Gẹgẹbi akọsilẹ ẹgbẹ ti o nifẹ si, iwe Gato naa nlo ero kan lati ṣapejuwe eewu ti oluṣewadii Google AI atijọ Margaret Michell ati awọn ẹlẹgbẹ rẹ ṣe, ti a pe ni Awọn kaadi awoṣe. Awọn kaadi awoṣe funni ni ṣoki ṣoki ti kini eto AI jẹ, kini o ṣe, ati kini Awọn nkan ti o kan bi o ṣe n ṣiṣẹ. Michell kowe ni ọdun to kọja pe o fi agbara mu lati Google fun atilẹyin ẹlẹgbẹ ẹlẹgbẹ rẹ tẹlẹ, Timnit Gebru, ẹniti awọn ifiyesi ihuwasi rẹ lori AI ṣaṣeyọri ti itọsọna AI Google.)

Gato ni ọna kan ko jẹ alailẹgbẹ ni ifarahan gbogbogbo rẹ. O jẹ apakan ti aṣa gbooro si gbogbogbo, ati awọn awoṣe nla ti o lo awọn buckets ti agbara ẹṣin. Aye ni itọwo akọkọ ti itọsi Google ni itọsọna yii ni igba ooru to kọja, pẹlu nẹtiwọọki “Perceiver” Google ti o ṣajọpọ awọn iṣẹ-ṣiṣe Transformer ọrọ pẹlu awọn aworan, ohun, ati awọn ipoidojuko aaye LiDAR.

tun: Supermodel Google: DeepMind Perceiver jẹ igbesẹ kan ni opopona si ẹrọ AI ti o le ṣe ilana ohunkohun ati ohun gbogbo

Lara awọn ẹlẹgbẹ rẹ ni PaLM, Awoṣe Ede Awọn ipa ọna, ti a ṣe ni ọdun yii nipasẹ awọn onimọ-jinlẹ Google, awoṣe paramita 540-bilionu kan ti o lo imọ-ẹrọ tuntun fun ṣiṣakoṣo awọn ẹgbẹẹgbẹrun awọn eerun igi, mọ bi Awọn ọna, tun ṣe ni Google. Nẹtiwọọki neural ti a tu silẹ ni Oṣu Kini nipasẹ Meta, ti a pe ni “data2vec,” nlo Awọn Ayirapada fun data aworan, awọn igbi ohun afetigbọ ọrọ, ati awọn aṣoju ede ọrọ gbogbo ni ẹyọkan. 

Kini tuntun nipa Gato, yoo dabi, ni ero lati mu AI ti a lo fun awọn iṣẹ ṣiṣe ti kii ṣe roboti ati titari si agbegbe awọn roboti.

Awọn olupilẹṣẹ Gato, ṣe akiyesi awọn aṣeyọri ti Awọn ipa ọna, ati awọn isunmọ gbogbogbo gbogbogbo, wo aṣeyọri ti o ga julọ ni AI ti o le ṣiṣẹ ni agbaye gidi, pẹlu awọn iṣẹ ṣiṣe eyikeyi. 

"Iṣẹ iwaju yẹ ki o ronu bi o ṣe le ṣọkan awọn agbara ọrọ wọnyi sinu aṣoju gbogbogbo ni kikun ti o tun le ṣiṣẹ ni akoko gidi ni agbaye gidi, ni awọn agbegbe ati awọn ilana.” 

O le, lẹhinna, ro Gato gẹgẹbi igbesẹ pataki lori ọna lati yanju iṣoro AI ti o nira julọ, awọn roboti. 



orisun