AI překonala šachy a Go, ale snaží se najít diamant v Minecraftu
Nová výzva testuje schopnost AI učit se sledováním
Internet explorer 6

Ať už se učíme vařit omeletu nebo řídit auto, cesta k osvojení nových dovedností často začíná sledováním ostatních. Může se však umělá inteligence učit stejným způsobem? Nová výzva naučit agenty AI hrátMinecraftnaznačuje, že je to pro počítače mnohem složitější.
Oznámeno začátkem tohoto roku,MineRL soutěžpožádal týmy vědců, aby vytvořili AI roboty, které by mohly úspěšně těžit diamantMinecraft. To není nemožný úkol, ale vyžaduje zvládnutí základních her. Hráči potřebují vědět, jak kácet stromy, vyrábět krumpáče a prozkoumávat podzemní jeskyně a přitom se vyhýbat příšerám a lávě. Toto jsou druhy dovedností, které si většina dospělých může osvojit po několika hodinách experimentování nebo se naučit mnohem rychleji sledováním výukových programů na YouTube.
Ale z 660 přihlášených do soutěže MineRL nebyl žádný schopen výzvu dokončit, podle výsledků, které budou oznámeny na konferenci AI NeurIPS a které byly poprvé hlášeny BBC novinky .Ačkoli roboti bylischopný se učitzprostředkující kroky, jako je konstrukce pece na výrobu trvanlivých krumpáčů, nikdo úspěšně nenašel diamant.
Úkol, který jsme položili, je velmi tvrdý, řekla Katja Hofmann, hlavní výzkumná pracovnice společnosti Microsoft Research, která pomohla s organizací výzvyBBC novinky. I když žádný předložený agent úkol zcela nevyřešil, dosáhli velkého pokroku a naučili se vyrábět mnoho potřebných nástrojů.

To může být překvapení, zvláště když si myslíte, že umělá inteligence dokázala ve hrách, jako jsou šachy, Go aDota 2.Odráží to však důležitá omezení technologie i omezení zavedená soudci společnosti MineRL, aby týmy skutečně napadly.
Boti v MineRL se museli učit pomocí kombinace metod známých jako napodobování učení a posilování učení. Při napodobování učení se agentům zobrazují data úkolu před nimi a snaží se je napodobit. Při posilování učení se jednoduše dostanou do virtuálního světa a nechají si to vyřešit pomocí pokusů a omylů.
AI je často schopna čelit velkým výzvám pouze kombinací těchto dvou metod. Například slavný systém AlphaGo se nejprve naučil hrát Go získáváním dat ze starých her. Poté zdokonaloval své schopnosti - a předčil všechny lidi - tím, že si hrál znovu a znovu.
pikmin
Roboti MineRL zaujali podobný přístup, ale zdroje, které měli k dispozici, byly poměrně omezené. Zatímco agenti AI, jako je AlphaGo, jsou vytvářeni s obrovskými datovými sadami, výkonným počítačovým hardwarem a ekvivalentem desetiletí tréninkového času, roboti MineRL si museli vystačit s pouhými 1 000 hodinami zaznamenané hry, ze kterých se mohli učit, jediným grafickým procesorem Nvidia, se kterým se mohli trénovat a jen čtyři dny, než se rozběhnete.
Je to rozdíl mezi zdroji, které má tým MLB k dispozici - trenéři, odborníci na výživu, nejlepší vybavení, které si peníze mohou koupit - a tím, s čím si musí tým Malé ligy vystačit.
Může se zdát nespravedlivé tímto způsobem ochromovat roboty MineRL, ale tato omezení odrážejí výzvy integrace AI do reálného světa. Zatímco roboti jako AlphaGo jistě posouvají hranice toho, čeho může AI dosáhnout, jen velmi málo společností a výzkumných laboratoří se může vyrovnat se zdroji DeepMindu, který vlastní Google.
Řekl to hlavní organizátor soutěže, doktorand Carnegie Mellon University William GussBBC novinkyže úkol měl ukázat, že ne každý problém AI by měl být vyřešen vrháním výpočetní síly na něj. Toto myšlení, řekl Guss, pracuje přímo proti demokratizaci přístupu k těmto posilovacím systémům učení a ponechává schopnost trénovat agenty ve složitých prostředích společnostem se spoustou výpočtů.
Takže zatímco se AI může potýkatMinecraftteď, když to prolomí tuto výzvu, snad to přinese výhody širšímu publiku. Jen nemysli na ty chudéMinecraftYouTubers, kteří možná nemají práci.