AlphaZero - dotyk s hlbinou

V poslednom čase sa to (zas) stáva témou - umelá inteligencia a jej hrozby. Napríklad aj známy milionár Elon Musk, okrem iného aj výrobca samostatne jazdiacich vozidiel Tesla, varuje pred "apokalypsou z umelej inteligencie", a aj decembrový Zem&Vek má názov "Ohrozenie umelelou inteligenciou". To sa pravidelne opakuje, tieto témy, ale dnes som narazil na prípad, ktorý je naozaj zaujímavý. Volá sa AlphaZero.

Je vcelku známe, že v rokoch 1996/1997 prvý krát v histórii porazil šachový program vtedajšieho majstra sveta v šachu (Garry Kasparov). Bol to systém od IBM Deep Blue. Ten si okrem množstva dát o hraných partiách, teórií koncoviek a zahájení vyžadoval aj riadne množstvo bežného programovania. Program bol výsledkom desaťročí vývoja mnohých ľudských expertov. Bol to určitý historický zlom, ale došlo k nemu postupne a nepresvedčivo.

Neskôr sa stali veľmajstrovské šachové programy relatívne bežné. Usporiadavajú sa medzi nimi majstrovstvá sveta. V roku 2016 sa napríklad majstrom medzi "strojmi" hrajúcimi šach stal program Stockfish 8. 

Pozornosť odborníkov sa medzičasom zamerala na hru Go. Tá síce má jednoduché kamene a pravidlá, ale je evidentne algoritmicky ťažšie zachytiteľná a tak v nej človek stále vyhrával. Pre Go vyvinula firma DeepMind (založená roku 2010, kúpená Googlom v roku 2014, sídlo Londýn) program nazvaný AlphaGo a ten v roku 2016 porazil najlepšieho hráča Go (Lee Sedol). Potiaľ dobre, postupný vývoj, postupne hromadená hrubá sila zas prevážila.

Tento rok (2017) ale prišla DeepMind s novou verziou systému nazvanou  AlphaGo Zero, ktorý nemá dáta z ľudských hier, začína takpovediac na nule (zero) a učí sa sám, iba hraním sám so sebou.  Ako píšu, po troch dní učenia porazil verziu AlphaGo Lee, do 21 dní dosiahol úroveň verzie AlphaGo Master a do 40 dní prekonal všetky predošlé verzie.

 

Teraz v decembri bol predstavený nový všeobecne orientovaný systém AlphaZero. Ten, opakujem, dostal k dispozícii iba pravidlá hry a hraním sám so sebou sa za púhych 24 hodín naočil ako hru Go, tak šach a shogi (japonský šach) a presvedčivo porazil vedúce počitačové programy v daných hrách. V šachu zohral 100 partíí so spomínaným Stockfish 8, pričom dosiahol 28 víťazstiev, 72 remíz a 0 prehier. Šokujúci dominantný výsledok.

Len si to zvážme: AlphaZero vyšiel doslovne z nula vedomosti šachu (okrem pravidiel, samozrejme) a za udávané púhe 4 hodiny zvládol to, čo celé generácie ľudstva  a desaťročia komputerového priemyslu pred ním. To je doslovne dychberúce.

AlphaZero je (podľa informácii) založený na neurónálnych sietiach, čo je ale dnes len asi taká informácia, ako že voda tečie smerom nadol. AlphaZero pritom nie je špecializovaný na šach, ani nie na hry ako také, ale možno povedať, že je všeobecný. Jeden zo zakladatelov a šéfov firmy DeepMind, Demis Hassabis (sám v detstve výborný šachista) o ňom hovoril minulý štvrtok na konferencii Neural Information Processing Systems (NIPS) v Kalifornii. Spomína tam ešte, že systém používa  reinforcment learning, ale o tom, ako to vlastne naozaj funguje, sa prirodzene moc nedozvieme. Vie to vlastne niekto? 

Pre zachytenie atmosféry, tu je komentovaná  jedná partia zo súboja AlphaZero versus  Stockfish. Nevadí, ak aj človek šachu moc nerozumie, ani ja nie som žiaden šachista -konieckoncov, tomuto nerozumie už žiaden človek naozaj - aj tak je to zaujímavé, je to proste taká symbolická pekná možnosť, ako prísť do kontaktu s touto hlbinou. Parafráza na známy vtip: "Aby sme vedeli, do čoho ideme ". Mám len ja dojem, že v hlase toho komentujúceho analytika počuť občas potlačený strach? 

 

Umelá inteligencia spadá pod fokus armády. Hlavne Google je spojený s armádnym výskumom Darpa a aj preto skupuje všetko na svete, čo naozaj niečo inovačné prináša. Najradšej by to síce vyvíjali vojaci utajene a sami, ale tak to nefunguje, kvoli svojmu počtu a rozdieľnosti majú (oficiálne) civilné firmy väčšiu šancu urobiť prielom a aj ho robia. Preto sa tieto prielomové udalosti dejú viacmenej verejne, ale buďme si istí, že vzápätí tieto technológie zmiznú vo vojenských výskumákoch. Systém, ktorý za pár hodín neznámym spôsobom doslovne zlomil šach chcú vojensko-politickí psychopati vypustit na vyhratie ich geopolitických hier. Už sa tešíte?

Už spomínaný výrazný spoluator tejto prelomovej udalosti, Demis Hassabis (otec cyperský Grék, matka singapúrska Číňanka) v minulosti vytvoril hru s názvom Evil Genius (Zločinný génius), v ktorej zlomyseľný vedec vytvorí fatálny prístroj na ovládnutie sveta.  V tomto článku sa spomína, že pri minuloročnom (2016) decembrovom stretnutí, ktorého sa okrem iných zúčastnil Hassabis, Musk ale aj vtedy novozvolený prezident Trump, jeden investor z DeepMind žartoval, že mal Hassabisa zabiť na mieste, kým bola príležitosť - a tak zachrániť ľudstvo. Nuž... ktovie.

demis hassabis

Demis Hassabis 

 

Z dostupných správ nie je celkom jasné, kedy presne k súboju programov došlo, ale bolo to zverejnené čerstvo minulý týždeň 5. decembra 2017 v tomto vedeckom článku publikovanom firmou DeepMind.

 

Ale pociťujem pri týchto udalostiach aj niečo, ako keď sa po dlhom ponore človek môže zas nadýchnuť čerstvého vzduchu. Ľudstvo ešte naozaj žije.  Za prvé si trúfam povedať, že výhra systému AlphaZero nad svojimi protivníkmi možno prirovnať k podobnému mílniku ľudstva, ako výstup človeka na mesiac. Aj keď o tom zatiaľ toľko nepočuť, je to (možno) podobný úspech.

A okrem toho, že sme túto unikátnu prelomovú entitu vytvorili my, hm... my ako ľudstvo, je si treba pripomenúť, že je postavená na princípoch neuronálnych sietí - teda skopírovaná z technológie, na ktorej sme vybudovaní aj my. To je predsa povzbudivé a dôkaz aj našej kvality, nie? :)

Ďaľším pozoruhodným estetickým prínosom tejto udalosti je to, že táto dominantná AI začala metódou tabula rasa. To človeku dáva určitý pocit správnosti a oprávnenosti cesty spočívajúcej vo vyčistení svojho mentálneho priestoru.

 

 

 

 

 

Neiktoré ďalšie linky

https://gizmodo.com/stunning-ai-breakthrough-takes-us-one-step-closer-to...

https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in...

 

 

Autor: 
téma: 
buheh

...s tým slovom opatrne.

Ja neviem. Nemám ani šajnu o tom, ako to môže fungovať, pre mňa je zázrakom aj obyčajná mašľa na topánke. Ale necháva ma to chladným, vnímam to len ako víťazstvo jednej technológie nad druhou, jednej sústavy matematických rovníc nad inou. Kým sa tie mašinky po veľa generácií nebudú replikovať samy, kým nebudú ich potomkovia sami osídľovať nové priestory a ruvať sa s prírodou a sami so sebou o prežitie v reálnom svete, tak sa na ne pozerám len ako na hračky, ktoré nie sú žiadnou konkurenciou pre živé tvory.

Život je z biologického hľadiska sústava energetických gradientov, akýsi mnohostupňový vodopád roztáčajúci množstvo na seba naväzujúcich koliesok. Vyrobiť umelý život znamená vyrobiť tú sústavu kompletne, od dlhodobého a spoľahlivého zdroja energie (slnečné svetlo?) až po kompletnú recykláciu všetkých medziproduktov a odpadov bezo zvyšku. Inak to nie je život, ale iba polofunkčný model.

Ale ak hovoríme o potenciáli nejakej umelej inteligencie napríklad vyhubiť ľudstvo, tak to dozaista je reálne. Nadšenci, ktorí na tom pracujú, to nepochybne dokážu, držme im palce.

Norman

Pozri, v článku ani v zdrojoch myslím nebol spomínaný život tých AI, a to ani nejak alegoricky. Mám dojem, že to slovo sa používa čoraz menej, ak sa nemusí, lebo je výrazne také teologické - každý si ho nadefinuje, ako sa mu zachce a potom sa melie prázdna slama (ale "energetické gradienty", pekné - až som zaváhal, či môj Dunčo na dvore je vlastne živý, lebo nemá ani žiaden "spoľahlivý zdroj energie"). To by ale bola celkom iná téma, aj keď to je v pláne.

Ale ináč máš pravdu, že tieto AI sú "len" technológia - veď píšem, aj cesta na mesiac bola len technológia, a bez akejkoľvek irónie, v podstate zbytočná, samoúčelná. Ale bol to bezpochyby určitý mílnik, určitý zlom - aj keď len symbolický. Technológia, ako napríklad balistické rakety, riadené strely, rádio, televízia a počítače, olejové malby alebo rôzne tie symfónie (v podstate len technológia spracovania dreva do tvaru nástrojov a kombinácia tónov, teda sústava matematických symbolov), tiež sa väčšine z toho nevenujem a články o tom ma prirodzene nechávajú tiež chladným. Ale ľudia majú rôzne záujmy, to už asi bude jedna z vlastností toho ... života.

buheh

Treba to rozlišovať. Buď stvoríme naozajstný život, alebo je to len technológia, ktorá sama osebe nie je nebezpečná – nebezpečná je len v rukách ľudí, ktorí by ju použili ako zbraň.

A nepochybne je to obdivuhodný výtvor ľudského ducha, isteže.

Ľudstvo už vymyslelo toľko spôsobov ako sa zničiť, prípadne aj spolu s celou planétou (atómové bomby, biologické zbrane, genetická katastrofa a teraz už možno aj tá umelá inteligencia), že už človeku ostáva len spomenúť si na staré príslovie: ak mi je súdená šibenica, neutopím sa.

Norman

Niektoré technológie sú samé o sebe nebezpečné - napríklad oheň môže popáliť, dom môže na človeka spadnúť, dynamit predčasne vybuchnúť a podobne. A to myslím bez irónie. Aj bez zlomyselnosti človeka sú proste niektoré technológie samy o sebe viac nebezpečné, ako iné.

Ale chcel by som ešte narýchlo dovysvetliť nejaké iné veci.
1. Ja som ani nemienil povedať, že je to "odbivuhodný" výkon, ale je to proste "pozoruhodný" výkon, vec hodná zaznamenania. A práve preto, že sa to väčšine ani nemusí zdať, respektíve väčšina ani nezaznamenala, že sa to stalo.

2. Čo sa týka tej témy, že "AI nie je život", tento klasický pseudometafyzický argument, tu by som rád upozornil na jednu vec:
Áno, AI nie je "život", ba ani nemá "vedomie". Lenže zaujímavé tu nie je dokazovať prítomnosť či neprítomnosť tohto "nedostatku" AI, ale zaujímavé je pozrieť sa na vec naopak z druhej strany, bez irónie a srandy. Teda na to, že pre rozmýšlanie živých bytostí, teda aj nás, nie je vôbec potrebná žiadna tá "kaskáda gradientov energií" či bohvie čo. To všeko sú veci, ktoré máme, ktoré život má, vrátanie toho "vedomia" - ale nie je to podstata myslenie, teda nie je to ani naša podstata. Sme proste oveľa -oveľa jednoduchší, ako si o sebe namýšľame (neviem, či som aspoň trocha vyjasnil tento prístup, ale aspoň som ho naznačil).

3. Aj z predošlého vyplýva, že tento nový druh AI nie je zaujímavý sám o sebe, ale skôr v tom, že nám vyjasňuje veci o nás. Napríklad taký objev lokomotívy ľudstvo niekam posunul, nahradil jeho svaly, ale k našim znalostiam o našich svaloch pridal len minimálne. Podobne klasické počítač na jednom procesore (von Neumanova architektúra) posunula ľudstvo niekam, ale naozaj je to od myslenia človeka vzdialené. Ale tieto nové systémy, to je zdá sa niečo iné. Ani nie tak preto, že sú to vraj akosi formálne konštukčne "neurónové siete", ale preto, že sa evidentne NAOZAJ efektívne samy učia. Nie je to teória, je to evidentné - a tak teraz máme možnosť to sledovať a niečo pochopiť, hlavne o nás samých. Bez nejakej poetiky, tak naozaj.
Aj preto je to zaujímavé.

Dusanbe

je to skutočne niečo pozoruhodné, ak si uvedomíme, že ten porazený počítač + program je úplná špička v doterajších šachových programoch, ktoré dlhé roky vyvíjali skupiny naozaj veľmi šikovných ľudí.

Navyše má cca 1 000 krát väčší výpočtový výkon - ak video neklame - t.j. porovnáva naozaj
rovnaký parameter, tak ten nový algoritmus - vlastne ani už neviem, či môžem použiť toto slovo - bežal
na počítači, ktorý spravil za 1 sekundu 1 000 krát menej operácií ako súper, ktorého jasne porazil.
To je veľmi veľký rozdiel.

Nepotreboval mať v pamäti ani jednu zohratú veľmajstrovskú partiu - stačili mu pravidlá a 4-hodiny
prípravy "osamote". Neuveriteľné.
Šikovný chlapík, veľmi šikovný, aj keď na prvý pohľad, taký jednoúčelový, :-)
Ale možno aj nie - uvidíme, určite sa vo svete AI niečo pohlo.

Norman

tie čísla s tým výkonom - to mi pripadá nejako neisté - možno pri tom klasickom systéme vedia, koľko pozícii vyhodnotí za jednotku času, ale pri tomto AlphaZero type to možno nebude rovnako merateľné. Čiže tie čísla by som pre istotu neporovnával, zvlášť keď sú to čísla len z videa. Ale neviem.
Akokoľvek, ak aj nebol nový typ tisícnásobne výkonovo slabší, z informácií sa dá predsa len odhadovať, že nebol ani nejako výkonovo hrubou silou silnejší, ako tie predošlé systémy.

Dusanbe

ďakujem.
A konečne som pochopil, prečo toľko omieľajú tie varovania pred AI.

Nebezpečná nie je žiadna z opisovaných či budúcich technológií sama o sebe.
Počítač je len veľmi chytrý blbec - a tie systémy sú síce schopnosťou učenia o úroveň vyššie než obvyklé bežné algoritmy, ale ešte stále sú to len veľmi chytrí blbci, ktorým ľudskí tvorcovia dali schopnosť učením veľmi rýchlo optimalizovať riešenie daných problémov.
Síce pekné - ale nič viac.

Nebezpečné to ale naozaj bude v rukách tých pošukov, čo už po použití AI a ďaľších kybernetických hračiek slintajú v armáde alebo kontrolovaní a ovládaní spoločnosti.
Sú ich celé húfy, bohužiaľ.

Len si predstavte, že im ku všetkému tomu kybernetickému, počítačovému a komunikačnému haraburdiu čo už majú ako nadstavbu nad klasickými zbraňami na zabíjanie, dáte ešte aj pocit, že s tou ich "umelou inteligenciou" môžu jedine vyhrať.

Toto bude naozaj nebezpečné.

Náhodný okoloidúci

Útechou nám môže byť to, že tá ich AI je zrejme programovaná len na symetrické odpovede, ibaže takí Rusi, proti ktorým je vojenská verzia AI určená, využívajú jednak symetrické, jednak asymetrické odpovede, pričom v tých druhých sú majstri, ako ukázala napríklad odpoveď Turecku na zostrelenie ruskej stíhačky v Sýrii a smrť pilota. Miesto vojenskej odplaty tvrdý nekompromisný útok vo forme sankcií a bojkotu. A Erdogan pochopil, že to bola len demo-verzia skutočnej odplaty a sklopil uši.

Norman

V súlade s tým, čo píšeš, hlavná brzda týchto geopolitických vojenských hier je v tom, že nemajú pre systém dostatok presných dát na to, aby im systém vyhral vojnu. Nemajú dáta o protivníkovi - lebo pri všetkej špionáži aj tak nevedia, čo ten dokáže. A ešte paradoxnejšie: nemajú dáta o sebe, pretože armády vždy klamú seba a svoje vlády v tom, že dokážu aj to, čo ani zďaleka nezvládnu. Uznať si pravdu a svoje slabosti je pre nich nemožné a preto by ich systém pracoval síce presne, ale s nepresnými blbosťami.

Problém je ale to, ako tu píšete obaja, že ani túto brzdu si nedokážu priznať a oni neodolajú ŽIADNEJ novej hračke, aby si ju vyskúšali. Čo najviac naostro.
Každá vec, každá (nová) zbraň, ktorá dávala pocit (aspoň čiastočnej) prevahy, bola vždy neodolateľným pokušením ju použiť.

Teraz nasypú do systémov svoje falošné dáta, potom potrú zrkadlo a spýtajú sa ho:
"Povedz mi zrkadielko, kto je najsilnejší na svete?"
A zrkadlo im povie:
"Ty si najmocnejšia na svete, ty si bohom vyvolený národ na kopci, len tebe je určené vládnuť a bohom prikázané zničiť každé zlo, čo o tom pochybuje. Prečo vlastne bielu Snehuleinku nezavraždíš, viem ti presne poradiť, ako na to".

To povie zrkadlo, pretože problém napodiv nie je v tom, že je príliš inteligentné a vševedúce, ale v tom, že stále nie je dostatočne inteligentné a vševedúce.
A to bude koniec jednej rozprávky.
(o slobode, demokracii, trhu, bohu a podobných onaniách pre idiotov)

Ľubov

https://www.youtube.com/watch?v=f1QAE7DiESc

V poslednej dobe sa o umelej inteligencii hovorí akosi viac,ale dosť často počúvam od insajderov (hej,ja ich občas počúvam:-),asi Ťa to neprekvapuje),že tzv .umelí vojaci už sú,je ich dostatočné množstvo,no proste sú to terminátori,čo si budeme medové motúzy ťahať popod nos,kultivovaný šachmatista,je to síce desivé,ale Arnold sa predáva lepšie.
V konečnom dôsledku človek možno zistí,že ten jediný skutočný zmysel jeho bytia je zem,ktorú treba poorať a zasiať.

Norman
Norman