AI Je Samostalno Naučio Igrati šah Na Nadljudskoj Razini U Jednom Danu - Alternativni Prikaz

Video: AI Je Samostalno Naučio Igrati šah Na Nadljudskoj Razini U Jednom Danu - Alternativni Prikaz

Video: СПИННЕР ТРОЛЛИНГ! 2024, Studeni

2024 Autor: Keith Bush | [email protected]. Zadnja promjena: 2023-12-16 14:21

Algoritam AlphaZero, bez ljudskog učitelja, savladao je šah i igru shogija u 24 sata, tako da je pobijedio ostale programe prvaka koji su prethodno bezuvjetno pobijedili ljude.

Deep Mind, tvrtka koja razvija algoritme za umjetnu inteligenciju (AI), objavila je podatke o rezultatima prekvalifikacije algoritma AlphaGo za igranje šaha i shogija. Prije toga, AlphaGo je uspio pobijediti svjetske prvake u igri golova. Umjetna inteligencija uspjela je još brže ovladati novim igrama. Odgovarajuće djelo objavljeno je na poslužitelju pretprintača Cornell University.

AlphaZero je koristio metodu učenja ojačanja. To je podvrsta dubokog strojnog učenja koja ne koristi ljudskog učitelja, već isključivo igre između dva AI-ja. Iako u početku obje AI igraju vrlo slabo, zbog svoje velike brzine (u usporedbi s učiteljem o ljudima) mogu u kratkom vremenu igrati ogroman broj igara i na određenim pozicijama na ploči odabrati dobro provjerene poteze i njihove sekvence, što daje sposobnost algoritama da vrlo brzo povećaju svoju razinu.

U ovom slučaju AlphaZero je za samo 24 sata postigao razinu igre višu od bilo kojeg ljudskog igrača. Tada joj je bilo dopušteno da igra sa Stockfishom, najboljim raspoloživim šahistom, i Elmom, najboljim shogi igračem (visoko modificirani šah u rano srednjovjekovnom Japanu).

Unatoč vrlo kratkom treningu, AlphaZero je 28 puta pobijedio Stockfish i izvukao 72 puta. Uspjela je 90 puta pobijediti protiv Elmoa, 8 puta izgubiti i izvući 2 puta. Ovo su izuzetno visoki rezultati. I šah i shogi vrlo se razlikuju od pokreta za koji je AlphaGo izvorno stvoren, kao i od jednih od drugih. Na primjer, "japanski šah" podrazumijeva krajnje egzotične mogućnosti, poput igranja bilo kojeg od "pojedenih" komada neprijatelja. Pobjeda algoritma stvorenog za Go samo igranjem s potpuno identičnim vlastitim algoritmom koje ljudski učitelj može postići

IVAN ORTEGA