Úgy gondolkodik, akár egy ember, a DeepMind legújabb mesterséges intelligenciája

2021 / 01 / 03 / Felkai Ádám
Úgy gondolkodik, akár egy ember, a DeepMind legújabb mesterséges intelligenciája
A MuZero nevű mesterséges intelligencia abban előrelépés, hogy nem kell ismernie a szabályokat ahhoz, hogy nyerjen egy játékban. Ennek jelentősége óriási: ez az első lépés egy minden szituációban helytálló algoritmus felé.

A 2015-ben alapított Alphabet Inc. egy amerikai multinacionális ernyővállalat, amely a Google és a valamikor a Google-hoz tartozó cégek anyavállalata. Az Alphabet egyik leányvállalata, a mesterséges intelligencia kutatásra fókuszáló DeepMind AlphaGo nevű mesterséges intelligenciája 2015-ben előnykő nélkül legyőzte a legjobb go-játékosokat. Ez azért volt akkor nagy szó, mert a 2500 éves Go a sakknál is komplikáltabb, és az AlphaGo előtt egy algoritmusnak sem sikerült ez a bravúr. Egy évvel az AlphaGo után a vállalat az AlphaGo Zero algoritmussal rukkolt elő. A sima és a Zero változat közti különbség, hogy míg az előbbi amatőr és profi játékosok megfigyelése által sajátította el a játékot, a Zero úgy tanult meg játszani, hogy saját magával folytatott le meccseket. Az AlphaGo Zero-t az Alpha Zero követte, amely a Go-n kívül helyt állt a sakkban és a sógiban is. Ezek az algoritmusok pedig bár egyre fejlettebb voltak, egy dolog közös volt bennünk: mind ismerték a játék szabályait még a tanulószakasz előtt.

Az esszenciális különbség tehát a DeepMind legutóbbi MI-je, a MuZero és az előbb felsorolt algoritmusok között, hogy a MuZero anélkül tud nyerni a sakkban, sógiban és egy csomó Atari videójátékban, hogy előzőleg ismerné az adott játék szabályait. Ám ennek ellenére így is helyt áll (adott esetben sokkal jobban) ezekben a játékokban, mint a DeepMind korábbi intelligenciái.

Ez azért jelent áttörést, mert a hasonló, adaptív algoritmusok fejlesztése, melyek nem ismerik a szabályokat egy-egy helyzetben, de így is sikert tudnak elérni, komoly kihívást jelentett eddig a kutatóknak. Pedig a legtöbb valóságos helyzet, sőt néhány játék sem írható le mindössze pár egyszerű szabállyal. Néhány terület pedig annyira összetett, hogy képtelenség lemodellezni minden aspektusát. És itt nem is olyan dolgokra kell gondolni feltétlenül, mint vezetni egy valós, városi forgalomban biciklisek és gyalogosok között, már néhány ősrégi Atari videójáték esetén is épp ez a helyzet.

A MuZero a problémát úgy hidalja át, hogy úgy kezd el „gondolkodni”, mint mi, emberek. Tehát ahelyett, hogy mindent lemodellezne, csak azokat a tényezőket igyekszik figyelembe venni, melyek a döntéshozatalhoz szükségesek. A DeepMind azt a példát hozza, hogy ha az ablakon kitekintve esőfelhőket látunk, mi sem állunk neki a páratartalmat vagy a nyomást számolgatni, hanem az érdekel minket, hogy hogyan öltözzünk fel, ha nem akarunk odakint elázni. A MuZero három szempontot vesz figyelembe, amikor döntést kell hoznia: az előző döntésének a végkimenetelét, a jelenlegi helyzetét, és lehető legkedvezőbb helyzethez vezető következő döntést. Ezzel a megközelítéssel a MuZero a vállalat eddigi leghatékonyabb mesterséges intelligenciája: a tesztelés folyamán épp olyan sikeres volt sakkban, Go-ban és sógiban, mint az AlphaZero, és az összes előző intelligenciánál jobb az Atari játékokban. Az is kiderült, hogy minél több „gondolkodási időt” kap az algoritmus (minél hosszabb idő áll a rendelkezésére egy-egy döntés meghozatalához), annál jobban teljesít. Sőt a Ms Pac-Man esetén kipróbálták azt is, hogy a MuZero csak limitált számú szimulációt futtathat le, de a mesterséges intelligencia így is jó eredményeket ért el.

A MuZero teljesítményének horderejét az adja, hogy ez az első lépés egy általános felhasználású, tehát az emberhez hasonlóan bármiféle szituációban helyt álló mesterséges intelligencia kifejlesztése felé vezető úton.

(Címlapkép/nyitókép: Pixabay)

További cikkek a Rakétán:

Paradigmaváltás a robotikában, a MELA lehet az első önfejlesztő, egyre intelligensebbé váló MI A Mesterséges Intelligenciának nincs motivációja sem arra nincs hogy bennünket bántson, sem arra hogy egyáltalán életben maradjon, az életösztön, a fejlődés, tökéletesedés iránti igény mélyen emberi -volt eddig. Most ugyanis egy gép olyasmit tett, amire senki nem kérte meg, vagy programozta be. Talán nem ártana kideríteni, hogy miért, és hogyan csinálta.

Ma még 'csak' sejtnövekedést jelez, idővel rákot diagnosztizálhat és új gyógyszert fejleszthet A gépi tanulásra, illetve a mesterséges intelligenciára gondolunk, ami manapság olyan, akár az elektromos áram: mindenhol jelen van, és mindent megváltoztat. Alkalmazásával most éppen a rákkutatásban történt, illetve történik számottevő előrelépés.

Nézegessünk városokat, embereket és autókat, melyek nem léteznek, csak az MI hozta őket létre! Sosem létezett autók, emberek, akik meg sem születtek, véletlenszerűen generált bogarak. A mesterséges intelligencia összerak bármit: a cikkben közölt linkeken bepillanthatunk egy univerzumba, amely csak digitálisan létezik.


Hello Szülő! Ha a gyereked nem tud valamit, akkor téged fog kérdezni. De ha te szülőként nem tudsz valamit, akkor kihez fordulsz?
A digitális kor szülői kihívásairól is találhattok szakértői tippeket, tanácsokat, interjúkat, podcastokat a Telekom családokat segítő platformján, a https://helloszulo.hu/ oldalon.
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Repül már a vén diák. Hová? Hová?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.