A Google anyacégéhez, az Alphabethez tartozó DeepMind egy olyan, "általános felhasználású" mesterséges intelligenciát (MI) mutatott be, amely egészen pontosan hatszáznégy különböző feladatot képes ellátni. A Gato fontos lépés lehet az általános mesterséges intelligenciák fejlődésében.
"A nagy mintákkal dolgozó nyelvi rendszerek ihlettek minket arra, hogy hasonló megközelítést alkalmazzunk egyetlen általános ügynök (ágens) megépítésekor, amely a szöveges kimeneten kívül másra is képes"
– fogalmaz a DeepMind blogbejegyzése. "Ugyanaz a neurális hálózat tud Atari játékokkal játszani, képaláírásokat készíteni, csetelni, vagy egy robot kézzel kockákat egymásra rakni. A kontextus alapján dönti el, hogy szöveget bocsásson ki, ízületeket mozgasson, gombokat nyomjon vagy mást csináljon."
A TechCrunch cikkében kiemelik: az ilyen, általános MI rendszerek régóta dédelgetett álmai az iparágnak és a sci-fi íróknak, hiszen ezek sokkal közelebb állnak az emberi intelligencia működéséhez, mint az egy-egy célra fejlesztett rendszerek. A lapnak nyilatkozó szakértő, Jack Hessel ugyanakkor aláhúzza, hogy eddig is léteztek olyan MI-k, amelyek különböző feladatokat voltak képesek ellátni, a Google MUM-járól korábban röviden írtunk is a Rakétán. Ami a Gato sajátossága, hogy rendkívül sokféle az a tevékenység, amelyre képes. Hessel szerint továbbá az is lényeges előrelépés, hogy nem különálló képességek vannak egy csokorba gyűjtve, vagyis nem annyi történik, hogy a rendszer először eldönti, hogy az adott helyzetnek melyik képessége felel meg, majd elindítja azt a teljesen önállóan működő tevékenységet. A valóban "izgalmas" eredmény szerinte, ha a különböző működési módokat egyszerre tudjuk használni és fejleszteni.
A cikk szerint a körülbelül hatszáz feladat negyedét a Gato nem oldja meg kifejezetten jól, például könnyen rávágja, hogy Franciaország fővárosa Marseille, valamint a képaláírások készítésekor eltéveszti a fotón szereplők nemét. Ugyanakkor a DeepMind szerint a feladatok háromnegyedét jobban végzi el a rendszer, mint az adott terület szakértői. Emellett a szoftver felépítéséből fakadóan a Gato nem képes folyamatosan tanulni, nem tudja kiegészíteni a tudását, így az aktuális kérdésekre valószínűleg rossz válaszokat adna. További korlát, hogy igencsak véges az emlékezete, vagyis nagyobb, összefüggő anyagokat, például egy regényt nem tud megírni, mert a közepére elfelejti, hogy honnan indult.
A készítők a rendszer méretét ugyanis szűk korlátok közé szorították: csak 1,2 milliárd paramétere van, míg a szinte emberi szöveget megalkotni tudó GPT-3 ennek a százhetvenszeresével dolgozik. A döntés oka, hogy a robotkar valós idejű irányítását gátolta volna a nagyobb méret. A DeepMind szerint ha megnövelnék a paraméterek számát, még sokkal több mindenre lehetne képes a rendszer. Ugyanakkor a TechCrunch-nak nyilatkozva Mike Cook kutató azt mondta, hogy hiába gondolunk a Gato feladataira nagyon különbözőként, valójában nem akkora a különbség egy szöveg megírása és egy robot irányítása között. "Szép munka, de nem hiszem, hogy fontos mérföldkő lenne bármilyen irányba" – fogalmazott.
(Fotó: DeepMind, borítókép: Getty Images)