Többszáz különböző feladatot képes elvégezni egy új mesterséges intelligencia

2022 / 05 / 17 / Pőcze Balázs
Többszáz különböző feladatot képes elvégezni egy új mesterséges intelligencia
Ugyanaz a neurális hálózat Atari játékokkal játszik, képaláírásokat készít, csetel, vagy kockákat pakol egy robotkezet irányítva, de akad szakértő, aki szerint még így is messze vagyunk az általános MI-ktől.

A Google anyacégéhez, az Alphabethez tartozó DeepMind egy olyan, "általános felhasználású" mesterséges intelligenciát (MI) mutatott be, amely egészen pontosan hatszáznégy különböző feladatot képes ellátni. A Gato fontos lépés lehet az általános mesterséges intelligenciák fejlődésében.

"A nagy mintákkal dolgozó nyelvi rendszerek ihlettek minket arra, hogy hasonló megközelítést alkalmazzunk egyetlen általános ügynök (ágens) megépítésekor, amely a szöveges kimeneten kívül másra is képes"

– fogalmaz a DeepMind blogbejegyzése. "Ugyanaz a neurális hálózat tud Atari játékokkal játszani, képaláírásokat készíteni, csetelni, vagy egy robot kézzel kockákat egymásra rakni. A kontextus alapján dönti el, hogy szöveget bocsásson ki, ízületeket mozgasson, gombokat nyomjon vagy mást csináljon."

A TechCrunch cikkében kiemelik: az ilyen, általános MI rendszerek régóta dédelgetett álmai az iparágnak és a sci-fi íróknak, hiszen ezek sokkal közelebb állnak az emberi intelligencia működéséhez, mint az egy-egy célra fejlesztett rendszerek. A lapnak nyilatkozó szakértő, Jack Hessel ugyanakkor aláhúzza, hogy eddig is léteztek olyan MI-k, amelyek különböző feladatokat voltak képesek ellátni, a Google MUM-járól korábban röviden írtunk is a Rakétán. Ami a Gato sajátossága, hogy rendkívül sokféle az a tevékenység, amelyre képes. Hessel szerint továbbá az is lényeges előrelépés, hogy nem különálló képességek vannak egy csokorba gyűjtve, vagyis nem annyi történik, hogy a rendszer először eldönti, hogy az adott helyzetnek melyik képessége felel meg, majd elindítja azt a teljesen önállóan működő tevékenységet. A valóban "izgalmas" eredmény szerinte, ha a különböző működési módokat egyszerre tudjuk használni és fejleszteni.

Játék, határokkal

A cikk szerint a körülbelül hatszáz feladat negyedét a Gato nem oldja meg kifejezetten jól, például könnyen rávágja, hogy Franciaország fővárosa Marseille, valamint a képaláírások készítésekor eltéveszti a fotón szereplők nemét. Ugyanakkor a DeepMind szerint a feladatok háromnegyedét jobban végzi el a rendszer, mint az adott terület szakértői. Emellett a szoftver felépítéséből fakadóan a Gato nem képes folyamatosan tanulni, nem tudja kiegészíteni a tudását, így az aktuális kérdésekre valószínűleg rossz válaszokat adna. További korlát, hogy igencsak véges az emlékezete, vagyis nagyobb, összefüggő anyagokat, például egy regényt nem tud megírni, mert a közepére elfelejti, hogy honnan indult.

A készítők a rendszer méretét ugyanis szűk korlátok közé szorították: csak 1,2 milliárd paramétere van, míg a szinte emberi szöveget megalkotni tudó GPT-3 ennek a százhetvenszeresével dolgozik. A döntés oka, hogy a robotkar valós idejű irányítását gátolta volna a nagyobb méret. A DeepMind szerint ha megnövelnék a paraméterek számát, még sokkal több mindenre lehetne képes a rendszer. Ugyanakkor a TechCrunch-nak nyilatkozva Mike Cook kutató azt mondta, hogy hiába gondolunk a Gato feladataira nagyon különbözőként, valójában nem akkora a különbség egy szöveg megírása és egy robot irányítása között. "Szép munka, de nem hiszem, hogy fontos mérföldkő lenne bármilyen irányba" – fogalmazott.

(Fotó: DeepMind, borítókép: Getty Images)

Először történt ilyen: végig beavatkozás nélkül irányított az MI egy óriási teherhajót Zsúfolt vízi útvonalon, több száz ütközést elkerülve vezette a mesterséges intelligencia a 750 tonnás teherhajót közel 800 km-es távon – ez volt az első ilyen alkalom a történelemben.


Szextechnológiai innovációk, amiket már ma ki lehet próbálni
Szextechnológiai innovációk, amiket már ma ki lehet próbálni
A virtuális valóság ebben az iparágban például már nem is annyira virtuális.
Ez a "rémálom-generátor" elmossa a valóság és a képzelet határát
A Pika 1.5 technikailag egy videógenerátor, de a rémálom-generátor kifejezés talán helyesebb lenne rá. Mutatjuk is, hogy miért.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.