A Gizmodón olvasható hír szerint az új modell a programozási versenyeket szervező Codeforces-nál épphogy csak kilógna a felső tíz százalékból, és a Nemzetközi Matematikai Diákolimpia kvalifikációs feladatainak a nyolcvanhárom százalékát is helyesen oldotta meg. Ez a lélegzetelállítóan kommunikáló, képekkel, videókkal és szöveggel is dolgozó eddigi csúcsmodellnél, a GPT-4o-nál mindössze tizennégy százalék volt.
Sam Altman vezérigazgató szerint a GPT-o1 egy új paradigmát képvisel azzal, hogy az emberéhez eggyel hasonlóbb gondolkodásra képes. Azonban aláhúzta: a hibái és korlátai miatt elsőre ugyan figyelemre méltó a szoftver teljesítménye, ám utána hajlamos csalódást kelteni. A kommunikációs téren általában igen jól teljesítő Altman ezzel valószínűleg az újabb és újabb MI-generációkkal kapcsolatos, sokszor felfokozott várakozásokat szeretné valamelyest lehűteni.
Ugyanakkor a program valóban nagyot lép előre abban a tekintetben, hogy nem kell állandóan visszakérdeznie, hanem képes egy feladatot részekre bontani, az egyes felismeréseit ellenőrizni, majd összetett válaszokat adni. Amikor a TechCrunch újságírója, Maxwell Zeff kipróbálta a GPT-o1-et, megkérte, hogy gondolja végig, az idei hálaadási vacsorájukhoz, ahol rengeteg rokon lesz jelen, kelleni fog-e plusz sütő a meglévő kettő mellé, esetleg szervezze-e az egészet inkább egy bérlakásba. Alig több mint tíz másodperc után komplex és helyes gondolatokat kapott arról, hogy lakást bérelni pénzkidobás lenne, inkább osszák be okosan, hogy mikor mit sütnek, legrosszabb esetben béreljenek egy mobil sütőt. Az MI mindehhez nem csak a költségeket, de még a családtagok idejét, energiáját is figyelembe vette.
Mindennek a hátulütője, hogy a modell ugyanilyen összetetten válaszol egyszerű kérdésekre is, teljesen feleslegesen. Eközben indokolatlanul sok energiát és pénzt használ fel, hiszen minden lépcsőt újra és újra ellenőriz, így az o1 használata egyelőre lényegesen drágább, mint az elődeié. Ráadásul a program százezer esetből nyolcszázszor tévedett, ezeknek a harmadában pedig tudta, hogy téved, mégis helytelenül válaszolt.
Az, hogy a GPT-o1 közelebb visz-e minket az általános mesterséges intelligenciához, az AGI-hoz, arról megoszlanak a vélemények. Az azonban kétségtelen, hogy a matematikai és fejlesztési feladatok mellett egy ilyen modell akkor is segíthet, ha a saját gondolatmenetünket szeretnénk ellenőrizni valamivel kapcsolatban. Ehhez végre nem csak egy-egy kurta mondatot kapunk válaszul, hanem megismerhetjük a szoftver gondolkodását. Miközben az próbálja megtanulni a mienket.
(Borítókép: VCG/VCG via Getty Images)