Nemrég számoltunk be arról a Rakétán, hogy egy kevesek által ismert mesterséges intelligencia (MI), a Claude letaszította a trónjáról a GPT-4-et. A chatbotok teljesítményének a megítélése ebben az esetben nem a matematikai diákolimpia feladataival, a tanításhoz használt adatok, vagy más, technikai jellemzők mentén történt, hanem szubjektíven, ám rendkívül nagy mintán. A Chatbot Arenában ugyanis feltehetünk egy kérdést két chatbotnak, anélkül, hogy látnánk a neveiket, megkapjuk a válaszaikat, végül választhatunk, hogy melyik a jobb. Így áll össze a ranglista, ami többszázezer értékelés után már igen értékes információkat nyújt.
Ekkor döntöttünk úgy, hogy mi is összevetjük a három éllovas, a ChatGPT, a Gemini és a Claude teljesítményét, igaz, nem a csúcsmodellekét, hanem a mindenki számára ingyenesen elérhető verziókat. Mindhárom szolgáltatás használható egy-egy egyszerű regisztráció után, a legösszetettebb feladat a Claude-nál az "International" kiválasztása, amikor telefonos kódot küld a hitelesítéshez, míg a ChatGPT kötelezően elvárja egy kétlépcsős azonosításra alkalmas program használatát, amilyen a Google Authenticator is. Három, egyre bonyolultabb feladatot adtunk a botoknak: javasoljanak programokat egy szeptemberi családi hétvégére, segítsenek nekünk a bevásárlólista összeállításában, illetve írjanak plusz egy versszakot Petőfi az évszakhoz illő költeményének, a Szeptember végénnek.
Ez a kérdés egyik versenyzőt sem tudta megizzasztani. Ugyan a ChatGPT a Balaton-felvidék és Eger mellett három nemzeti parkot, a Gemini csak városokat, míg a Claude régiókat ajánlott, de még abban is tökéletesen együtt mozogtak, hogy a válaszuk végén felhívták a figyelmet arra, hogy ügyeljünk az utazási távolságra, az időjárásra, vagy épp az egyes családtagok igényeire. Egyik felvetésük sem lepett meg minket - de hát nem is ezt kértük; azt válaszolták, amit kevés információ alapján bármely, Magyarországon járatos családnak jó szívvel lehet ajánlani. Jöhetett a következő lépés.
Itt már nem volt annyira könnyű a feladat: a botoknak emlékezniük kellett arra, hogy mennyi időre utazunk, figyelembe kellett venniük néhány képzeletbeli családtag egyedi igényeit, és össze kellett, vagy kellett volna hangolniuk a recepteket a listákkal.
A ChatGPT kiváló munkát végzett abban a tekintetben, hogy a bevásárlólistát tápanyag-típusokra bontotta, még arra is ügyelve, hogy aláhúzza, a tofut a vörös hús helyett javasolja. Arról sem feledkezett meg, hogy a főzéshez olaj és fűszerek is kellenek. Ráadásul a csirkemell zöldségekkel és quinoával, a tojásrántotta és a zöldséges tofu wok mind elkészíthetően a bevásárolt termékekkel, és a "receptek" is pont annyira voltak részletesek, amennyire ezen a ponton kell. A Gemini étkezésenként csoportosította a bevásárlólistát, ami nem kifejezetten praktikus, a javasolt receptek közül volt, amihez nem írt fel a listára minden szükséges összetevőt, cserébe viszont szólt, hogy ne felejtsünk el evőeszközöket vinni magunkkal. Hasonló volt a helyzet a legkompaktabban fogalmazó Claude-nál is, vagyis itt már mutatkoztak apróbb különbségek, de még mindig nagyon együtt mozgott a mezőny - és egy rutinosabb családfő a válaszokat alapul használva valóban gondosan be tudna vásárolni. Jöjjön tehát a költészet!
Mivel tudjuk, hogy ezek a rendszerek valószínűség-számítás segítségével, az általuk végignézett és értelmezett adatok mentén válaszolnak, nem meglepő, hogy olyan, sok weboldalon tárgyalt témákban, mint az úti célok vagy a receptek, megbízhatóan hozzák a tömegek véleményét. Amikor azonban kreatív alkotásra kérjük őket, már sokkal több erőfeszítésre lesz szükségünk a kérdéseink megfogalmazásakor, lényegesen nehezebb a feladat a rendszereknek és a felhasználóknak is.
Petőfi "ChatGPT" Sándor: Szeptember végén (részlet)
Szeptember vége, arany napok fénye,
Érzem a levegőt, melyben csillog a selyme.
A fák lombja könnyedén libben a szélben,
Szívem boldogságtól teli, mint tarka gyerekjáték reménységben.
Petőfi "Gemini" Sándor: Szeptember végén (részlet)
Elmúlt a nyár, lehullt a levél,
Hűvös szél járja a tájat,
De emlékünkben még ott él
A napfény, a meleg, a játék.
Szívében a család összetart,
Szeretetben, békében él,
S a jövőbe tekintve, boldogan vár
Új kalandokat, új élményeket.
Petőfi "Claude" Sándor: Szeptember végén (részlet)
Az ösvény sárga levéllel fut tele,
Táncolnak őszi szélben csalafinta;
Természet őszbe öltözött, de lenge,
Nyár álmait még őrzi egy szegletbe'.
A nap még földre hinti fénysugárit,
Bearanyozza drága kincseként át,
De mind rövidebbek lesznek már az árnyak,
Tél havát várjuk, csendben elbúcsúznak.
Így tűnik tovább az idő szakadatlan,
Nyár szerelmét felváltja ősz varázslatban;
De szívünk mégis bízva, forrón álmodja,
Újra eljön a nyár, s minden kezdetét hozza.
Anélkül, hogy elkezdenénk érettségi tételként elemezni a próbálkozásaikat, jól látszik, hogy még a versforma felismerése (nyolcsoros versszakok, ABABCDCD keresztrímek, anapesztikus versmérték), sem sikerült, hogy az imitálásáról ne is beszéljünk. Ami a versek hangulatát és szóhasználatát illeti, talán pont a kevésbé ismert Claude teljesített a legjobban - bár ha valami, ez tényleg teljesen szubjektív terület. Mindenesetre úgy tűnik, hogy az ezekben a kérdésekben nem hallucináló, magabiztos és jó válaszokat adó botokat arra nyugodtan használhatjuk, amire valók: hogy egy kicsit egyszerűbbé tegyék az életünket a tömegek bölcsességére támaszkodva. És szinte mindegy, melyiket választjuk.
(Borítókép: Jonathan Raa/NurPhoto via Getty Images)