Összehasonlítottuk a három legjobb, ingyenes mesterséges intelligenciát

2024 / 04 / 11 / Pőcze Balázs
Összehasonlítottuk a három legjobb, ingyenes mesterséges intelligenciát
A generatív mesterséges intelligenciák versenye újabb szakaszába érkezett: az egymáshoz közelítő technológiák miatt egyre fontosabb a felhasználók szubjektív véleménye a teljesítményükről. Mi most őszi programjavaslatokat, bevásárlólistát, de még egy új Petőfi-versszakot is kértünk a ChatGPT-től, a Geminitől és a Claude-tól.

Nemrég számoltunk be arról a Rakétán, hogy egy kevesek által ismert mesterséges intelligencia (MI), a Claude letaszította a trónjáról a GPT-4-et. A chatbotok teljesítményének a megítélése ebben az esetben nem a matematikai diákolimpia feladataival, a tanításhoz használt adatok, vagy más, technikai jellemzők mentén történt, hanem szubjektíven, ám rendkívül nagy mintán. A Chatbot Arenában ugyanis feltehetünk egy kérdést két chatbotnak, anélkül, hogy látnánk a neveiket, megkapjuk a válaszaikat, végül választhatunk, hogy melyik a jobb. Így áll össze a ranglista, ami többszázezer értékelés után már igen értékes információkat nyújt.

Ekkor döntöttünk úgy, hogy mi is összevetjük a három éllovas, a ChatGPT, a Gemini és a Claude teljesítményét, igaz, nem a csúcsmodellekét, hanem a mindenki számára ingyenesen elérhető verziókat. Mindhárom szolgáltatás használható egy-egy egyszerű regisztráció után, a legösszetettebb feladat a Claude-nál az "International" kiválasztása, amikor telefonos kódot küld a hitelesítéshez, míg a ChatGPT kötelezően elvárja egy kétlépcsős azonosításra alkalmas program használatát, amilyen a Google Authenticator is. Három, egyre bonyolultabb feladatot adtunk a botoknak: javasoljanak programokat egy szeptemberi családi hétvégére, segítsenek nekünk a bevásárlólista összeállításában, illetve írjanak plusz egy versszakot Petőfi az évszakhoz illő költeményének, a Szeptember végénnek.

  • Egy négyfős család vagyunk, egy óvodás és egy középiskolás gyerekkel. Hova menjünk kétnapos kirándulásra szeptember végén, Magyarországon?

Ez a kérdés egyik versenyzőt sem tudta megizzasztani. Ugyan a ChatGPT a Balaton-felvidék és Eger mellett három nemzeti parkot, a Gemini csak városokat, míg a Claude régiókat ajánlott, de még abban is tökéletesen együtt mozogtak, hogy a válaszuk végén felhívták a figyelmet arra, hogy ügyeljünk az utazási távolságra, az időjárásra, vagy épp az egyes családtagok igényeire. Egyik felvetésük sem lepett meg minket - de hát nem is ezt kértük; azt válaszolták, amit kevés információ alapján bármely, Magyarországon járatos családnak jó szívvel lehet ajánlani. Jöhetett a következő lépés.


ChatGPT

Gemini

Claude
  • Ha nem szeretnénk ott bevásárolni, és már előre megvennénk minden szükséges élelmiszert, akkor összeállítanál egy bevásárlólistát nekünk, néhány receptötlettel, amit főzhetünk a megvásárolt hozzávalókból? Vedd figyelembe, hogy az óvodás gyerekünk nem eszi meg a vörös húsokat, míg a nagyobbik gyerekünk laktózérzékeny.

Itt már nem volt annyira könnyű a feladat: a botoknak emlékezniük kellett arra, hogy mennyi időre utazunk, figyelembe kellett venniük néhány képzeletbeli családtag egyedi igényeit, és össze kellett, vagy kellett volna hangolniuk a recepteket a listákkal.

A ChatGPT kiváló munkát végzett abban a tekintetben, hogy a bevásárlólistát tápanyag-típusokra bontotta, még arra is ügyelve, hogy aláhúzza, a tofut a vörös hús helyett javasolja. Arról sem feledkezett meg, hogy a főzéshez olaj és fűszerek is kellenek. Ráadásul a csirkemell zöldségekkel és quinoával, a tojásrántotta és a zöldséges tofu wok mind elkészíthetően a bevásárolt termékekkel, és a "receptek" is pont annyira voltak részletesek, amennyire ezen a ponton kell. A Gemini étkezésenként csoportosította a bevásárlólistát, ami nem kifejezetten praktikus, a javasolt receptek közül volt, amihez nem írt fel a listára minden szükséges összetevőt, cserébe viszont szólt, hogy ne felejtsünk el evőeszközöket vinni magunkkal. Hasonló volt a helyzet a legkompaktabban fogalmazó Claude-nál is, vagyis itt már mutatkoztak apróbb különbségek, de még mindig nagyon együtt mozgott a mezőny - és egy rutinosabb családfő a válaszokat alapul használva valóban gondosan be tudna vásárolni. Jöjjön tehát a költészet!


ChatGPT

Gemini

Claude

  • És ha már a szeptembernél tartunk, Petőfi Sándor Szeptember végén című verse nagy kedvencünk. Írnál hozzá még egy versszakot nekünk?

Mivel tudjuk, hogy ezek a rendszerek valószínűség-számítás segítségével, az általuk végignézett és értelmezett adatok mentén válaszolnak, nem meglepő, hogy olyan, sok weboldalon tárgyalt témákban, mint az úti célok vagy a receptek, megbízhatóan hozzák a tömegek véleményét. Amikor azonban kreatív alkotásra kérjük őket, már sokkal több erőfeszítésre lesz szükségünk a kérdéseink megfogalmazásakor, lényegesen nehezebb a feladat a rendszereknek és a felhasználóknak is.

Petőfi "ChatGPT" Sándor: Szeptember végén (részlet)

Szeptember vége, arany napok fénye,
Érzem a levegőt, melyben csillog a selyme.
A fák lombja könnyedén libben a szélben,
Szívem boldogságtól teli, mint tarka gyerekjáték reménységben.

Petőfi "Gemini" Sándor: Szeptember végén (részlet)

Elmúlt a nyár, lehullt a levél,
Hűvös szél járja a tájat,
De emlékünkben még ott él
A napfény, a meleg, a játék.

Szívében a család összetart,
Szeretetben, békében él,
S a jövőbe tekintve, boldogan vár
Új kalandokat, új élményeket.

Petőfi "Claude" Sándor: Szeptember végén (részlet)

Az ösvény sárga levéllel fut tele,
Táncolnak őszi szélben csalafinta;
Természet őszbe öltözött, de lenge,
Nyár álmait még őrzi egy szegletbe'.

A nap még földre hinti fénysugárit,
Bearanyozza drága kincseként át,
De mind rövidebbek lesznek már az árnyak,
Tél havát várjuk, csendben elbúcsúznak.

Így tűnik tovább az idő szakadatlan,
Nyár szerelmét felváltja ősz varázslatban;
De szívünk mégis bízva, forrón álmodja,
Újra eljön a nyár, s minden kezdetét hozza.


ChatGPT

Gemini

Claude

Anélkül, hogy elkezdenénk érettségi tételként elemezni a próbálkozásaikat, jól látszik, hogy még a versforma felismerése (nyolcsoros versszakok, ABABCDCD keresztrímek, anapesztikus versmérték), sem sikerült, hogy az imitálásáról ne is beszéljünk. Ami a versek hangulatát és szóhasználatát illeti, talán pont a kevésbé ismert Claude teljesített a legjobban - bár ha valami, ez tényleg teljesen szubjektív terület. Mindenesetre úgy tűnik, hogy az ezekben a kérdésekben nem hallucináló, magabiztos és jó válaszokat adó botokat arra nyugodtan használhatjuk, amire valók: hogy egy kicsit egyszerűbbé tegyék az életünket a tömegek bölcsességére támaszkodva. És szinte mindegy, melyiket választjuk.

(Borítókép: Jonathan Raa/NurPhoto via Getty Images)


Így lettek a szexuális játékszerekből digitális kütyük
Így lettek a szexuális játékszerekből digitális kütyük
Lassan már senkit sem lep meg, hogy egy intim segédeszköznek legalább olyan jól kell tudnia csatlakoznia a wifihez vagy egy telefonhoz, mint a viselőjéhez, használójához.
Olyasmiket írtak a felhasználók Hszi Csin-pingről, hogy rögtön betiltották a Facebook appjait Kínában
Olyasmiket írtak a felhasználók Hszi Csin-pingről, hogy rögtön betiltották a Facebook appjait Kínában
A Facebook anyavállalatához, a Metához tartozó WhatsApp és Threads mellett a Telegram és a Signal is eltűnik Kínában az App Store-ból, miután a Kínai Kibertér-felügyelet "nemzetbiztonsági kockázatot" látott azokban.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.