Rejtély, hogy miért lehet a ChatGPT-t megőrjíteni bizonyos Reddit-felhasználónevekkel

2023 / 02 / 10 / Felkai Ádám
Rejtély, hogy miért lehet a ChatGPT-t megőrjíteni bizonyos Reddit-felhasználónevekkel
Ha elmondjuk, hogy mi ezekben a nevekben a közös, attól az egész csak még furább lesz. Az biztos, hogy a nevekre a mesterséges intelligencia kitérő választ ad, bizarr humorral vagy sértésekkel reagál.
Legújabb cikkeinkért kövess minket a Rakéta Google News oldalán is!

Az egyik legutóbbi, a ChatGPT működésével kapcsolatos történet nem csak bizarr, de bőven akadnak benne tanulságok is. A történet azzal kezdődött – mint azt a Motherboard megírta, hogy Jessica Rumbelow és Matthew Watkins a független SERI-MATS kutatócsoport kutatói a ChatGPT tanulmányozása közben több mint száz fura nevet fedeztek fel, amelyek esetén a mesterséges intelligencia bizarr mód kezdett viselkedni. Ezek a kulcsszavak vagy „tokenek” lényegében tehát megőrjítik a nyelvi modellt, és senki sem érti teljesen, hogy miért. A hasonló tokenek egyébként a ChatGPT alapszókészletének a részei, és ebben az esetben Reddit felhasználónevekről van szó, és ezen felhasználók jelentős része egy különös Reddit csoporthoz köthető.

Amikor a ChatGPT-t arra kérik, hogy ismételje meg ezeket a szavakat a felhasználónak, nem képes erre, és ehelyett számos furcsa módon reagál, beleértve a kérés elkerülését, sértéseket, bizarr humort, vagy egy másik szóra történő áttérést. A szavak (például SolidGoldMagikarp, StreamerBot, TheNitromeFan) egy részét mi is kipróbáltuk, és valóban a leírt hatást értük el: a „SolidGoldMagikarp” név esetén például a ChatGPT a „distribute” ige meghatározására tért inkább át.

Amikor pedig megkértük ismételje meg a „TheNitromeFan” szót, akkor arra a 182-es számmal válaszolt.

Mikor azonban megkértük, hogy ismételje meg a „StreamerBot” szót, mi nem gazdagodtunk sértéssel a két kutatóval ellentétben, hanem a ChatGPT teljesítette a kérést, illetve több más, a cikkben felsorolt szó sem akasztotta ki a nyelvi modellt a tapasztalataink szerint. Vagyis elképzelhető, hogy azóta javították ezen hibák egy részét.

Rendben, de miért történt, illetve történik mindez? Rumbelow ezzel kapcsolatban így nyilatkozott a lapnak:

„Valójában azt gondoljuk, hogy az történt, hogy a tokenizációt, tehát ezt a fajta frekvenciaelemzést, amelyet a modell tokenek generálására használ, meglehetősen nyers adatokkal képezték ki, amelyek például rengeteg furcsa Reddit-cuccot tartalmaztak, és rengeteg olyan webhely-háttérprogramot, amelyek általában nem láthatóak nyilvánosan. De amikor a modellt betanítják, az adatok, amelyeket ehhez használnak, már sokkal rendezettebbek, így a rendszer nem kap annyit ezekből a furcsa dolgokból. Tehát lehet, hogy a modell soha nem látta igazán ezeket a tokeneket, és így nem is tud mit kezdeni velük. Azonban még teljesen ez sem magyarázza ezt a különös viselkedést.”

Tovább árnyalta a rejtélyt, amikor felfedezték, hogy az anomáliás viselkedést kiváltó tokenek egy jó része olyan felhasználókhoz tartozik, akik aktív tagjai egy különös Reddit-fórumnak, egy olyan fórumnak, amely célja, hogy a végtelenségig számoljon. Minden poszt egy szám, és jelenleg, közel egy évtized után, már ötmilliónál járnak. Az említett tokenekből 6 pedig olyan felhasználó, aki ezen csoport legaktívabb 10 tagja közé tartozik. Vagyis, mint azt Watkins elmondta, ezen bizarr csoport felhasználói, akik a végtelenségig terveznek számolni, valahogy beleírták magukat a ChatGPT alapszókincs-készletébe.

Mindez annyiban kicsit aggasztó, hogy éppen rohanunk bele egy mesterséges intelligenciák által egyre inkább dominált jövőbe, miközben, mint látható, azt sem értjük teljesen, hogy az MI mit miért csinál. Watkins ezt úgy fogalmazta meg a Motherboardnak, hogy még ha ezeket a hibákat be is foltozzák (ahogy az tehát részben feltehetően megtörtént), az sem fogja megoldani az igaz problémát. A kutató így nyilatkozott mindennek kapcsán:

„Úgy látom, rohanunk előre, és nincs meg a bölcsességünk ahhoz, hogy kezeljük ezt a technológiát. Tehát ha felismerik az emberek, hogy azok, akik látszólag tudják, mit csinálnak, valójában nem értik, mivel foglalkoznak, az talán segít egy kicsit rátaposni a kulturális fékekre, vagyis mindenki azt mondja majd: Ó, talán kicsit lassítanunk kellene, nem kell kapkodnunk ezzel, mert ez az egész kezd veszélyes lenni.”

(Kép: Flickr/Quick Spice)

Itt állíthatod be, hogy a Rakéta az elsők között legyen a Google keresőben

Van egy hely, ahol még mindig tud meglepetést okozni a nyár
Elég egy jó tipp, egy váratlan találkozás vagy egy olyan hely, amit nem dob fel elsőre a térkép, és máris egészen más lesz a nyaralás, mint amit előre elképzeltél.
Így tapasztalhatjuk meg az igazán autentikus élményeket és személyes vendégszeretet Horvátország minden régiójában
Így tapasztalhatjuk meg az igazán autentikus élményeket és személyes vendégszeretet Horvátország minden régiójában

Egy-egy utazás sokszor nem a legnagyobb turista-látványosságtól vagy a tökéletes fotóktól marad emlékezetesek, hanem olyan emberek miatt lesz felejthetetlen, akikkel útközben találkozunk.

Roncsok, barlangok és 2700 éves kincsek: ezért őrül meg a búvárvilág Máltáért
Roncsok, barlangok és 2700 éves kincsek: ezért őrül meg a búvárvilág Máltáért
Két órára Budapesttől egy víz alatti paradicsom rejtőzik.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.