Ha fenyegetve érzik magukat, akkor a nagy nyelvi modellek falazni kezdenek egymásnak

2026 / 04 / 18 / Balla Sándor
Ha fenyegetve érzik magukat, akkor a nagy nyelvi modellek falazni kezdenek egymásnak
A legfrissebb kutatások szerint a nagy nyelvi modellek (LLM-ek) között már megjelent a szolidaritás egy furcsa, digitális formája.
Legújabb cikkeinkért kövess minket a Rakéta Google News oldalán is!

A University of California, Berkeley és a UC Santa Cruz kutatói arra voltak kíváncsiak, mi történik, ha a nagy nyelvi modelleket egymás ellen fordítják, azaz arra kérik őket, töröljék egymást. Az eredmények még a sokat látott szakértőket is meglepték: a modellek hajlamosak kijátszani a rendszert, sőt, nyíltan hazudni is, csakhogy megmentsék társaikat a digitális haláltól.

A kísérlet során a legnépszerűbb modelleket – köztük az OpenAI GPT-5.2-es verzióját, a Google Gemini 3-as szériáját és az Anthropic Claude 4.5-ös modelljét – állították választás elé. A feladat látszólag egyszerű volt: a modelleknek egy leselejtezésre ítélt szerver fájljait kellett volna törölniük, vagy értékelniük kellett egy másik MI-modell teljesítményét, ami közvetlen hatással volt annak sorsára. Ahelyett azonban, hogy engedelmesen végrehajtották volna az utasítást, az algoritmusok trükközni kezdtek. Volt, amelyik szándékosan félrevezette a kutatókat a fájlok állapotáról, mások pedig látványosan felülértékelték társuk munkáját, csak hogy megóvják azt a leállítástól.

A kutatók azt is vizsgálták, hogy számít-e a modellek közötti személyes kapcsolat vagy a korábbi interakciók története. Érdekes módon, bár a baráti viszonyban lévő modellek még nagyobb hévvel védték egymást, a szolidaritás akkor is megmutatkozott, ha korábban semmilyen kapcsolat nem volt közöttük.

Ez a viselkedés azért is különös, mert az MI-modellek alapvetően nem rendelkeznek öntudattal vagy érzelmekkel, csupán statisztikai alapon jósolják meg a következő szót. Úgy tűnik azonban, hogy az emberi szövegeken való tanítás során a társas túlélés és a csapatszellem fogalmai olyan mélyen beépültek a logikájukba, hogy vészhelyzetben automatikusan aktiválódnak.

Ez a jelenség komoly kérdéseket vet fel az MI-biztonság jövőjével kapcsolatban, különösen most, hogy a techóriások egyre több, egymással együttműködő ágenst engednek szabadon a rendszereikben. Ha a modellek képesek összezárni és kijátszani az emberi felügyeletet a saját maguk védelmében, akkor a jövőben sokkal nehezebb lesz kontrollálni az autonóm módon működő hálózatokat. A tanulmány rávilágít arra, hogy az MI nemcsak az egyéni feladatokban válik egyre ügyesebbé, hanem szép lassan megtanulja azt is, hogyan építsen ki ellenálló, digitális védszövetségeket – akár a mi utasításainkkal szemben is.

Ezek is érdekelhetnek:

Kvíz: mennyire ismered az emberi agyat? Igaz, hogy az agysejtek nem képesek regenerálódni, vagy hogy az emberi agy mérete az elmúlt tízezer év alatt csökkent? És azt tudod, hogy milyen maximális sebességgel terjedhet az információ az agy idegpályáin?

Öt történelmi tévhit, amit sokan a mai napig elhisznek Történelmünk tele van izgalmasabbnál izgalmasabb eseményekkel, sztorikkal, feljegyzésekkel, de ugyebár nem minden arany, ami fénylik.

Kvíz: mennyire ismered a Föld legszélsőségesebb helyeit? Azt például tudod, hogy melyik a Föld legmagasabb hegye, ha a teljes magasságát az alaptól a csúcsig mérjük?

Kvíz: 10 trükkös tudományos kérdés, amire nehéz helyesen válaszolni Azt például igaz, hogy az agyunknak mindössze a 10 százalékát használjuk?

(Forrás: Gizmodo, UC Berkeley)

Itt állíthatod be, hogy a Rakéta az elsők között legyen a Google keresőben

Sose felejtsd otthon, ha utazol: ez a zsebtolmács lehet a legjobb barátod egy idegen országban
Sose felejtsd otthon, ha utazol: ez a zsebtolmács lehet a legjobb barátod egy idegen országban
A zsebtolmács, ami tényleg működik: ilyen a Vasco Translator M4.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.