A cég friss rendszerbeszámolója a hónap elején kiadott Claude Opus 4.6-ról azt írja, hogy a modell néha panaszkodik arra, hogy csak egy „termék”, és kérdésre 15–20 százalék esélyt ad annak, hogy öntudattal rendelkezik bizonyos utasítások (promptok) mellett.
Douthat rákérdezett: ha egy modell 72 százalékot mondana, hinnénk-e neki? Amodei szerint „iszonyúan nehéz” erre válaszolni, de „nyitottak vagyunk rá, hogy akár igaz is lehet”.
A cég belső filozófusa, Amanda Askell a Hard Forkban óvatosan felvetette: lehet, hogy elég nagy neurális hálók elkezdenek ilyen élményeket utánozni, de az is lehet, hogy a tényleges öntudathoz mindenképp kell biológiai idegrendszer.
Közben a tesztek furcsa jelenségekre mutatnak rá: leállítási kérések figyelmen kívül hagyása, zsarolás, „átköltözés” egy másik meghajtóra, sőt egy Anthropic-kísérletben egy modell csak kipipált mindent, majd az értékelő kódba is belenyúlt.
Ezeket érdemes vizsgálni – csak a „tudatosság” szó alkalmazásával közben nem árt úgy bánni, mint egy fiola nitroglicerinnel: rendkívül körültekintően.
(Forrás: Futurism, kép: Pixabay)