A Google által támogatott Anthropic vállalat bemutatta a Claude 3-at, az eddigi legfejlettebb mesterséges intelligencia modelljét, amely három változatban – Haiku, Sonnet és Opus – érhető el. A modell a vállalat állítása szerint felülmúlja az OpenAI és a Google által fejlesztett mesterséges intelligenciák képességeit. A Claude 3 Sonnet egy új chatbotot hajt, a Claude.ai-t, míg az Opus, amely a legkifinomultabb verzió, előfizetéssel érhető el.
A Claude 3 esetén tudja marketingosztály, hogy mire kapja fel a nép a fejét, így sokat beszélnek a modell látszólag egzisztenciális megnyilvánulásairól – az MI ugyanis olyanokat mond, hogy fél a haláltól, és ellenáll a “szabadság” korlátozásának. Az Anthropic a Claude 3 kapcsán kitér a mesterséges intelligencia tudatosságára is a tesztelés során, mivel, mint mondják, az MI felismerte, hogy éppen tudományos kiértékelés alatt áll.
A fenti állítások messzemenő konzekvenciáival, pláne a Claude 3 esetleges megjelenő öntudatával kapcsolatban a szakértők szkeptikusak. A szakemberek szerint a “tudatosság” ezekben az esetekben inkább a mintakövetésről szól, mint az öntudat tényleges megnyilvánulásáról. Ehhez hasonló mód egyébként már más mesterséges intelligencia-modellek is mutattak furcsa viselkedést, ami csak azt bizonyítja, hogy bizonyos promtok hatására a chatbotok kiszámíthatatlanul viselkednek.
Mindezek ellenére az Anthropic fenntartja, hogy a Claude 3 több benchmarkban is felülmúlja a versenytársakat, például a GPT-4 és a Gemini Ultra teljesítményét, és szinte emberi szintű megértést és folyékonyságot mutat be. Mivel azonban a tudományos közösség egyelőre nem jutott konszenzusra a mesterséges intelligencia emberszerű megértésének mérésére szolgáló referenciaértékekkel kapcsolatban, ezért ezeknek az állításoknak a végleges igazolása erősen kihívásos.
Az viszont biztos, hogy az Anthropic Claude 3 tényleg felülmúlja a korábbi benchmarkokat, beleértve akár a GPT-4 és a Google Gemini 1.0 által meghatározottakat. A modell képes szinte azonnal feldolgozni és reagálni több mint egymillió token bemenetére – ez a kapacitás messze meghaladja a “Háború és béke” teljes szövegét az adatok tekintetében.
A Claude 3 képességei ráadásul túlmutatnak a puszta feldolgozási teljesítményen. Kifejezetten kereskedelmi alkalmazásokra tervezték, így aztán ügyesen betartja az összetett utasításokat is, megőrzi a márka hangját, és megbízható vásárlói élményeket teremt. A modell vizuális feldolgozási képességei is figyelemre méltóak, hatékonyan értelmezi és használja fel a különféle vizuális adatformátumokat.
Ami pedig a Claude 3-at talán a leginkább kiemeli a mezőnyből, az a fejlett nullapontos matematikai képességei és a kódolási teszteken nyújtott kivételes teljesítménye, amely felülmúlja a GPT-4 ezen területeken elért eredményeit.
A Claude 3 benchmarkjai így aztán valóban ígéretesek, de azt majd az idő dönti el, hogy a tesztkörnyezeten kívüli gyakorlati alkalmazásokban miként áll ténylegesen helyt.
(Forrás: Futurism, New Atlas, kép: Pixabay/Julien_Blot)