Kevesek által ismert MI taszította le a trónjáról a GPT-4-et

2024 / 03 / 28 / Pőcze Balázs
Kevesek által ismert MI taszította le a trónjáról a GPT-4-et
Az Anthropic által fejlesztett Claude 3 Opus átvette a vezetést a nagy nyelvi modelleket összehasonlító Chatbot Arenában, de elképzelhető, hogy pünkösdi királyság lesz a sikerből: az OpenAI már készül a válasszal.

Amióta a nagy nyelvi modellek (LLM-ek) segítségével működő, generatív mesterséges intelligenciák megjelentek a hétköznapjainkban, újra és újra felmerül, hogy melyik mire képes, miben igazán otthonos, illetve mennyivel jobb a versenytársainál. Ennek természetesen vannak objektív okai és eredményei, hiszen az, hogy a ChatGPT korábban még nem fért hozzá az aktuális internetes tartalmakhoz, vagy hogy kisebb tudásanyagon edzették, mint utódját, a GPT-4-et, látványosan befolyásolta a teljesítményét.

Mostanra szerencsére nem csak az OpenAI MI-jének a különböző verziói, hanem már a Google vagy a Meta rendszerei is versengenek egymással, a független szereplőkről nem is beszélve, vagyis egyre bonyolultabb lesz megmondani, hogy

melyikük a chatbotok éppen regnáló királya.

Az objektív összehasonlítások mellett, amilyen például a Matematikai Diákolimpia feladatsora, vagy az MMLU, hasznosak lehetnek az olyan oldalak, mint a Chatbot Arena. Ott feltehetünk egy kérdést két chatbotnak, megkapjuk a válaszaikat, majd teljesen szubjektíven megítélhetjük, hogy melyik a jobb, esetleg mindkettő ugyanolyan jó, vagy mindkettő ugyanolyan rossz. Egy vélemény persze semmit sem ér, de mindez többszázezer értékelés után már legalább olyan értékes információkat nyújt, mint a sztenderdizált mérések.

Az Ars Technica most arról számolt be, hogy míg korábban a GPT-4 Turbo gyakorlatilag mindent vitt, addig most először trónfosztásnak lehettünk szemtanúi. A volt OpenAI-alkalmazottak által indított, a börtönbüntetésre ítélt kriptomogul, Sam Bankman-Fried, az Amazon és a Google befektetéseivel is gazdálkodó Anthropic szoftvere ugyanis átvette a vezetést a legjobb chatbotok versenyében. A Claude 3 Opus Európában egyelőre csak korlátozottan elérhető, de lehetséges, hogy mire mi is kipróbálhatjuk, veszélyben lesz az első helye: a GPT-4 már több mint egy éves, és hosszabb ideje hallani róla, hogy úton az utódja, de a Google Gemini Prója is ott toporog a dobogó közelében. Az mindenesetre hatalmas eredmény, hogy míg jobbra-balra repkednek a monopóliumvádak a technológiai cégeknél, a mesterséges intelligencia területén tudnak még ilyen, meglepő eredmények születni.

(Borítókép: Bing Képgenerátor/DALL-E 3)


Félsz az állásinterjútól? Egy profi HR-es szakember tippjei segíthetnek
Félsz az állásinterjútól? Egy profi HR-es szakember tippjei segíthetnek
Ijesztőnek tűnhet magunkról beszélni, pláne a saját erősségeinket és jó tulajdonságainkat ecsetelni egy velünk szemben ülő idegen számára, de a sikerhez valójában néhány jól bevált módszer könnyen hozzásegíthet bárkit. Milyen skillekre van szükség egy jól sikerült interjúhoz? Hogyan biztosíthatjuk, hogy tényleg miénk legyen az álommeló? A Lányok Napja eseményen a memoQ HR-vezetője osztotta meg a sikerhez vezető jó tanácsokat a fiatal pályakezdőkkel, akik egyúttal a világsikerű fordítástámogató szoftvert fejlesztő céggel is megismerkedhettek.
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.