Kevesek által ismert MI taszította le a trónjáról a GPT-4-et

2024 / 03 / 28 / Pőcze Balázs
Kevesek által ismert MI taszította le a trónjáról a GPT-4-et
Az Anthropic által fejlesztett Claude 3 Opus átvette a vezetést a nagy nyelvi modelleket összehasonlító Chatbot Arenában, de elképzelhető, hogy pünkösdi királyság lesz a sikerből: az OpenAI már készül a válasszal.

Amióta a nagy nyelvi modellek (LLM-ek) segítségével működő, generatív mesterséges intelligenciák megjelentek a hétköznapjainkban, újra és újra felmerül, hogy melyik mire képes, miben igazán otthonos, illetve mennyivel jobb a versenytársainál. Ennek természetesen vannak objektív okai és eredményei, hiszen az, hogy a ChatGPT korábban még nem fért hozzá az aktuális internetes tartalmakhoz, vagy hogy kisebb tudásanyagon edzették, mint utódját, a GPT-4-et, látványosan befolyásolta a teljesítményét.

Mostanra szerencsére nem csak az OpenAI MI-jének a különböző verziói, hanem már a Google vagy a Meta rendszerei is versengenek egymással, a független szereplőkről nem is beszélve, vagyis egyre bonyolultabb lesz megmondani, hogy

melyikük a chatbotok éppen regnáló királya.

Az objektív összehasonlítások mellett, amilyen például a Matematikai Diákolimpia feladatsora, vagy az MMLU, hasznosak lehetnek az olyan oldalak, mint a Chatbot Arena. Ott feltehetünk egy kérdést két chatbotnak, megkapjuk a válaszaikat, majd teljesen szubjektíven megítélhetjük, hogy melyik a jobb, esetleg mindkettő ugyanolyan jó, vagy mindkettő ugyanolyan rossz. Egy vélemény persze semmit sem ér, de mindez többszázezer értékelés után már legalább olyan értékes információkat nyújt, mint a sztenderdizált mérések.

Az Ars Technica most arról számolt be, hogy míg korábban a GPT-4 Turbo gyakorlatilag mindent vitt, addig most először trónfosztásnak lehettünk szemtanúi. A volt OpenAI-alkalmazottak által indított, a börtönbüntetésre ítélt kriptomogul, Sam Bankman-Fried, az Amazon és a Google befektetéseivel is gazdálkodó Anthropic szoftvere ugyanis átvette a vezetést a legjobb chatbotok versenyében. A Claude 3 Opus Európában egyelőre csak korlátozottan elérhető, de lehetséges, hogy mire mi is kipróbálhatjuk, veszélyben lesz az első helye: a GPT-4 már több mint egy éves, és hosszabb ideje hallani róla, hogy úton az utódja, de a Google Gemini Prója is ott toporog a dobogó közelében. Az mindenesetre hatalmas eredmény, hogy míg jobbra-balra repkednek a monopóliumvádak a technológiai cégeknél, a mesterséges intelligencia területén tudnak még ilyen, meglepő eredmények születni.

(Borítókép: Bing Képgenerátor/DALL-E 3)


Tisztelet magunk és mások felé – miért fontos kijelölni a határainkat?
Tisztelet magunk és mások felé – miért fontos kijelölni a határainkat?

A szezon eleganciája nemcsak a megjelenésen múlik, hiszen a figyelmesség, a finom gesztusok és a személyes határok tiszteletben tartása ugyanúgy a harmonikus ünnepek részei, mint egy jól megválasztott összeállítás. Akár családi vacsoráról, baráti összejövetelről vagy évzáró partiról van szó, a megfelelő kommunikáció, illetve az önazonosság megkerülhetetlen ahhoz, hogy mindenki felszabadultan érezhesse magát. A JTI protokoll- és etikett szakértője, Dr. Kibédi-Varga Katalin segít eligazodni abban, hogyan jelöljük ki határainkat úgy, hogy közben az ünnepi események könnyedek és elegánsak maradjanak.

A jövő megérkezett Fehérvárra – az ország egyik legmodernebb BYD szalonjában jártunk
A jövő megérkezett Fehérvárra – az ország egyik legmodernebb BYD szalonjában jártunk
Ha eddig azt hitted, hogy az autóvásárlás a papírmunkáról és a hónapokig tartó várakozásról szól, akkor ideje újra átgondolni. Székesfehérváron olyat mutatott az Autócentrum Szabó, ami téged is érdekelhet, ha a jövő autózását keresed.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.