Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében

2025 / 06 / 08 / Felkai Ádám

#ai #OpenAI #ChatGPT #mesterséges intelligecia

Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében

Május közepén titkos találkozót tartottak a kaliforniai Berkeley-ben, amelyre a világ legjobb matematikusai gyűltek össze.

Legújabb cikkeinkért kövess minket a Rakéta Google News oldalán is!

Harminc elit kutató – köztük néhányan külföldről érkeztek – egy speciális kihívás miatt találkozott: tesztelni akarták az OpenAI által fejlesztett, rendkívül fejlett o4-mini chatbot képességeit. A matematikusok célja az volt, hogy olyan kérdésekkel állítsák próba elé a mesterséges intelligenciát, amelyeket kifejezetten arra terveztek, hogy összezavarják a modellt – írja a Scientific American.

Ken Ono, a Virginiai Egyetem matematikusa, az esemény vezetője megdöbbenve figyelte, ahogyan az o4-mini pillanatok alatt megoldotta a matematika néhány legnehezebb problémáját. Ono külön kiemelte, hogy a chatbot egy olyan bonyolult számelméleti kérdést is gyorsan megfejtett, amely egyébként akár egy doktori disszertáció témája is lehetett volna.

„Sosem láttam még hasonló gondolkodásmódot egyetlen modellnél sem” – mondta. „Ez olyan, mintha egy valódi tudós dolgozna. Egyszerre lenyűgöző és félelmetes.”

Az o4-mini abban tér el az eddigi nyelvi modellektől, hogy speciálisan kifinomult matematikai problémák megoldására képezték ki. Speciális adathalmazokon, intenzív emberi irányítással fejlesztették, így jóval hatékonyabb lett a logikai következtetésben és a matematikai meglátásokban, mint a korábbi mesterséges intelligenciák. Az Epoch AI, egy mesterséges intelligenciák teljesítményét vizsgáló nonprofit szervezet, kezdetben 300, még nem publikált matematikai problémával tesztelte a chatbotot. Az eredmények szerint az o4-mini ezek közül mintegy húsz százalékot megoldott, ami messze túlszárnyalta a korábbi modellek teljesítményét.

A berkeley-i találkozó az Epoch AI kezdeményezésének része volt, amelyben további, még nehezebb problémák kidolgozására ösztönözték a kutatókat. A résztvevők csapatokat alkotva versenyeztek egymással, hogy olyan kihívásokat hozzanak létre, amelyekkel „megbéníthatják” a mesterséges intelligenciát, és minden olyan feladványért, amelyet az o4-mini nem tud megoldani, körülbelül 7500 dolláros jutalmat kaptak. Bár a matematikusok a szakma krémje, nehezen tudtak túljárni a chatbot eszén; végül mindössze tíz olyan problémát sikerült összeállítaniuk, amelyeken az o4-mini fennakadt.

Yang Hui He, a londoni Matematikai Tudományok Intézetének munkatársa szerint az o4-mini teljesítménye egy kiemelkedő posztgraduális hallgatóéhoz mérhető, de azzal a nem elhanyagolható különbséggel, hogy percek alatt végzett el olyan feladatokat, amelyek egy embernek hetekig vagy akár hónapokig is tartanának.

A találkozó végén a kutatók arról beszélgettek, hogy milyen lesz a mesterséges intelligencia szerepe a jövő matematikájában. Úgy látják, hogy a matematikusok főleg kérdéseket fognak feltenni, miközben a mesterséges intelligencia válik majd a felfedezések nélkülözhetetlen segítőjévé. Ono külön hangsúlyozta, hogy az oktatásban a kreativitás fejlesztése lesz a kulcsa annak, hogy megőrizzék a matematikai gondolkodás jelentőségét a rohamosan fejlődő mesterséges intelligencia korszakában. Ono egyben figyelmeztette kollégáit is, hogy ne becsüljék alá az új technológiákat, hiszen az olyan modellek, mint az o4-mini, már ma is felülmúlják a világ legjobb posztgraduális hallgatóinak a többségét.

(Kép: Pixabay/WaveGenerics)

Itt állíthatod be, hogy a Rakéta az elsők között legyen a Google keresőben

A Hold körüli infrastruktúra egyik alapkövét rakhatja le egy magyar vállalat

Liverpool után az otthonodban találkozhat a csúcsteljesítmény és a prémium életmód

A Liverpoollal együtt törhetsz a csúcsra az új szezonban

A meccsnézés utáni rendrakást erre az ügyes takarítógépre bíztuk

A meccsnézés nálunk nemzeti sport, és rendszerint együtt jár egy kis rendetlenséggel, amit ezúttal rábíztunk egy ügyes takarítógépre. Kipróbáltuk a Mova E40 Ultrát, méghozzá egy elég extrém teszten, hogy kiderüljön, mire megy a két félidő alatt szétszóródott ropogtatnivalókkal.

Ezek is érdekelhetnek