Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében

2025 / 06 / 08 / Felkai Ádám
Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében
Május közepén titkos találkozót tartottak a kaliforniai Berkeley-ben, amelyre a világ legjobb matematikusai gyűltek össze.

Harminc elit kutató – köztük néhányan külföldről érkeztek – egy speciális kihívás miatt találkozott: tesztelni akarták az OpenAI által fejlesztett, rendkívül fejlett o4-mini chatbot képességeit. A matematikusok célja az volt, hogy olyan kérdésekkel állítsák próba elé a mesterséges intelligenciát, amelyeket kifejezetten arra terveztek, hogy összezavarják a modellt – írja a Scientific American.

Ken Ono, a Virginiai Egyetem matematikusa, az esemény vezetője megdöbbenve figyelte, ahogyan az o4-mini pillanatok alatt megoldotta a matematika néhány legnehezebb problémáját. Ono külön kiemelte, hogy a chatbot egy olyan bonyolult számelméleti kérdést is gyorsan megfejtett, amely egyébként akár egy doktori disszertáció témája is lehetett volna.

„Sosem láttam még hasonló gondolkodásmódot egyetlen modellnél sem” – mondta. „Ez olyan, mintha egy valódi tudós dolgozna. Egyszerre lenyűgöző és félelmetes.”

Az o4-mini abban tér el az eddigi nyelvi modellektől, hogy speciálisan kifinomult matematikai problémák megoldására képezték ki. Speciális adathalmazokon, intenzív emberi irányítással fejlesztették, így jóval hatékonyabb lett a logikai következtetésben és a matematikai meglátásokban, mint a korábbi mesterséges intelligenciák. Az Epoch AI, egy mesterséges intelligenciák teljesítményét vizsgáló nonprofit szervezet, kezdetben 300, még nem publikált matematikai problémával tesztelte a chatbotot. Az eredmények szerint az o4-mini ezek közül mintegy húsz százalékot megoldott, ami messze túlszárnyalta a korábbi modellek teljesítményét.

A berkeley-i találkozó az Epoch AI kezdeményezésének része volt, amelyben további, még nehezebb problémák kidolgozására ösztönözték a kutatókat. A résztvevők csapatokat alkotva versenyeztek egymással, hogy olyan kihívásokat hozzanak létre, amelyekkel „megbéníthatják” a mesterséges intelligenciát, és minden olyan feladványért, amelyet az o4-mini nem tud megoldani, körülbelül 7500 dolláros jutalmat kaptak. Bár a matematikusok a szakma krémje, nehezen tudtak túljárni a chatbot eszén; végül mindössze tíz olyan problémát sikerült összeállítaniuk, amelyeken az o4-mini fennakadt.

Yang Hui He, a londoni Matematikai Tudományok Intézetének munkatársa szerint az o4-mini teljesítménye egy kiemelkedő posztgraduális hallgatóéhoz mérhető, de azzal a nem elhanyagolható különbséggel, hogy percek alatt végzett el olyan feladatokat, amelyek egy embernek hetekig vagy akár hónapokig is tartanának.

A találkozó végén a kutatók arról beszélgettek, hogy milyen lesz a mesterséges intelligencia szerepe a jövő matematikájában. Úgy látják, hogy a matematikusok főleg kérdéseket fognak feltenni, miközben a mesterséges intelligencia válik majd a felfedezések nélkülözhetetlen segítőjévé. Ono külön hangsúlyozta, hogy az oktatásban a kreativitás fejlesztése lesz a kulcsa annak, hogy megőrizzék a matematikai gondolkodás jelentőségét a rohamosan fejlődő mesterséges intelligencia korszakában. Ono egyben figyelmeztette kollégáit is, hogy ne becsüljék alá az új technológiákat, hiszen az olyan modellek, mint az o4-mini, már ma is felülmúlják a világ legjobb posztgraduális hallgatóinak a többségét.

(Kép: Pixabay/WaveGenerics)


Először lőttek ki hajót sínágyúval – és nem az amerikaiak voltak
Először lőttek ki hajót sínágyúval – és nem az amerikaiak voltak
Először lőttek éles célpontra hajóra szerelt sínágyúval, látványos mérföldkőhöz érve az elektromágneses fegyverfejlesztésben.
Hamarosan időkristályokkal fogunk fizetni
Hamarosan időkristályokkal fogunk fizetni
Az első, szabad szemmel is látható időkristályok fényben „pszichedelikus tigriscsíkokként” villannak fel.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.