Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében

2025 / 06 / 08 / Felkai Ádám
Egy titkos találkozón a legjobb matematikusok próbálták legyőzni az AI-t – de elbuktak lényegében
Május közepén titkos találkozót tartottak a kaliforniai Berkeley-ben, amelyre a világ legjobb matematikusai gyűltek össze.

Harminc elit kutató – köztük néhányan külföldről érkeztek – egy speciális kihívás miatt találkozott: tesztelni akarták az OpenAI által fejlesztett, rendkívül fejlett o4-mini chatbot képességeit. A matematikusok célja az volt, hogy olyan kérdésekkel állítsák próba elé a mesterséges intelligenciát, amelyeket kifejezetten arra terveztek, hogy összezavarják a modellt – írja a Scientific American.

Ken Ono, a Virginiai Egyetem matematikusa, az esemény vezetője megdöbbenve figyelte, ahogyan az o4-mini pillanatok alatt megoldotta a matematika néhány legnehezebb problémáját. Ono külön kiemelte, hogy a chatbot egy olyan bonyolult számelméleti kérdést is gyorsan megfejtett, amely egyébként akár egy doktori disszertáció témája is lehetett volna.

„Sosem láttam még hasonló gondolkodásmódot egyetlen modellnél sem” – mondta. „Ez olyan, mintha egy valódi tudós dolgozna. Egyszerre lenyűgöző és félelmetes.”

Az o4-mini abban tér el az eddigi nyelvi modellektől, hogy speciálisan kifinomult matematikai problémák megoldására képezték ki. Speciális adathalmazokon, intenzív emberi irányítással fejlesztették, így jóval hatékonyabb lett a logikai következtetésben és a matematikai meglátásokban, mint a korábbi mesterséges intelligenciák. Az Epoch AI, egy mesterséges intelligenciák teljesítményét vizsgáló nonprofit szervezet, kezdetben 300, még nem publikált matematikai problémával tesztelte a chatbotot. Az eredmények szerint az o4-mini ezek közül mintegy húsz százalékot megoldott, ami messze túlszárnyalta a korábbi modellek teljesítményét.

A berkeley-i találkozó az Epoch AI kezdeményezésének része volt, amelyben további, még nehezebb problémák kidolgozására ösztönözték a kutatókat. A résztvevők csapatokat alkotva versenyeztek egymással, hogy olyan kihívásokat hozzanak létre, amelyekkel „megbéníthatják” a mesterséges intelligenciát, és minden olyan feladványért, amelyet az o4-mini nem tud megoldani, körülbelül 7500 dolláros jutalmat kaptak. Bár a matematikusok a szakma krémje, nehezen tudtak túljárni a chatbot eszén; végül mindössze tíz olyan problémát sikerült összeállítaniuk, amelyeken az o4-mini fennakadt.

Yang Hui He, a londoni Matematikai Tudományok Intézetének munkatársa szerint az o4-mini teljesítménye egy kiemelkedő posztgraduális hallgatóéhoz mérhető, de azzal a nem elhanyagolható különbséggel, hogy percek alatt végzett el olyan feladatokat, amelyek egy embernek hetekig vagy akár hónapokig is tartanának.

A találkozó végén a kutatók arról beszélgettek, hogy milyen lesz a mesterséges intelligencia szerepe a jövő matematikájában. Úgy látják, hogy a matematikusok főleg kérdéseket fognak feltenni, miközben a mesterséges intelligencia válik majd a felfedezések nélkülözhetetlen segítőjévé. Ono külön hangsúlyozta, hogy az oktatásban a kreativitás fejlesztése lesz a kulcsa annak, hogy megőrizzék a matematikai gondolkodás jelentőségét a rohamosan fejlődő mesterséges intelligencia korszakában. Ono egyben figyelmeztette kollégáit is, hogy ne becsüljék alá az új technológiákat, hiszen az olyan modellek, mint az o4-mini, már ma is felülmúlják a világ legjobb posztgraduális hallgatóinak a többségét.

(Kép: Pixabay/WaveGenerics)


Amikor egy virtuális sárkány segít a gyógyulásban – Te is részese lehetsz!
Amikor egy virtuális sárkány segít a gyógyulásban – Te is részese lehetsz!
Egyetlen százalék is elég lehet ahhoz, hogy egy beteg kisgyerek újra mosolyogjon – tedd meg Te is a Tőled telhetőt!
Így látja a világot a Boston Dynamics humanoid robotja
Így látja a világot a Boston Dynamics humanoid robotja
Atlasnak meg kell értenie a világot ahhoz, hogy működni tudjon benne munka közben.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.