Harminc elit kutató – köztük néhányan külföldről érkeztek – egy speciális kihívás miatt találkozott: tesztelni akarták az OpenAI által fejlesztett, rendkívül fejlett o4-mini chatbot képességeit. A matematikusok célja az volt, hogy olyan kérdésekkel állítsák próba elé a mesterséges intelligenciát, amelyeket kifejezetten arra terveztek, hogy összezavarják a modellt – írja a Scientific American.
Ken Ono, a Virginiai Egyetem matematikusa, az esemény vezetője megdöbbenve figyelte, ahogyan az o4-mini pillanatok alatt megoldotta a matematika néhány legnehezebb problémáját. Ono külön kiemelte, hogy a chatbot egy olyan bonyolult számelméleti kérdést is gyorsan megfejtett, amely egyébként akár egy doktori disszertáció témája is lehetett volna.
„Sosem láttam még hasonló gondolkodásmódot egyetlen modellnél sem” – mondta. „Ez olyan, mintha egy valódi tudós dolgozna. Egyszerre lenyűgöző és félelmetes.”
Az o4-mini abban tér el az eddigi nyelvi modellektől, hogy speciálisan kifinomult matematikai problémák megoldására képezték ki. Speciális adathalmazokon, intenzív emberi irányítással fejlesztették, így jóval hatékonyabb lett a logikai következtetésben és a matematikai meglátásokban, mint a korábbi mesterséges intelligenciák. Az Epoch AI, egy mesterséges intelligenciák teljesítményét vizsgáló nonprofit szervezet, kezdetben 300, még nem publikált matematikai problémával tesztelte a chatbotot. Az eredmények szerint az o4-mini ezek közül mintegy húsz százalékot megoldott, ami messze túlszárnyalta a korábbi modellek teljesítményét.
A berkeley-i találkozó az Epoch AI kezdeményezésének része volt, amelyben további, még nehezebb problémák kidolgozására ösztönözték a kutatókat. A résztvevők csapatokat alkotva versenyeztek egymással, hogy olyan kihívásokat hozzanak létre, amelyekkel „megbéníthatják” a mesterséges intelligenciát, és minden olyan feladványért, amelyet az o4-mini nem tud megoldani, körülbelül 7500 dolláros jutalmat kaptak. Bár a matematikusok a szakma krémje, nehezen tudtak túljárni a chatbot eszén; végül mindössze tíz olyan problémát sikerült összeállítaniuk, amelyeken az o4-mini fennakadt.
Yang Hui He, a londoni Matematikai Tudományok Intézetének munkatársa szerint az o4-mini teljesítménye egy kiemelkedő posztgraduális hallgatóéhoz mérhető, de azzal a nem elhanyagolható különbséggel, hogy percek alatt végzett el olyan feladatokat, amelyek egy embernek hetekig vagy akár hónapokig is tartanának.
A találkozó végén a kutatók arról beszélgettek, hogy milyen lesz a mesterséges intelligencia szerepe a jövő matematikájában. Úgy látják, hogy a matematikusok főleg kérdéseket fognak feltenni, miközben a mesterséges intelligencia válik majd a felfedezések nélkülözhetetlen segítőjévé. Ono külön hangsúlyozta, hogy az oktatásban a kreativitás fejlesztése lesz a kulcsa annak, hogy megőrizzék a matematikai gondolkodás jelentőségét a rohamosan fejlődő mesterséges intelligencia korszakában. Ono egyben figyelmeztette kollégáit is, hogy ne becsüljék alá az új technológiákat, hiszen az olyan modellek, mint az o4-mini, már ma is felülmúlják a világ legjobb posztgraduális hallgatóinak a többségét.
(Kép: Pixabay/WaveGenerics)