Először a történelemben: két AI modell nyerte az aranyat a matematikai olimpián

2025 / 07 / 23 / Felkai Ádám

#google #mesterséges intelligencia #deepmind #matematika

Először a történelemben: két AI modell nyerte az aranyat a matematikai olimpián

A Google DeepMind és az OpenAI által fejlesztett mesterséges intelligencia rendszerek most először érték el az aranyéremhez szükséges teljesítményt a világ egyik legrangosabb ifjúsági matematikai versenyén, a Nemzetközi Matematikai Olimpián (IMO).

A szakértők ezt mérföldkőnek tekintik az MI számára a magas szintű tudományos és matematikai problémák megoldásában.

A DeepMind modellje, a Gemini Deep Think, valamint az OpenAI jelenleg még névnélküli rendszere (tehát nem a ChatGPT valamely elérhető verziója) egyaránt hatból öt feladatot oldott meg a hivatalos, 4,5 órás időkorláton belül – ez éppen elegendő volt az aranyéremhez. Az OpenAI eredményét korábbi IMO-érmesek, míg a DeepMind teljesítményét az olimpiát szervező hivatalos értékelőbizottság is megerősítette. Ez jelentős előrelépés a korábbi évekhez képest, hiszen 2023-ban a DeepMind AlphaProof és AlphaGeometry nevű modelljei csupán az ezüstéremig jutottak – ráadásul akkor még Lean programozási nyelven ellenőrzött bizonyításokkal –, az idei rendszerek azonban már természetes nyelven dolgozták ki a megoldásaikat. Ez jóval hozzáférhetőbbé és emberi olvasásra alkalmasabbá tette az eredményeket.

Gregor Dolinar, az IMO elnöke elmondta, hogy a 2024-es, ausztráliai Queenslandben rendezett olimpián több vállalat és egyetemi kutatócsoport is kérte mesterséges intelligencia rendszereik hivatalos értékelését. Az OpenAI először érdeklődést mutatott a hivatalos elbírálás iránt, de végül egy független értékelést választott.

A Google egyik vezető kutatója, Thang Luong szerint a Gemini Deep Think működésének alapját a megerősítéses tanulás és az úgynevezett „párhuzamos gondolkodás” technikája képezi. Ez utóbbi azt eredményezi, hogy a rendszer egyszerre többféle megoldási irányt is képes felfedezni. A modellt kifejezetten IMO-stílusú problémákon képezték ki, amelyek az érvelési készségek fejlesztését célozták.

A siker ellenére néhány matematikus továbbra is szkeptikus. Terence Tao, a UCLA professzora az átláthatóság és az eredmények független reprodukálhatóságának fontosságára hívta fel a figyelmet. Mint mondta, amíg nem állnak rendelkezésre részletes technikai dokumentációk, addig az eredmények hitelességét csak a fejlesztő cégek állításaira lehet alapozni. Hasonló gondolatot fogalmazott meg Geordie Williamson, a Sydney-i Egyetem kutatója is, aki szerint aggasztó, hogy a modellek működésének részleteihez csak korlátozottan lehet hozzáférni.

Joseph Myers, az IMO egyik szervezője pedig azt is kiemelte, hogy az MI rendszereknek nemcsak természetes nyelvű magyarázatokat kell tudniuk adni, hanem formálisan is bizonyítaniuk kell a megoldásaik helyességét – különösen a hosszú és bonyolult feladatok esetében.

A Google és az OpenAI egyaránt tervezi egyébként, hogy a rendszereit a közeljövőben a matematikusok számára is elérhetővé teszi további tesztelés céljából. A szélesebb körű nyilvános hozzáférés egy későbbi szakaszban várható. Ahogy Junehyuk Jung, a Google munkatársa fogalmazott: