A verseny az ICPC világbajnoki döntőjén zajlott, ahol klasszikusan háromfős emberi csapatok dolgoznak azonos feladatsoron, öt órán át.
A modelleket nem közvetlenül a diákok ellen indították, de az ICPC szabályai szerinti, azonos körülmények között futtatták. Az OpenAI szerint „ugyanaz az 5 órás limit, a 12 feladatból 11 elsőre jó lett; végül a legnehezebb a 9. beküldésre sikerült”. A DeepMind pedig arról számolt be, hogy a Gemini nyolc feladatot oldott meg 45 perc alatt, és dinamikus programozásra, minimax-gondolatra és „prioritásértékekre” támaszkodva találta meg a folyadékelosztási probléma trükkös megoldását. Az idei aranyérmes emberi csapatok egyébként a következő intézményeket képviselték: Szentpétervári Állami Egyetem, Tokiói Egyetem, Pekingi Jiaotong Egyetem, Tsinghua Egyetem; ám egyikük sem ért el hibátlan, 12/12-es eredményt.
A fentiek alapján nagyon úgy fest, hogy a modern nyelvi modellek nemcsak „kódot írnak”, hanem összetett, matematikai-algoritmikus feladatokban is megbízhatóan terveznek és következtetnek – jegyzi meg a VB beszámolója. Természetesen ilyesmire nem minden üzleti folyamatnak van szüksége, ám ahol a bonyolultság a fő kihívás, ott az MI már nemcsak asszisztens, hanem maga is versenyző.