A Cerebras vállalat WSE-2 (Wafer-Scale Engine) processzorát 2021 áprilisában mutatták be - ez a második generációs változata a cég által készített lapkáknak, amelyeket a mélytanulási rendszerük számára alkottak meg. A chip a CS-2 infrastruktúrát működteti és a Cerebras leírása szerint ez az eddigi legnagyobb számítógépes chip és egyben a leggyorsabb mesterséges intelligencia processzor, ami a programozás komplexitásának szintjét jelentősen csökkenti azzal, hogy egyetlen eszközre helyezi mindazokat a forrásokat, amelyek más infrastruktúrák esetében több külön egységen foglalnának helyet.
A WSE-2 56-szor nagyobb, mint a legnagyobb GPU, 2,6 billió tranzisztort tartalmaz és 850 000 magot, amelyek közül mindegyik külön-külön programozható. A chip speciálisan az MI modellek igényeit szolgálja és azokra az algebrai műveletekre optimalizálták, amelyek a neurális hálózat betanításához szükségesek. A chip szerkezetének kialakítása miatt minden mag könnyen eléri a memóriát, amiből összesen 40 GB-ot tartalmaz a lapka és az egységek egy szilícium alapra való helyezésével kevésbé okoz gondot a hagyományos megoldások esetében esetleg könnyebben felmerülő akadozás a kommunikációban.
A WSE-2-vel működő CS-2 infrastruktúra a cég ígérete szerint az MI betanításának idejét hónapokról percekre redukálja, ami nagy előrelépést jelent a hatékonyságban és egyúttal az energiaigényeket is csökkentheti. A mesterséges intelligencia rendszerek betanításának jelenlegi módszere a Bostoni Egyetem kutatójának, Kate Saenkónak elmondása szerint meglehetősen gazdaságtalan, legalábbis akkor mindenképpen, ha az emberi agy tanulási folyamatának menetével vetjük össze, mivel sokkal több adatra van szüksége ugyanannyi szó, kifejezés elraktározásához. A Massachusetts-i Egyetem 2019-es tanulmánya szerint egy-egy nagyobb modell felkészítése rendkívül energiaintenzív és annyi szén-dioxid kibocsátással jár, mint amennyit öt autó generál egész élettartama alatt, beleszámítva az előállításának kibocsátási értékeit is.
A mesterséges intelligencia működéshez szabott számítógépes rendszerek ezért sokat segíthetnek a hatékonyság növelésében, a CS-2-nek pedig (éppen ezzel a céllal) meg is alkották a jóval nagyobb szabású verzióját, ami 16 összekapcsolt CS-2-ből áll.
Ez az Androméda, a legnagyobb MI számítógép, ami az első exaflopos komputer a mesterséges intelligencia rendszerek számára.
Az exaflopos teljesítmény azt jelenti, hogy a gép képes a másodpercenként trillió művelet elvégzésére, bár a DC2 (dense compute) tekintetében 120 petaflops a maximális teljesítménye. A gép 16 CS-2 infrastruktúrából áll össze, vagyis körülbelül 13,5 millió magos és majdnem tökéletes a lineáris skálázhatósága. Ez azt jelenti a Cerebras leírása alapján, hogy minden egyes egység (CS-2) hozzáadása majdnem pontosan a felére redukálja az MI rendszer betanítási folyamatának idejét.
Az Androméda üzembe helyezése mindössze három napot vett igénybe és a számítógépet, amihez felhőszolgáltatáson keresztül lehet hozzáférni, már használják különböző vállalatok és egyetemi hallgatók is, akik számára a rendszer elérhetőségét ingyenessé tette a Cerebras. A számítógépet alkalmazza többek között a Jasper AI is, akik a természetes nyelvi modellek segítségével készítenek marketing és reklám célú szövegeket, azaz mesterséges szövegírói szolgáltatást nyújtanak az ügyfeleiknek. A szuperszámítógép így a mesterséges intelligencia fejlődésének újabb korszakát hozhatja el, amivel nem csak a sok milliárd paraméterrel rendelkező nyelvi modellek működtethetőek gyorsabban, mint például a 12 milliárd paraméteres DALL-E, hanem már a következő generációs, billiónyi paraméteres verziók is futtathatóak majd.
(Fotó: Cerebras)