Folytatódik a nagy nyelvi modellek, azaz az LLM-ek versenye, és míg korábban rendre a ChatGPT-t fejlesztő OpenAI rakta egyre feljebb a lécet, most mintha a Google került volna lépéselőnybe. Amint arról tavaly év végén beszámoltunk, az új Google-modell, a Gemini legérdekesebb tulajdonsága, hogy az alapjaitól multimodálisnak tervezték, vagyis nem csak a szövegekkel, de videókkal, képekkel, hangfelvételekkel és programkódokkal is megbirkózik, képes átjárást biztosítani azok között. Ugyan a keresőóriás az egyik promóciós videójában erősen túlzott a rendszer képességeivel kapcsolatban, de ettől függetlenül érzékelhető előrelépést jelentett már az eddigi, Pro verziója is a Gemininek.
Most viszont megérkezett a nagy testvér, az Ultra, ami egy összetett tesztben még az emberi szakértőknél is ügyesebb.
A Google közleménye szerint ez először nekik sikerült, és az MMLU (Massive Multitask Language Understanding, Masszív Többfeladatú Nyelvi Megértés) teszt weboldalán valóban az áll, hogy a Gemini Ultra teljesítette azt a legjobban. Ez az összehasonlítást segítő, azaz benchmark teszt a természettudományos kérdések mellett társadalomtudományi és egyéb területeken is próbára teszi a modelleket, az egyszerű problémáktól a professzionális szintig.
De nem ez az igazi szintlépés. A Google vezérigazgatója, Sundar Pichai szavaiból egyértelműen látszik, hogy a felhőtechnológiák után a mesterséges intelligencia (MI) lesz az új vezérfonal a cég termékeiben; amit a fejlesztői konferenciájukon ígértek tavaly tavasszal, valóra is váltják. Kezdjük azzal, hogy chatbotjuk korábbi nevét, a Bardot Geminire cserélik. Androidon létrehoznak egy ugyanerre a névre hallgató MI-appot; valamiért iOS-en a megszokott Google alkalmazásba költöznek ezek a képességek. A Workspace, azaz az irodai szoftvereik Duet AI-át is Gemini névre keresztelik, ahogyan a felhőszoftverekhez használt Duetet is. Aki pedig az Ultra képességeivel szeretne kísérletezni, például képeket készíteni, programkódot javítani vagy épp állásinterjúra készülni, annak a Gemini Professionalre kell előfizetnie, ami a Google One prémium csomagjának az MI-vel kiegészített verziójában lesz elérhető, körülbelül havi húsz dollárért. Mindezt negyven nyelven, százötven országban, látszólag egy kiforrott stratégia mentén.
Persze közben a versenytársak sem ülnek a babérjaikon: az OpenAI az "ágensekre", azaz a helyettünk cselekvő, kattintó, görgető szoftverekre fókuszál, az Apple pedig nem csak csepegtet egy-egy MI-alapú fejlesztést, hanem két és féltucat MI-céget is felvásárolt tavaly. Az a következő hetekben kiderül, hogy pontosan mire jó a Gemini Ultra, de az már most látszik, hogy a területen folyó versenyt tovább fogja gyorsítani.
(Borítókép: Rafael Henrique/SOPA Images/LightRocket via Getty Images)