Megjelent a világ legjobbnak mondott mesterséges intelligenciája, a Google Gemini Ultra 1.0

2024 / 02 / 09 / Pőcze Balázs
Megjelent a világ legjobbnak mondott mesterséges intelligenciája, a Google Gemini Ultra 1.0
Decemberben mutatta be a Google a következő nagy nyelvi modelljét, a Geminit, amelynek most a legfejlettebb verzióját, az Ultrát is nyilvánosságra hozták. A cég állítása szerint ez az első szoftver, ami az emberi szakértőknél is jobban teljesít a matematika, fizika, történelem és etika kérdéseket is tartalmazó MMLU-teszten.

Folytatódik a nagy nyelvi modellek, azaz az LLM-ek versenye, és míg korábban rendre a ChatGPT-t fejlesztő OpenAI rakta egyre feljebb a lécet, most mintha a Google került volna lépéselőnybe. Amint arról tavaly év végén beszámoltunk, az új Google-modell, a Gemini legérdekesebb tulajdonsága, hogy az alapjaitól multimodálisnak tervezték, vagyis nem csak a szövegekkel, de videókkal, képekkel, hangfelvételekkel és programkódokkal is megbirkózik, képes átjárást biztosítani azok között. Ugyan a keresőóriás az egyik promóciós videójában erősen túlzott a rendszer képességeivel kapcsolatban, de ettől függetlenül érzékelhető előrelépést jelentett már az eddigi, Pro verziója is a Gemininek.

Most viszont megérkezett a nagy testvér, az Ultra, ami egy összetett tesztben még az emberi szakértőknél is ügyesebb.

A Google közleménye szerint ez először nekik sikerült, és az MMLU (Massive Multitask Language Understanding, Masszív Többfeladatú Nyelvi Megértés) teszt weboldalán valóban az áll, hogy a Gemini Ultra teljesítette azt a legjobban. Ez az összehasonlítást segítő, azaz benchmark teszt a természettudományos kérdések mellett társadalomtudományi és egyéb területeken is próbára teszi a modelleket, az egyszerű problémáktól a professzionális szintig.

De nem ez az igazi szintlépés. A Google vezérigazgatója, Sundar Pichai szavaiból egyértelműen látszik, hogy a felhőtechnológiák után a mesterséges intelligencia (MI) lesz az új vezérfonal a cég termékeiben; amit a fejlesztői konferenciájukon ígértek tavaly tavasszal, valóra is váltják. Kezdjük azzal, hogy chatbotjuk korábbi nevét, a Bardot Geminire cserélik. Androidon létrehoznak egy ugyanerre a névre hallgató MI-appot; valamiért iOS-en a megszokott Google alkalmazásba költöznek ezek a képességek. A Workspace, azaz az irodai szoftvereik Duet AI-át is Gemini névre keresztelik, ahogyan a felhőszoftverekhez használt Duetet is. Aki pedig az Ultra képességeivel szeretne kísérletezni, például képeket készíteni, programkódot javítani vagy épp állásinterjúra készülni, annak a Gemini Professionalre kell előfizetnie, ami a Google One prémium csomagjának az MI-vel kiegészített verziójában lesz elérhető, körülbelül havi húsz dollárért. Mindezt negyven nyelven, százötven országban, látszólag egy kiforrott stratégia mentén.

Persze közben a versenytársak sem ülnek a babérjaikon: az OpenAI az "ágensekre", azaz a helyettünk cselekvő, kattintó, görgető szoftverekre fókuszál, az Apple pedig nem csak csepegtet egy-egy MI-alapú fejlesztést, hanem két és féltucat MI-céget is felvásárolt tavaly. Az a következő hetekben kiderül, hogy pontosan mire jó a Gemini Ultra, de az már most látszik, hogy a területen folyó versenyt tovább fogja gyorsítani.

(Borítókép: Rafael Henrique/SOPA Images/LightRocket via Getty Images)

Már képeket is tud generálni és magyarul is jobban működik a Google chatbotja A Gemini nagy nyelvi modellel felturbózott Bard sokat fejlődött például a hosszabb szövegek összefoglalásában, emellett angol nyelvterületen már arra is képes, hogy a beírt szövegnek megfelelő képeket generáljon.


Így omlott össze az amerikai légi közlekedés a Crowdstrike-leállás miatt
Így omlott össze az amerikai légi közlekedés a Crowdstrike-leállás miatt
Péntek reggel egy frissítési hiba miatt kritikus rendszerek tömkelege mondta fel a szolgálatot világszerte, ami a bankok, kórházak és médiavállalatok mellett több légitársaságnál is komoly fennakadásokat okozott.
Szinte profi dizájnernek érezhetjük magunkat a Microsoft legújabb AI-eszközével
Szinte profi dizájnernek érezhetjük magunkat a Microsoft legújabb AI-eszközével
A Microsoft a napokban mindenki számára elérhetővé tette a Designer nevű szolgáltatást, ami az OpenAI képgenerátorának képességeit kihasználva tervez meg nekünk szinte bármit üdvözlőlaptól az emojikig.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.