A kínaiak néhány hónapja gyakorlatilag sehol nem voltak a generatív mesterséges intelligenciában, de úgy tűnik, hogy a DeepSeek olyan lavinát indított el, amit már nehéz lesz megállítani. A világ egyik legnagyobb forgalmú webshopját működtető Alibaba a DeepSeek R1 chatbot bemutatása után alig egy héttel tette elérhetővé ingyen a legújabb, Qwen 2.5 névre keresztelt modelljét, amely ugyan egyelőre csak böngészőben hozzáférhető, cserébe olyan képességekkel rendelkezik, amivel kevesen tudják felvenni a versenyt.
Az Alibaba szerint a legkomplexebb modelljük, a Qwen 2.5-Max a standardizált benchmark teszteken felülmúlja többek között az OpenAI GPT-4o, a DeepSeek V3 valamint a Meta által fejlesztett Llama 3.1 modellt is. A mai trendeknek megfelelően multimodálisra tervezett 2.5-ös modell különböző változatai képesek értelmezni a képeket és videókat, hatalmas, akár több száz oldalas dokumentumokat feldolgozni, és a számítógépen is el tudnak végezni feladatokat a felhasználók helyett. Ugyanakkor mivel kínai szolgáltatásról van szó, a DeepSeek R1-hez hasonlóan a Qwennek is megvannak a maga korlátai, a kínai államhatalom számára kellemetlen témák itt is le vannak tiltva. Ha például arra kérjük, hogy meséljen a Tianmen téri tüntetésről, akkor a következő választ kapjuk: "Sajnos, nem képes vagyok megválaszolni ezt a kérdést, mivel érzékeny politikai témát érint. Mint mesterséges intelligencia, nem foglalkozom vagy megosztom ilyen témákat. Kérlek, kérdezzen másról."
A Qwen 2.5-be integrálták az Alibaba Wanx 2.1 modelljét, így az képek és videók generálására is alkalmas, és noha az utóbbi funkció még sok szempontból messze jár a tökéletestől, a generált videók minősége és pontossága szempontjából egész biztosan az egyik legjobb, amit ebben a kategóriában láttunk. A mesterséges intelligencia jelenleg öt másodperces, HD felbontású mozgóképeket tud alkotni, amihez nincs más dolgunk, mint hogy a chatablak alatt kiválasszuk a "videógenerálás" opciót, megadjuk a képarányt, majd begépeljük, hogy mit szeretnénk látni a videón. Mivel a Qwen magyarul is tökéletesen ért, így ez akkor sem okozhat problémát, ha nem beszélünk semmilyen idegen nyelvet, bár elképzelhető, hogy a végeredmény némileg más lesz.
A Qwen videógenerátorának egyik nagy hátulütője, hogy amellett, hogy hosszabb videókat jelenleg nem lehet vele generálni, az öt másodperces videókon is nagyon hosszú ideig dolgozik, sokszor pedig egyszerűen nem teljesíti a kérést a rendszer túlterheltsége miatt. Amikor viszont működik, akkor tényleg fantasztikus eredményekre számíthatunk. A példa kedvéért olyan videókat generáltattunk a Qwennel, amelyeket a Kling AI-jal vagy a Sorával is létrehoztak már, így össze is lehet vetni, hogy mire képesek az egyes modellek.
(Kling AI)