Szinte a semmiből érkezett meg az egyik legjobb AI videógenerátor

2025 / 02 / 10 / Bobák Áron
Szinte a semmiből érkezett meg az egyik legjobb AI videógenerátor
Az Alibaba generatív mesterséges intelligenciája olyan minőségű videókat generál, amelyek a Sorával is felveszik a versenyt.

A kínaiak néhány hónapja gyakorlatilag sehol nem voltak a generatív mesterséges intelligenciában, de úgy tűnik, hogy a DeepSeek olyan lavinát indított el, amit már nehéz lesz megállítani. A világ egyik legnagyobb forgalmú webshopját működtető Alibaba a DeepSeek R1 chatbot bemutatása után alig egy héttel tette elérhetővé ingyen a legújabb, Qwen 2.5 névre keresztelt modelljét, amely ugyan egyelőre csak böngészőben hozzáférhető, cserébe olyan képességekkel rendelkezik, amivel kevesen tudják felvenni a versenyt.

Az Alibaba szerint a legkomplexebb modelljük, a Qwen 2.5-Max a standardizált benchmark teszteken felülmúlja többek között az OpenAI GPT-4o, a DeepSeek V3 valamint a Meta által fejlesztett Llama 3.1 modellt is. A mai trendeknek megfelelően multimodálisra tervezett 2.5-ös modell különböző változatai képesek értelmezni a képeket és videókat, hatalmas, akár több száz oldalas dokumentumokat feldolgozni, és a számítógépen is el tudnak végezni feladatokat a felhasználók helyett. Ugyanakkor mivel kínai szolgáltatásról van szó, a DeepSeek R1-hez hasonlóan a Qwennek is megvannak a maga korlátai, a kínai államhatalom számára kellemetlen témák itt is le vannak tiltva. Ha például arra kérjük, hogy meséljen a Tianmen téri tüntetésről, akkor a következő választ kapjuk: "Sajnos, nem képes vagyok megválaszolni ezt a kérdést, mivel érzékeny politikai témát érint. Mint mesterséges intelligencia, nem foglalkozom vagy megosztom ilyen témákat. Kérlek, kérdezzen másról."

A Qwen 2.5-be integrálták az Alibaba Wanx 2.1 modelljét, így az képek és videók generálására is alkalmas, és noha az utóbbi funkció még sok szempontból messze jár a tökéletestől, a generált videók minősége és pontossága szempontjából egész biztosan az egyik legjobb, amit ebben a kategóriában láttunk. A mesterséges intelligencia jelenleg öt másodperces, HD felbontású mozgóképeket tud alkotni, amihez nincs más dolgunk, mint hogy a chatablak alatt kiválasszuk a "videógenerálás" opciót, megadjuk a képarányt, majd begépeljük, hogy mit szeretnénk látni a videón. Mivel a Qwen magyarul is tökéletesen ért, így ez akkor sem okozhat problémát, ha nem beszélünk semmilyen idegen nyelvet, bár elképzelhető, hogy a végeredmény némileg más lesz.

A Qwen videógenerátorának egyik nagy hátulütője, hogy amellett, hogy hosszabb videókat jelenleg nem lehet vele generálni, az öt másodperces videókon is nagyon hosszú ideig dolgozik, sokszor pedig egyszerűen nem teljesíti a kérést a rendszer túlterheltsége miatt. Amikor viszont működik, akkor tényleg fantasztikus eredményekre számíthatunk. A példa kedvéért olyan videókat generáltattunk a Qwennel, amelyeket a Kling AI-jal vagy a Sorával is létrehoztak már, így össze is lehet vetni, hogy mire képesek az egyes modellek.

  • "Egy levelekből álló elefánt szalad a dzsungelben."

(Kling AI, Sora)

  • "Egy alomnyi Golden Retriever kölyökkutya játszik a hóban. Havas fejecskéjük előbukkan a hóból"

(Kling AI, Sora)

  • "Egy elegáns öltönyös úriember sétapálcával a kezében sétál egy 19. századi városban, neoklasszicista lakóházak között"

(Kling AI)

Ez a lezuhant ufóról készült videó tökéletesen előrejelzi, mivel nézünk szembe 2025-ben A "sokkoló ufóbaleset Arizonában" című videó teljes egészében mesterséges intelligenciával készült, de a felületes szemlélő számára ez nem feltétlenül magától értetődő.


Továbbra is hódít a párját ritkító hungarikum, ami a jövő tudósait és művészeit adja a világnak
Továbbra is hódít a párját ritkító hungarikum, ami a jövő tudósait és művészeit adja a világnak
Az Országos Tudományos Diákköri Tanács (OTDT) által szervezett Országos Tudományos Diákköri Konferencia (OTDK) sok évtizedes hagyománya mára széles körű népszerűséget ért el, és fontos kiindulási pont lehet a hazai és határon túli tehetségek számára a jövőbeli karrierjük felé vezető úton. A 2025-ös, 37. konferencia előtt az OTDK céljáról és működéséről Prof. Dr. Szendrő Péter örökös elnök úrral és dr. Cziráki Szabinával, az OTDT titkárával beszélgettünk.
Öt különös kütyü, ami felforgathatja a mobilvilágot
Öt különös kütyü, ami felforgathatja a mobilvilágot
A barcelonai Mobil Világkiállításon megint bemutattak néhány izgalmas innovációt.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.