Miután a ChatGPT-vel szó szerint valódi forradalmat indítottak el a számítástechnika területén, az OpenAI idén februárban egy újabb szenzációs újítással állt elő: a Sora nevű videógenerátor már az első demók alapján is nagyon ígéretesnek tűnt, a fejlesztők által azóta közzétett videók alapján pedig nem túlzás azt feltételezni, hogy a generatív mesterséges intelligencia hamarosan a mozgóképek területén is ugyanolyan földindulást idéz elő, mint korábban az írott szövegeknél és az állóképeknél.
Bár azt eddig is lehetett tudni, hogy az OpenAI ezen a területen komoly konkurenciára számíthat (többek között a Meta és a Google is kísérletezik hasonló megoldással), Sam Altman cége most egy nem várt helyről kapott komoly versenytársat: a Tom’s Guide beszámolója szerint a kínai Kuaishou nevű cég nem csak megcsinálta nagyjából ugyanazt, mint az OpenAI, de várólistás rendszerben már a kínai felhasználók rendelkezésére is bocsátotta a technológiát.
Chinese new DiT Video AI Generation model 【KLING】
Open access!
Generate 120s Video with FPS30 1080P, Understand Physics Better, Model Complex Motion Accurately
prompt:
Traveling by train, viewing all sorts of landscapes through the window.https://t.co/hTwIEHRza2 pic.twitter.com/nBvnAsqd1O— 青龍聖者 (@bdsqlsz) June 6, 2024
prompt:Little boy riding his bike in the garden through the changing seasons of fall, winter, spring and summer. pic.twitter.com/53tFPfsQyT
— 青龍聖者 (@bdsqlsz) June 6, 2024
KLING pic.twitter.com/S83hz8s950
— 青龍聖者 (@bdsqlsz) June 6, 2024
Panda playing the guitar pic.twitter.com/JLwntfzZea
— 青龍聖者 (@bdsqlsz) June 6, 2024
A Chinese man sits at a table and eats noodles with chopsticks pic.twitter.com/VnSKgwrtyx
— 青龍聖者 (@bdsqlsz) June 6, 2024
A Kling nevű generatív mesterséges intelligencia az eddig megjelent videók alapján valódi versenytársa lehet a Sorának, ráadásul a napvilágra került specifikációk is igen fejlett képességekről tanúskodnak. Eszerint a Kling akár Full HD felbontásban, 30 fps-sel (képkocka/másodperc) is képes videókat generálni, amelyek akár két perc hosszúságúak is lehetnek. A Kling emellett számos olyan területen is jól teljesít, amelyeket nehéz megoldani vagy rendszerint gondot okoz a mesterséges intelligenciának, így többek között képes három dimenzióban rekonstruálni emberek arcát és testét valamint valósághűen megjeleníteni a végtagok mozgását.