Az OpenAI idén februárban jelentette be a Sora nevű videógenerátorát, amely puszta szöveges utasítások alapján képes teljesen egyedi mozgóképeket létrehozni. Az alkalmazás eddig csak egy szűk kör számára volt elérhető (akik közül volt, aki ki is szivárogtatta azt), de Sam Altman cége hétfőn végre nyilvánosan is elérhetővé tette a szolgáltatást azok számára, akik rendelkeznek ChatGPT előfizetéssel.
Hogy a Sora a saját területén ugyanakkora siker lesz-e, mint a ChatGPT, azt még nem lehet tudni, mindenesetre tény, hogy az OpenAI a halogatással elég rendesen magára húzta a konkurenciát: a Sora februári bejelentése óta többek között a Kling AI, a Dream Machine és a RunwayML Gen-3 Alpha is nyilvánosan elérhetővé vált, amelyekkel szintén rendkívül jó minőségű videókat lehet generálni, azonban a felhasználók által eddig közzétett videók alapján az nyilvánvaló, hogy az OpenAI videógenerátora így is a legjobbak közé tartozik.
This is wild.
OpenAI just dropped Sora, their state-of-the-art AI video model.
The video quality looks insane.
100% AI, these are not real.
1. 80s Japan Harajuku fashion street pic.twitter.com/Q8xXIbdP4z— Min Choi (@minchoi) December 9, 2024
2. Not real news, 100% AIpic.twitter.com/43OYzkZdbW
— Min Choi (@minchoi) December 9, 2024
3. Soulful monkey serenity pic.twitter.com/u40j1A2gUz
— Min Choi (@minchoi) December 9, 2024
A Sora Turbo a ChatGPT Plus valamint Pro előfizetők számára érhető el, akik tokenekért cserébe generálhatnak videókat legfeljebb 20 másodperces hosszúságban és Full HD felbontásban. A havi 20 dollárért elérhető ChatGPT Plus előfizetők havonta 1000 tokent kapnak, ami az OpenAI tájékoztatása szerint 50 darab, 420p-s felbontású videó generálására elegendő, míg a frissen bejelentett, 200 dolláros havidíjért elérhető Pro előfizetéssel 10000 token jár, amivel 500 darab, 20 másodperc hosszúságú Full HD videót lehet generálni. A Pro előfizetőknek emellett rendelkezésükre áll az úgynevezett "nem prioritizált" videógenerálás is, ami azt jelenti, hogy ugyan sokkal lassabban, de akármennyi videót készíthetnek a Sorával.
7. Marketplace pic.twitter.com/8VM6QB0X4I
— Min Choi (@minchoi) December 9, 2024
Sora — "A golden retriever, with a shiny wet coat, skillfully balances on a surfboard as it rides a gentle wave at Pacifica Beach. The dog's tongue hangs out in excitement, and its eyes are focused on the horizon. The backdrop includes the wide expanse of the ocean with rolling… pic.twitter.com/s5epk81RvB
— edwin (@edwinarbus) December 9, 2024
It can be REALLY good at landscapes. Almost any drone shot of a significant landmark could pass for stock footage or is VERY close to usable for an establishing shot in a documentary or low budget film pic.twitter.com/nY4khuVP4T
— Marques Brownlee (@MKBHD) December 9, 2024
Turns out if can do a passable job with cartoon-style or stop-motion style, since the irregularities in movement/physics appear more stylistic pic.twitter.com/Uu9CuFPsY8
— Marques Brownlee (@MKBHD) December 9, 2024
A szolgáltatás a szöveges leírások mozgóképpé alakítása mellett számos más érdekes funkcióval is rendelkezik, például a meglévő felvételeinket is átfazonírozhatjuk vele, emellett arra is képes, hogy két, egymástól független videóból hozzon létre egy mozgóképet.
Sora's "Blend" option might be my favorite feature so far. I wanted to see how it would handle two very different shots. pic.twitter.com/eqj5pPxPbb
— Blaine Brown (@blizaine) December 9, 2024
Bár a Sora a legtöbb esetben valóban zseniális, a valóságtól szinte megkülönböztethetetlen videókat készít, ahogy arra Marques Brownlee rámutatott, néhány esetben azért eléggé mellé tud nyúlni a fizikával, így a végeredmény átmegy szürreálisba.
It's still a prodcut though, with pros and cons - and one of the cons is physics is still hard. Without an "understanding" of the objects in the video, the model is still prone to "hallucinations" in the form of movements that don't make sense, and lack of object permanence.… pic.twitter.com/iNth76c33l
— Marques Brownlee (@MKBHD) December 9, 2024
Ahogy azt már előre tudni lehetett, a Sora az Európai Unió országaiban és Nagy-Britanniában egyelőre nem elérhető, és bár az OpenAI ennek okaira nem tért ki, a háttérben valószínűleg ugyanaz áll, mint például a ChatGPT Speciális Hang mód vagy az Apple Intelligence csúszásának az esetében, vagyis hogy a szigorúbb jogszabályok miatt a cégek az EU-ban óvatosabban vezetik be az új termékeiket.