A Google megalkotta a videókészítés varázspálcáját, de még nem adja a felhasználók kezébe

2024 / 01 / 31 / Bobák Áron
A Google megalkotta a videókészítés varázspálcáját, de még nem adja a felhasználók kezébe
Csak beírod, hogy mit szeretnél látni, a Lumiére pedig legenerálja neked a tökéletesen élethű videót - ígéri a Google, igaz, mivel a szolgáltatás nyilvánosan még nem elérhető, ezért erről egyelőre csak kevesen győződhetnek meg a saját szemükkel.

A mozgókép úttörőiről, vagyis a Lumiére-fivérekről elnevezett mesterséges intelligencia tulajdonképpen ugyanazt tudja, mint a Midjourney vagy a DALL-E, csakhogy ez a beírt szavakból már nem képeket, hanem komplett videókat generál - a Google által néhány napja közzétett tanulmány alapján egészen forradalmi módon. Bár hasonló szövegből-videó szolgáltatások már eddig is léteztek, ám a Lumiére a Space-Time U-Net nevű neurális hálózat segítségével egy folyamatban hozza létre a teljes videót, így a végeredmény - a készítők állítása szerint - sokkal valósághűbb, mint a ma is létező modellek esetében.

A Lumiére a ChatGPT-hez hasonlóan a természetes nyelvi feldolgozás segítségével képes értelmezni a felhasználó által beírt szavakat, ez alapján pedig teljesen egyedi videókat generálni. A Google által közzétett videó alapján az MI emellett számos más funkcióval is rendelkezik, amelyek a következők:

  • Képes módosítani egy már létező videóban szereplő objektumokat, például megváltoztatni egy ruha mintázatát.

  • Egy előre megadott kép és a hozzá kapcsolt utasítás alapján képes animálni az állóképeket vagy azok egy bizonyos részletét.

  • És egy referenciakép alapján képes bármilyen videót létrehozni a megadott kép stílusában.

Azt egyelőre nem lehet tudni, hogy a Google tervezi-e, hogy a Lumiére-t szabadon elérhetővé tegyék a nagyközönség számára, az viszont elég valószínűnek tűnik, hogy ha így is lesz, nem fogják elsietni a dolgot. A vállalat egyelőre a szövegből képet generáló, Imagen 2 névre keresztelt mesterséges intelligenciáját sem tette szabadon hozzáférhetővé annak ellenére, hogy nyilvánvalóan nagy a kísértés, hiszen a hasonló programok, mint a Midjourney, a Stable Diffusion vagy a DALL-E jóideje hatalmas népszerűségnek örvendenek a felhasználók körében.

A Google óvatossága érthető, hiszen amikor az internet éppen Taylor Swift hamis pornóképeitől hangos, a szakértők pedig évek óta kongatják a vészharangot a deepfake videók veszélyei miatt, a világ egyik legnagyobb technológiai vállalatának nem kis kockázatot jelentene egy olyan eszköz terjesztése, ami - nem megfelelően tesztelve - súlyos visszaélésekre adhat lehetőséget. Néhány héttel ezelőtt a Google vezérigazgatója, Sundar Pichai is arról beszélt a Wirednek adott nagyinterjúban, hogy szándékosan óvatosabbak, amikor a mesterséges intelligenciáról van szó, mert ők is érzik, hogy mekkora felelősség hárul rájuk. A Google vezére ehhez azt is hozzátette, hogy mivel az MI "technológiai íve hosszú", ezért nem igazán számít, hogy rövid távon kinek sikerül előnyt szereznie a területen, és személy szerint "elégedett azzal, ahol jelenleg tartanak".

A ChatGPT-t is lenyomja - állítja a Google az új mesterséges intelligenciájáról A Google szerdán mutatta be a Gemini névre keresztelt nagy nyelvi modelljét, amit azonnal integráltak is a Bard chatbotba.


Robotlázadás zajlott le Kínában - egy robot megszöktetett tizenkét másikat
Robotlázadás zajlott le Kínában - egy robot megszöktetett tizenkét másikat
Úgy tűnik, hogy a robotforradalom elkezdődött, de az egész esemény valójában egy teszt volt.
Instant üzleti nyelvvizsga vagy bábeli zűrzavar: jövőre érkezik az automata szinkrontolmácsolás a Teams-be
Instant üzleti nyelvvizsga vagy bábeli zűrzavar: jövőre érkezik az automata szinkrontolmácsolás a Teams-be
De nem csak ezzel tenné hatékonyabbá az online megbeszéléseket a Microsoft.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.