Egyetlen képkockából készít videót a DeepMind új programja

2022 / 08 / 21 / Bobák Zsófia
Egyetlen képkockából készít videót a DeepMind új programja
Az MI képes előrejelezni, hogy hogyan nézhet ki egy-egy objektum különböző perspektívákból, így egyetlen kép is elég ahhoz, hogy rövid videókat generáljon.

A Google által felvásárolt DeepMind cég egyik legújabb programjának, a Transframernek neve az alkalmazás céljára utal: a transzformáció és a frame, vagyis filmkocka összevonásából született kifejezés jól mutatja, hogy mi is a Transframer fő rendeltetése - az, hogy egyetlen képet újabb szemszögekből mutasson be és ebből akár teljes videót állítson elő. Ehhez elsősorban arra van szüksége a programnak, hogy meghatározza, az adott felvételen szereplő tárgyak különféle perspektívákból hogyan is néznének ki, majd ez alapján további hasonló képeket generáljon.

A mesterséges intelligencia program betanítása során rengeteg képen gyakorlatoztatják a rendszert és a felhasznált adatbázisban olyan felvételek szerepelnek, amelyek hasonló tárgyakat más-más nézőpontokból is illusztrálnak. Ez alapján, a gépi tanulási folyamatok révén, a modellezés már egyetlen kép felhasználásával is működőképes. Eredményként a Transframer egyelőre harminc másodperces videókat képes generálni, főként természeti tájak vagy utcák és épületek szerepeltetésével.

A program nyolc különböző feladat végrehajtására képes, ezek között található többek között a képek osztályozása és szegmentációja, az új perspektívák szintézise és a videó interpolációja, amelyek együttesen járulnak hozzá a videók készítésének folyamatához. A képeket először a U-Net kódolóprogramja dolgozza fel, majd a kimeneti adatok a DCTransformerbe kerülnek. A Transframer által létrehozott mozgóképek bemutatott tesztpéldanyai egyelőre elég alacsony minőségű, homályos felvételek, de így is látszik, hogy a program milyen megoldásokat tud találni arra, hogy "megjósolja" az általa sem ismert látványt egészen kevés információból kiindulva.

(Fotó: Getty Images/DaveLongMedia)

Néhány szó alapján képes bármilyen képet létrehozni a Google mesterséges intelligenciája Az Imagen nem kevesebbet ígér, hogy képszerkesztői tudás nélkül is megalkothatunk bármilyen képet, akár fotorealisztikus minőségben is.


A takaró alatt is rengeteg TECHNOLÓGIAI KALAND vár, nézz körül, hol tart ma a SZEXIPAR, és tedd az idei karácsonyt emlékezetessé!
Nézz körül a Vágyaim.hu kínálatában, használd a PLYR20 kuponkódot és legyen az idei karácsony olyan, mint még soha!
A jövő, ahol 100 az új 60 - a hosszú élet titka egyszerűbb, mint gondolnánk
A jövő, ahol 100 az új 60 - a hosszú élet titka egyszerűbb, mint gondolnánk
Titkos fegyver az öregedés ellen - forradalmi szolgáltatás, ami Magyarországról indult
Sárkányfióka: az új AI-modell a hiányzó láncszem ember és gép között
Sárkányfióka: az új AI-modell a hiányzó láncszem ember és gép között
Az emberi agy működését utánzó, Sárkányfióka névre keresztelt új AI-architektúra a fejlesztők szerint a hiányzó láncszem lehet a mai chatbotok és az általános mesterséges intelligencia között.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.