Egyetlen képkockából készít videót a DeepMind új programja

2022 / 08 / 21 / Bobák Zsófia
Egyetlen képkockából készít videót a DeepMind új programja
Az MI képes előrejelezni, hogy hogyan nézhet ki egy-egy objektum különböző perspektívákból, így egyetlen kép is elég ahhoz, hogy rövid videókat generáljon.

A Google által felvásárolt DeepMind cég egyik legújabb programjának, a Transframernek neve az alkalmazás céljára utal: a transzformáció és a frame, vagyis filmkocka összevonásából született kifejezés jól mutatja, hogy mi is a Transframer fő rendeltetése - az, hogy egyetlen képet újabb szemszögekből mutasson be és ebből akár teljes videót állítson elő. Ehhez elsősorban arra van szüksége a programnak, hogy meghatározza, az adott felvételen szereplő tárgyak különféle perspektívákból hogyan is néznének ki, majd ez alapján további hasonló képeket generáljon.

A mesterséges intelligencia program betanítása során rengeteg képen gyakorlatoztatják a rendszert és a felhasznált adatbázisban olyan felvételek szerepelnek, amelyek hasonló tárgyakat más-más nézőpontokból is illusztrálnak. Ez alapján, a gépi tanulási folyamatok révén, a modellezés már egyetlen kép felhasználásával is működőképes. Eredményként a Transframer egyelőre harminc másodperces videókat képes generálni, főként természeti tájak vagy utcák és épületek szerepeltetésével.

A program nyolc különböző feladat végrehajtására képes, ezek között található többek között a képek osztályozása és szegmentációja, az új perspektívák szintézise és a videó interpolációja, amelyek együttesen járulnak hozzá a videók készítésének folyamatához. A képeket először a U-Net kódolóprogramja dolgozza fel, majd a kimeneti adatok a DCTransformerbe kerülnek. A Transframer által létrehozott mozgóképek bemutatott tesztpéldanyai egyelőre elég alacsony minőségű, homályos felvételek, de így is látszik, hogy a program milyen megoldásokat tud találni arra, hogy "megjósolja" az általa sem ismert látványt egészen kevés információból kiindulva.

(Fotó: Getty Images/DaveLongMedia)

Néhány szó alapján képes bármilyen képet létrehozni a Google mesterséges intelligenciája Az Imagen nem kevesebbet ígér, hogy képszerkesztői tudás nélkül is megalkothatunk bármilyen képet, akár fotorealisztikus minőségben is.


Ha fotós csúcstelefont keresel, a Xiaomi 15 sorozatnál ne keress tovább!
Ha fotós csúcstelefont keresel, a Xiaomi 15 sorozatnál ne keress tovább!
Legújabb modelljeivel egyenesen a csúcskategória élét vette célba a Xiaomi, a Leica kamerás Xiaomi 15 Ultra ugyanis új szintre emeli a telefonos fotózást és videózást, a kompakt Xiaomi 15 pedig még jobb áron adja egy csúcskészülék tudását.
„Ez a futás nemcsak a testünknek, a lelkünknek is jót tesz!” – Dupla körös futásokkal és kibővült charity programmal jön az NN Ultrabalaton
„Ez a futás nemcsak a testünknek, a lelkünknek is jót tesz!” – Dupla körös futásokkal és kibővült charity programmal jön az NN Ultrabalaton
Rendhagyó formában érkezik a közkedvelt futóverseny, még több jótékony célt támogat meg a BioTechUSA NN Ultrabalaton Charity keretében.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.