Egyetlen képkockából készít videót a DeepMind új programja

2022 / 08 / 21 / Bobák Zsófia
Egyetlen képkockából készít videót a DeepMind új programja
Az MI képes előrejelezni, hogy hogyan nézhet ki egy-egy objektum különböző perspektívákból, így egyetlen kép is elég ahhoz, hogy rövid videókat generáljon.

A Google által felvásárolt DeepMind cég egyik legújabb programjának, a Transframernek neve az alkalmazás céljára utal: a transzformáció és a frame, vagyis filmkocka összevonásából született kifejezés jól mutatja, hogy mi is a Transframer fő rendeltetése - az, hogy egyetlen képet újabb szemszögekből mutasson be és ebből akár teljes videót állítson elő. Ehhez elsősorban arra van szüksége a programnak, hogy meghatározza, az adott felvételen szereplő tárgyak különféle perspektívákból hogyan is néznének ki, majd ez alapján további hasonló képeket generáljon.

A mesterséges intelligencia program betanítása során rengeteg képen gyakorlatoztatják a rendszert és a felhasznált adatbázisban olyan felvételek szerepelnek, amelyek hasonló tárgyakat más-más nézőpontokból is illusztrálnak. Ez alapján, a gépi tanulási folyamatok révén, a modellezés már egyetlen kép felhasználásával is működőképes. Eredményként a Transframer egyelőre harminc másodperces videókat képes generálni, főként természeti tájak vagy utcák és épületek szerepeltetésével.

A program nyolc különböző feladat végrehajtására képes, ezek között található többek között a képek osztályozása és szegmentációja, az új perspektívák szintézise és a videó interpolációja, amelyek együttesen járulnak hozzá a videók készítésének folyamatához. A képeket először a U-Net kódolóprogramja dolgozza fel, majd a kimeneti adatok a DCTransformerbe kerülnek. A Transframer által létrehozott mozgóképek bemutatott tesztpéldanyai egyelőre elég alacsony minőségű, homályos felvételek, de így is látszik, hogy a program milyen megoldásokat tud találni arra, hogy "megjósolja" az általa sem ismert látványt egészen kevés információból kiindulva.

(Fotó: Getty Images/DaveLongMedia)

Néhány szó alapján képes bármilyen képet létrehozni a Google mesterséges intelligenciája Az Imagen nem kevesebbet ígér, hogy képszerkesztői tudás nélkül is megalkothatunk bármilyen képet, akár fotorealisztikus minőségben is.


Műholdak figyelik a világot, de mit is látnak pontosan?
Műholdak figyelik a világot, de mit is látnak pontosan?
Éber szemek figyelik a világot az űrből a nap huszonnégy órájában. Az űrbeli sztrádák egyre jobban benépesülnek, és felmerülhet a kérdés, mennyire fejlett a mai műholdas technológia, és mit is látnak pontosan az űreszközök a magasból?
A csaló telefonhívásokon és a nem létező gázszámlákon túl –  7 módszer, amivel ellophatják az adatainkat az interneten
A csaló telefonhívásokon és a nem létező gázszámlákon túl – 7 módszer, amivel ellophatják az adatainkat az interneten
Az ESET kiberbiztonsági szakértői most összefoglalják, milyen módszerekkel lophatják el a személyes adatainkat – és mit tehetünk azért, hogy ez ne történhessen meg.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.