Egyetlen képkockából készít videót a DeepMind új programja

2022 / 08 / 21 / Bobák Zsófia
Egyetlen képkockából készít videót a DeepMind új programja
Az MI képes előrejelezni, hogy hogyan nézhet ki egy-egy objektum különböző perspektívákból, így egyetlen kép is elég ahhoz, hogy rövid videókat generáljon.

A Google által felvásárolt DeepMind cég egyik legújabb programjának, a Transframernek neve az alkalmazás céljára utal: a transzformáció és a frame, vagyis filmkocka összevonásából született kifejezés jól mutatja, hogy mi is a Transframer fő rendeltetése - az, hogy egyetlen képet újabb szemszögekből mutasson be és ebből akár teljes videót állítson elő. Ehhez elsősorban arra van szüksége a programnak, hogy meghatározza, az adott felvételen szereplő tárgyak különféle perspektívákból hogyan is néznének ki, majd ez alapján további hasonló képeket generáljon.

A mesterséges intelligencia program betanítása során rengeteg képen gyakorlatoztatják a rendszert és a felhasznált adatbázisban olyan felvételek szerepelnek, amelyek hasonló tárgyakat más-más nézőpontokból is illusztrálnak. Ez alapján, a gépi tanulási folyamatok révén, a modellezés már egyetlen kép felhasználásával is működőképes. Eredményként a Transframer egyelőre harminc másodperces videókat képes generálni, főként természeti tájak vagy utcák és épületek szerepeltetésével.

A program nyolc különböző feladat végrehajtására képes, ezek között található többek között a képek osztályozása és szegmentációja, az új perspektívák szintézise és a videó interpolációja, amelyek együttesen járulnak hozzá a videók készítésének folyamatához. A képeket először a U-Net kódolóprogramja dolgozza fel, majd a kimeneti adatok a DCTransformerbe kerülnek. A Transframer által létrehozott mozgóképek bemutatott tesztpéldanyai egyelőre elég alacsony minőségű, homályos felvételek, de így is látszik, hogy a program milyen megoldásokat tud találni arra, hogy "megjósolja" az általa sem ismert látványt egészen kevés információból kiindulva.

(Fotó: Getty Images/DaveLongMedia)

Néhány szó alapján képes bármilyen képet létrehozni a Google mesterséges intelligenciája Az Imagen nem kevesebbet ígér, hogy képszerkesztői tudás nélkül is megalkothatunk bármilyen képet, akár fotorealisztikus minőségben is.


Tisztelt Cégvezető! Vegyen részt 5 perces üzleti felmérésünkben, és garantáltan 30 000 Ft értékű online marketing szolgáltatást kap ajándékba.
Emellett 2025. október 22-én további három, egyenként 100 000 Ft értékű marketingcsomagot is kisorsolunk a résztvevők között.
Négy nagyszerű balatoni bringatúra-útvonal, amit tekerj végig a csodás őszi időben
Négy nagyszerű balatoni bringatúra-útvonal, amit tekerj végig a csodás őszi időben
Ilyenkor tényleg minden lehetőséget meg kell ragadni és kiélvezni a szabadban eltöltött időt.
A gyűjtés mint befektetés és hobbi – miért izgalmas világ ez? Indul az Ínyenc befektető a Roadsteren!
A gyűjtés mint befektetés és hobbi – miért izgalmas világ ez? Indul az Ínyenc befektető a Roadsteren!
A Roadster és a Range Rover új sorozatot indít Ínyenc befektető címmel, ahol az olvasók velünk tarthatnak az old money különleges világába.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.