Képekké alakítja a szavakat az Nvidia algoritmusa

2021 / 11 / 26 / Bobák Áron
Képekké alakítja a szavakat az Nvidia algoritmusa
Az Nvidia 2019-ben mutatta be a GauGAN nevű mesterséges neurális hálózatát, amely már akkor is mindenkit lenyűgözött, hiszen a gépi tanulással betanított mesterséges intelligencia a legprimitívebb rajzokból is fotórealisztikus képeket tudott létrehozni. A GauGAN 2.0-val viszont a cég ennél is tovább ment, ugyanis a program már arra is képes, hogy néhány szó alapján kreáljon nekünk korábban nem létező képeket.

A videó elég világosan megmutatja, hogy miről van szó, igaz, az Nvidia azért némileg kiszínezte a valóságot, hiszen ahogy azt ide kattintva rögtön ki is próbálhatjuk, az algoritmus nem valós időben alakítja a képeket, hanem csak miután rákattintunk a renderelésre.

A fiktív tájképek megalkotásához a GauGAN 2 oldalán először be kell pipálnunk alul a dobozt, amivel elfogadjuk a felhasználási feltételeket, majd az input utilization sor mellett ki kell választanunk a "text" feliratot. Ezután kiválasztunk egy képet a jobb felső sorban, és miután angolul megadunk egy leírást, rá kell kattintanunk a jobbra mutató nyílra (render output). Mivel a neurális hálózatot tízezer tájképpel tanították be, így elsősorban olyan leírásokkal működik, amelyek az ilyen képekhez passzolnak; a "havas hegytető" és a "tengerpart éjjel" leírásra például nagyon meggyőző találatokat kaptunk, a "róka kalappal"-ra (a galériában az utolsó kép) viszont már annál kevésbé.

(Techspot)

További cikkek a témában:

Nézegessünk városokat, embereket és autókat, melyek nem léteznek, csak az MI hozta őket létre! Sosem létezett autók, emberek, akik meg sem születtek, véletlenszerűen generált bogarak. A mesterséges intelligencia összerak bármit: a cikkben közölt linkeken bepillanthatunk egy univerzumba, amely csak digitálisan létezik.

Mesterséges intelligencia mutatja meg, hogy nézhetett ki Van Gogh, Napóleon és a Mona Lisa a valóságban Vannak emberek, akiknek arcvonásait mind jól ismerjük, noha soha nem készült róluk fénykép. De vajon felismernénk-e őket, ha holnap szembe jönnének velünk az utcán?

Mintha tegnap történt volna, annyira jó minőségű ez a Hindenburg léghajó katasztrófájáról készült videó A 4K-s felbontású, színes felvételek láttán nem is gondolnánk, hogy már közel 85 éve történt a történelem egyik leghíresebb légi katasztrófája.


A személyesség luxusa: így lesz az ajándékból igazi emlék
A személyesség luxusa: így lesz az ajándékból igazi emlék

A karácsonyi ajándékozás az egyik legnehezebb műfaj. Na nem azért, mert ne lenne miből választani… épp ellenkezőleg! Sok a lehetőség, közben sok az elvárás, mégis valahogy eltűnik a lényeg, mégpedig az, hogy a figyelmünket adjuk. Karácsony előtt mindig ugyanaz a kérdés kering a fejemben: vajon mit adjak annak, akinek tényleg szeretném megmutatni, hogy mennyire fontos nekem?

Őszi stílus, határozott karakterrel – megérkezett a Beverly Hills Polo Club legújabb kollekciója
Őszi stílus, határozott karakterrel – megérkezett a Beverly Hills Polo Club legújabb kollekciója
Pontosan erre az időszakra készült: magabiztos, kényelmes és kortalan darabokkal, amelyek egyszerre működnek a hétköznapokban és az elegánsabb alkalmakon is.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.