Képekké alakítja a szavakat az Nvidia algoritmusa

2021 / 11 / 26 / Bobák Áron
Képekké alakítja a szavakat az Nvidia algoritmusa
Az Nvidia 2019-ben mutatta be a GauGAN nevű mesterséges neurális hálózatát, amely már akkor is mindenkit lenyűgözött, hiszen a gépi tanulással betanított mesterséges intelligencia a legprimitívebb rajzokból is fotórealisztikus képeket tudott létrehozni. A GauGAN 2.0-val viszont a cég ennél is tovább ment, ugyanis a program már arra is képes, hogy néhány szó alapján kreáljon nekünk korábban nem létező képeket.

A videó elég világosan megmutatja, hogy miről van szó, igaz, az Nvidia azért némileg kiszínezte a valóságot, hiszen ahogy azt ide kattintva rögtön ki is próbálhatjuk, az algoritmus nem valós időben alakítja a képeket, hanem csak miután rákattintunk a renderelésre.

A fiktív tájképek megalkotásához a GauGAN 2 oldalán először be kell pipálnunk alul a dobozt, amivel elfogadjuk a felhasználási feltételeket, majd az input utilization sor mellett ki kell választanunk a "text" feliratot. Ezután kiválasztunk egy képet a jobb felső sorban, és miután angolul megadunk egy leírást, rá kell kattintanunk a jobbra mutató nyílra (render output). Mivel a neurális hálózatot tízezer tájképpel tanították be, így elsősorban olyan leírásokkal működik, amelyek az ilyen képekhez passzolnak; a "havas hegytető" és a "tengerpart éjjel" leírásra például nagyon meggyőző találatokat kaptunk, a "róka kalappal"-ra (a galériában az utolsó kép) viszont már annál kevésbé.

(Techspot)

További cikkek a témában:

Nézegessünk városokat, embereket és autókat, melyek nem léteznek, csak az MI hozta őket létre! Sosem létezett autók, emberek, akik meg sem születtek, véletlenszerűen generált bogarak. A mesterséges intelligencia összerak bármit: a cikkben közölt linkeken bepillanthatunk egy univerzumba, amely csak digitálisan létezik.

Mesterséges intelligencia mutatja meg, hogy nézhetett ki Van Gogh, Napóleon és a Mona Lisa a valóságban Vannak emberek, akiknek arcvonásait mind jól ismerjük, noha soha nem készült róluk fénykép. De vajon felismernénk-e őket, ha holnap szembe jönnének velünk az utcán?

Mintha tegnap történt volna, annyira jó minőségű ez a Hindenburg léghajó katasztrófájáról készült videó A 4K-s felbontású, színes felvételek láttán nem is gondolnánk, hogy már közel 85 éve történt a történelem egyik leghíresebb légi katasztrófája.


Így lettek a szexuális játékszerekből digitális kütyük
Így lettek a szexuális játékszerekből digitális kütyük
Lassan már senkit sem lep meg, hogy egy intim segédeszköznek legalább olyan jól kell tudnia csatlakoznia a wifihez vagy egy telefonhoz, mint a viselőjéhez, használójához.
Az embereknek valóban van hatodik érzékük - csak nem az, amire gondolnál
Az embereknek valóban van hatodik érzékük - csak nem az, amire gondolnál
Bizonyos felosztás szerint pedig akár több ezer érzéket is megkülönböztethetünk - igaz, a halottlátás nincs köztük.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.