Képekké alakítja a szavakat az Nvidia algoritmusa

2021 / 11 / 26 / Bobák Áron
Képekké alakítja a szavakat az Nvidia algoritmusa
Az Nvidia 2019-ben mutatta be a GauGAN nevű mesterséges neurális hálózatát, amely már akkor is mindenkit lenyűgözött, hiszen a gépi tanulással betanított mesterséges intelligencia a legprimitívebb rajzokból is fotórealisztikus képeket tudott létrehozni. A GauGAN 2.0-val viszont a cég ennél is tovább ment, ugyanis a program már arra is képes, hogy néhány szó alapján kreáljon nekünk korábban nem létező képeket.

A videó elég világosan megmutatja, hogy miről van szó, igaz, az Nvidia azért némileg kiszínezte a valóságot, hiszen ahogy azt ide kattintva rögtön ki is próbálhatjuk, az algoritmus nem valós időben alakítja a képeket, hanem csak miután rákattintunk a renderelésre.

A fiktív tájképek megalkotásához a GauGAN 2 oldalán először be kell pipálnunk alul a dobozt, amivel elfogadjuk a felhasználási feltételeket, majd az input utilization sor mellett ki kell választanunk a "text" feliratot. Ezután kiválasztunk egy képet a jobb felső sorban, és miután angolul megadunk egy leírást, rá kell kattintanunk a jobbra mutató nyílra (render output). Mivel a neurális hálózatot tízezer tájképpel tanították be, így elsősorban olyan leírásokkal működik, amelyek az ilyen képekhez passzolnak; a "havas hegytető" és a "tengerpart éjjel" leírásra például nagyon meggyőző találatokat kaptunk, a "róka kalappal"-ra (a galériában az utolsó kép) viszont már annál kevésbé.

(Techspot)

További cikkek a témában:

Nézegessünk városokat, embereket és autókat, melyek nem léteznek, csak az MI hozta őket létre! Sosem létezett autók, emberek, akik meg sem születtek, véletlenszerűen generált bogarak. A mesterséges intelligencia összerak bármit: a cikkben közölt linkeken bepillanthatunk egy univerzumba, amely csak digitálisan létezik.

Mesterséges intelligencia mutatja meg, hogy nézhetett ki Van Gogh, Napóleon és a Mona Lisa a valóságban Vannak emberek, akiknek arcvonásait mind jól ismerjük, noha soha nem készült róluk fénykép. De vajon felismernénk-e őket, ha holnap szembe jönnének velünk az utcán?

Mintha tegnap történt volna, annyira jó minőségű ez a Hindenburg léghajó katasztrófájáról készült videó A 4K-s felbontású, színes felvételek láttán nem is gondolnánk, hogy már közel 85 éve történt a történelem egyik leghíresebb légi katasztrófája.


Hello Szülő! Ha a gyereked nem tud valamit, akkor téged fog kérdezni. De ha te szülőként nem tudsz valamit, akkor kihez fordulsz?
A digitális kor szülői kihívásairól is találhattok szakértői tippeket, tanácsokat, interjúkat, podcastokat a Telekom családokat segítő platformján, a https://helloszulo.hu/ oldalon.
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Repül már a vén diák. Hová? Hová?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.