Emil Wallner, az eszköz meglakotója egyenesen odáig merészkedett, hogy a Palette-et, a "színezés Dall-E-jeként" aposztrofálta, amiben annyiban mindenképpen igaza van, hogy az OpenAI képgeneráló mesterséges intelligenciájához hasonlóan ő is a text-to-image (szövegből kép) módszert alkalmazta. Amíg azonban a Dall-E és más mesterséges intelligenciák képeket hoznak létre a beírt szöveg alapján, addig a Palette arra használja a természetes nyelvi feldolgozást, hogy valósághűen tudja kiszínezni a fotókat - írja a Petapixel.
Ennek a gyakorlatban is nagy hasznát tudjuk venni, persze csak abban az esetben, ha alapszinten beszélünk angolul. Hogy kiderítsük, mennyire végez jó munkát a program, néhány eredetileg színes fotót alakítottunk át fekete-fehérre, majd ezeket töltöttük fel a webes felületen, hogy megnézzük, a végeredmény mennyire hasonlít az eredetihez. A program alapvetően magától is felismeri, hogy mi szerepel a képeken, és ennek megfelelően színezi ki a fotókat, sőt, számos variációt is felajánl, amelyek közül kiválaszthatjuk a szerintük a valósághoz legközelebb álló változatot.
Valódi fekete-fehér képeknél ebben persze mindig lesz kisebb-nagyobb pontatlanság, hiszen ahogy arra Wallner is felhívja a figyelmet, az ilyen fotóknál a színek végérvényesen elvesztek, vagyis nem csak az MI, de még mi, emberek sem tudjuk száz százalékos pontossággal megmondani, hogy milyenek lehettek az eredeti színek. A Palette ennek megfelelően természetesen nem is volt képes tökéletesen újraalkotni az eredeti, színes fotókat, de azt el kell ismernünk, hogy mérföldekkel jobb munkát végzett, mint az interneten elérhető hasonló programok. Bár a San Franciscó-i villamosról készült fotón elég sok eltérés figyelhető meg az eredetihez képest, de ez igazán csak akkor feltűnő, ha a két képet egymás mellé rakjuk. (A képeken a bal oldalon látható az eredeti, a jobb oldalon pedig a Palette által rekonstruált fotó).
A Golden Gate híddal ugyanakkor eléggé meggyűlt a baja a programnak, ami sehogyan sem tudta kitalálni, hogy a hídnak narancssárgás-pirosas színűnek kéne lennie. Itt jön jól az, hogy a ceruza ikonra kattintva szabadon átírhatjuk a kép leírását, ugyanis miután megmondtuk az MI-nek, hogy itt egy piros hidat kéne látnia kék éggel a háttérben, már egészen színhelyesen sikerült rekonstruálnia az eredeti fotót.
Wallner szerint egyébként a program nem csak sokkal élethűbben színezi ki a képeket, mint a hasonló elven működő eszközök, de a napszaknak megfelelő fényviszonyokat is képes modellezni, vagyis ha a leírásban azt is megadjuk, hogy reggel vagy éppen naplemente van, akkor ezt is figyelembe fogja venni a retusáláskor. Ez a funkció még magát a készítőt is meglepte, hiszen állítása szerint célirányosan nem tanította a mesterséges intelligenciát a fényviszonyok modellezésére, de a gépi tanulás során a Palette valahogyan mégis elsajátította a funkciót.
(Fotó: Bobák Áron/Rakéta.hu)