Talán eszünkbe sem jutna, hogy a deepfake ilyen is lehet
2020 / 02 / 17 / Perei Dóra
Talán eszünkbe sem jutna, hogy a deepfake ilyen is lehet
A deepfake korában már nem hihetünk sem a saját fülünknek, sőt még a szemünknek sem, hiszen a hamis valóság mindent alááshat, amit eddig tényként kezeltünk. De vajon biztos csak hátrányunk származhat a technológiából?

Legtöbben bizonyára emlékeznek a Buzzfeed felvételére Barack Obama rendkívül meggyőző deepfake-jéről, amit nem mellesleg több mint ötmillióan láttak. Pedig a valós idejű videós beszéd- és képmanipuláció térhódítása már 2016-ban elindult, onnantól kezdve pedig voltaképp nincs megállás; 2017 szeptemberében a Lyrebird AI egy hamis Trump-beszéddel népszerűsítette saját hangmanipuláló szoftverét; míg a GAN (generatív ellenséges hálózatok) ma már emberi beavatkozás nélkül is összetett mozgásokat ültetnek át egyik videóról a másikra.

"Zseniként nem halhatsz meg, elvégre az emberiség fejlődésének szükséges része vagy."

A fenti idézet Salvador Dalí utolsó nyilvános felszólalásán hangzott el, akinek akkoriban nyilván fogalma sem volt róla, hogy egy nap majd gépi intelligencián alapuló algoritmussal 'feltámasztják'. Merthogy pontosan ez történt a floridai St. Petersburg Dalí Múzeumában.

A művész életre keltése gépi önfejlesztő videószerkesztő algoritmussal történt, melynek során több ezer archív felvételt felhasználtak, az algoritmus pedig mintegy ezer órányi tanulás után tökéletesen lemásolta Dalí mimikáját. Arckifejezéseit ezután egy élő színészre vetítették, a végeredmény pedig hátborzongató. Különösen az a rész, amikor így szól: "Jó újra itt." A látogatóknak pedig szemlátomást bejön az új Dalí, aki ráadásul szelfizik is velük, ha kérik. A deepfake tehát hatalmas (üzleti) lehetőségeket is rejthet, már ha jóra használják. Mondjuk így:

Nemzetközi piacok könnyebb meghódítása

A Synthesia nevű cég előnyt kovácsolt a kép- és hangmanipulációból, és arra használja, hogy ügyfelei legkülönbözőbb üzleti igényeit is kielégítse. A "No More Malaria" kampányban például David Beckham kilenc nyelven hívja fel a figyelmet a kór veszélyeire. A gépi intelligencián alapuló megoldással bármely vállalat bármely szolgáltatása elérhet a világon bárhová, elég csupán kiválasztani a célcsoport nyelvét. Röviden tömören: gyerekjáték lesz a nemzetközi piacok meghódítása.

Testközelbe hozza a történelmet

1963. november huszonkettedikén John F. Kennedy amerikai elnök merénylet áldozata lett, ezért utolsó dallas-i beszéde nem kerülhetett azonnal nyilvánosság elé. Hála a deepfake technológiának és a CereProc vállalatnak, ma már ezt is meghallgathatjuk; a tökéletes hangutánzáshoz a szakértők nyolcszázharmincegy Kennedy beszédet elemeztek, amiket aztán száztizenhatezer-százhetvenhét fonetikai egységre bontottak. A komoly kihívást jelentő feladatot még nehezebbé tette a tény, hogy a felvételeket különféle készülékekkel, különböző időpontokban készültek.

Visszaadhatja a betegek hangját

Az ALS (amiotrófiás laterálszklerózis) egy gyógyíthatatlan motoros, izomsorvadással járó neuronbetegség, ami mind fizikailag, mind lelkileg nagyon megterhelő. (Stephen Hawking is ALS-ben szenvedett.) Az izomsorvadás következtében az érintettek idővel szinte teljesen elvesztik az irányítást saját testük felett, ami általában együtt jár a hangaszalagok lebénulásával. Ha pedig mindez nem lenne elég, a lelki traumát tovább tetézi, hogy a beteg ezentúl csak írásban, vagyis közvetetten gépi hangon kommunikálhat.

Az amerikai ALS Szervezet ezért 2018-ban elindította "Project Revoice" kezdeményezését, melynek során hangmanipulációt alkalmaztak, egy Pat nevű férfi pedig ennek köszönhetően visszakapta a hangját. Mivel nem az ALS az egyetlen hasonló betegség, a deepfake elterjedése az orvostudományban is áttörést hozhat.

Mi lehetünk a videojátékok főszereplői

A dél-koreai NCSoft videojáték-gyártó kutatói gépi tanulás útján elérték, hogy igazi anime karakterekké változtassanak minket. Programjuk, a már említett GAN architektúrára épül, ami dinamikusan alakítja át a részleteket. Az MI-vel dolgozó  szoftver kódját az NCSoft fejlesztői Junho Kim, Minjae Kim, Hyeonwoo Kang és Kwanghee Lee tavaly nyáron mutatta be a a GitHub-on.

A transzformálás lényegében úgy történik, hogy a szoftver rétegekre bontja, majd osztályozza a betáplált fotó legfontosabb elemeit. Példának okáért pontos különbséget tud tenni kutya vagy macska szőr, illetve szeme és fül között. A dolog ráadásul nem merül ki ennyiben, a technológia ugyanis képes akár lovakból zebrát, macskákból kutyát, vagy egyszerű képekből VanGogh stílusú alkotást varázsolni.

(Fotó: Getty Images Hungary)


Kövesd a Rakétát a Facebookon is!
Kövess, üzenj, kommentelj a Rakéta Facebook oldalán!
Ismerd meg a ROADSTER magazint!
AUTÓK - DESIGN - GASZTRO - KULT - UTAZÁS - TECH // Ha szereted a minőséget az életed minden területén, páratlan élmény lesz!
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!

Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.