Régóta keringenek a nyugtalanító hírek a mesterséges intelligencia jövőbeli szerepéről, arról, hogy hogyan győzik le az embereket az élet egyre több területén, hogyan veszik el a munkahelyeket, vagy milyen mértékben függ majd a világ infrastruktúrája a jelenlétüktől, de a hírek gyakran némi túlzást is tartalmaznak, főképp, ha az MI történetét is figyelembe vesszük. Mikor elkezdték építeni az első mesterséges intelligencia rendszereket, a szakemberek már egy, az emberi tudással és képességekkel egy szintén álló gép pár évtizeden belüli megvalósításáról álmodoztak, de aztán szembetalálták magukat a kijózanító valósággal.
Csak a mostani században jutottak odáig a mélytanulási, a neurális hálózati vagy a big data rendszerekkel kapcsolatos fejlesztések, hogy az MI valóban hatékonnyá válhat és az élet sok területén segítséget nyújthat.
Megalapozottak a félelmek, hogy kiszorítanak minket a munkahelyeinkről? Vagy inkább örülünk kéne a megnyíló lehetőségek tárházának?
A Reuters hírügynökség és a velük együttműködő londoni MI startup, a Synthesia az újítás mellett döntöttek.
Tegnap mutatták be az ügynökség első teljes mértékben automatizált, MI által generált, de valós bemondót alkalmazó sport hírműsorát. Érdemes tisztázni, a valós bemondó alkalmazása nem azt jelenti, hogy a hírolvasó mesterséges intelligencia által létrehozott szöveget mond, hanem azt, hogy a hírolvasó nincs jelen, egy előre felvett részletekből egybegyúrt összeállítást láthatunk a szereplésével. A rendszer a deepfake videókhoz hasonlóan működik, ami rossz érzéseket kelthet, de a hírek valósak, mint ahogy a mintának használt bemondó személye is. A hír annyiban nem újdonság, hogy ehhez hasonló kísérletek már történtek, Kínában például már tavaly bemutatták a hírolvasó, Qui Hao digitális mását, azonban Európában még szokatlan lehet ez a technológia.
Hogyan készült?
“A rendszer két részből áll. Először is az algoritmus segítségével kombináljuk a Reuters valós idejű meccs fotóit és riportjait a percről percre frissülő hírfolyammal, ami mutatja, hogy mi is történt a játékban. Ez lehetővé teszi számunkra, hogy automatikusan generáljuk a szöveget bármilyen mérkőzés beszámolójához, kombinálva a szavakat, melyek vázolják az eseményt, a releváns képekkel.” - mondta Nick Cohen, a Reuters Core News Products vezetője - “Ezután a Synthesiával kollaborációban filmre vettük a sportszerkesztőnket, és a (Synthesia) technológiáját felhasználva megalkottuk az ő MI-generált verzióját, aki a szöveg akárhányféle változatát el tudja “olvasni” a megadott paramétereken belül.”
Vagyis a bemondó valódi szavaiból, gesztikulációiból, intonációjából születik meg az álriporter, aki nagyon is valódi híreket közöl, méghozzá akármennyit, akármikor.
Viktor Riparbelli, a Synthesia igazgatója a programot a hollywoodi filmek digitális trükkjeihez hasonlítja, melyet régóta alkalmaznak az álomgyárban, mely így még álomszerűbb lehet, mint valaha. “Nagyon közel áll ahhoz, amit Hollywoodban csinálnak, mikor létrehoznak egy digitális karaktert (gondoljunk csak Benjamin Buttonra, vagy a sci-fi filmek digitális szereplőire. Csak éppen, ahelyett, hogy hónapokig vagy évekig tartana egy jelenet leforgatása, mi megcsináljuk néhány óra alatt.”
A mostani még csak egy proof-of-concept, vagyis az ötlet működőképességét bizonyító prototípus, ami kizárólag sport közvetítésekkel foglalkozik, de a jövőben nagyon is megjelenhet a piacon, más területeken is áttörést hozva. “Izgatottak vagyunk, hogy kipróbálhatjuk az új módozatait az MI vezérelt hír élményeknek” - nyilatkozta Cohen- “ A technológia már a rendelkezésünkre áll, de még szeretnénk alaposan feltérképezni az etikai és fogyasztói megértéssel kapcsolatos kérdéseket, mielőtt kiadjuk a valódi termékünket.” A fogyasztók részéről pedig egyelőre még kérdéses, hogy milyen igények és aggodalmak merülnek fel az új technikát látva. A fejlesztők szerint a klasszikus esti hírműsorok élményét semmi nem válthatja fel, de nem is kimondottan ez a cél.
A lényeg a perszonalizáció, vagyis a személyre szabott hírtartalom.
Míg a humán bemondók szűkös fizikai korlátok közé vannak szorítva, így nem lehetséges számukra, hogy minden egyes eseményről beszámoljanak, a digitális hasonmásaik nem küzdenek ilyen problémákkal. A világ minden tájáról, bármilyen időpontban, bármilyen fogyasztói igényt kielégítve szállíthatják a tartalmat a nagyközönséghez, aki kedvére válogathat a tartalmak közül, úgy, ahogy az internetes híráradatban már megszokhatta, miközben nem kell lemondania az élményről, hogy mindezt a kedvenc műsorvezetője prezentálásában láthatja. Lényegében mi magunk lehetünk a műsor formálói, nagyobb szabadságot élvezve a tartalom kiválasztásában, mint a “régi” előre behatárolt rendszernél.
Így az MI generált programok hasonló forradalmat hozhatnak a hírműsorok világába, mint annak idején a Netflix típusú on-demand csatornák megjelenése a tévézés területén.
A Synthesia már korábban is alkotott hasonló tartalmakat, például a hindiül vagy arabul beszélő David Beckham videóját. Ahogy Viktor Riparbelli fogalmazott: “A mesterséges intelligencia által generált tartalmak a média világának sarokköveivé fognak válni az elkövetkező évtizedek során. Örülünk, hogy az új termékek fejlesztésének élén járhatunk. “
(Forrás: Reuters, Fotó: Peqsels, Pixabay)