A TikTok egy kínai fejlesztésű videómegosztásra épülő közösségi applikáció, amit a ByteDance, egy pekingi székhelyű cég fejlesztett. Az applikáció segítésével rövid (3-15 másodperc hosszú) videókat vagy valamivel hosszabb (legfeljebb egyperces) loopolt videókat lehet közzétenni. Ezeken különböző mutatványokat, érdekességeket, állatokat, mémeket és hasonló, jellemzően szórakoztató tartalmat láthatnak a felhasználók. A TikTok kezdetben csak Kínában volt elérhető Douyin néven. A Douyint az ázsiai országban 2016 szeptemberétől lehetett letölteni. 2017-ben pedig már megjelent TikTok néven mind Android, mind iOS platformokra, ám globálisan csak azután vált igazán hozzáférhetővé, hogy összeolvadt egy másik, szintén rövid videók megosztására használt, kínai szolgáltatással: a Musical.ly-vel. Erre 2018-ban került sor.
A 2012-ben alapított ByteDance relatíve fiatal cég még a technológiai szektorban is. Sikerességét pedig mi sem bizonyítja jobban, mint hogy a konkurens szolgáltatások közt piacvezető. A cég ráadásul magasan kiemelkedik a mezőnyből: 60 ezer alkalmazottal és évi 19,3 milliárd dolláros bevételével simán lekörözi a listán utána következő három céget együtt. A második helyen álló Instagram például évente mindössze 6,8 milliárd dollárt termel. De a ByteDance bőven ráver olyan ismertebb vállalatokra, mint a YouTube vagy a Twitter. Amennyiben csak a TikTokot nézzük: ezt az applikációt globálisan 2 milliárdan töltötték le és 800 millió aktív felhasználóval büszkélkedhet. Ezen paramétereket tekintve (letöltés és aktív felhasználók száma) egyedül csak a Facebook, a Messenger és a Whatsapp előzi meg. Ám emlékezzünk, hogy ez az alkalmazás világszinten csak 2018 óta elérhető. Kérdés tehát, hogy mitől lett a TikTok (illetve a mögötte álló vállalat) ennyire sikeres pár év alatt?
A ByteDance-nek nem csak a TikTok az egyetlen terméke, sőt nem kizárólag videómegosztásban utaznak. Ugyanakkor ez az alkalmazásuk a legismertebb, és a politikai légkör, valamint az ebből fakadó médiaérdeklődés miatt ez áll jelenleg a fókuszban. A TikTok/Douyin sikere pedig két fő összetevővel magyarázható. Egyrészt a ByteDance még ügyesen, idejekorán (a globális piacra lépés előtt) összeolvadt az egyetlen releváns konkurenciával, a tehát szintén kínai Musical.ly-vel. A második ok azonban a legfontosabb számunkra, ugyanis ebből egy sor dolog következhet (illetve jó eséllyel következik is nem olyan sokára) a jövőnkre nézve. Ez pedig, ahogy egy kínai befektető megfogalmazta:
„A TikTok az első olyan széles felhasználói bázisnak szánt applikáció, ahol maga a mesterséges intelligencia a termék.”
Ahhoz, hogy beszélgethessünk a TikTok mögött dohogó algoritmusról, nem árt megismerkednünk magával az applikációval. Amennyiben letöltjük a TikTokot, létre kell hoznunk egy fiókot, de bejelentkezhetünk már létező alkalmazással, például Google-fiókkal. Ezt követően egy listán kiválaszthatjuk az érdeklődési köreinket, majd indul is a menet. Maga az akció a kezdőoldalon zajlik, ahol látszólag véletlenszerűen adagol nekünk az MI videókat. Ha egy nem tetszik, vagy már unjuk, akkor felfelé húzzuk a képernyőt, és már lépünk is a következőre. Emellett lehetőségünk van lájkolni az adott tartalmat, sőt akár követhetjük is a feltöltőt.
Nagyjából úgy lehet talán a legkönnyebben elképzelni, mint a YouTube és a Twitter szerelemgyerekét, vagyis a feedünkben rövid videók jelennek meg (mint a Twitteren a rövid posztok) azonban annyi különbség akad, hogy egyrészt – inkább a YouTube-hoz hasonlóan – nem csak az ismerőseink/az általunk követett tartalomgyárosok videóit látjuk, hanem az érdeklődési körünknek megfelelőeket (erről később), másrészt – és ez talán nem nyilvánvaló – mindenképpen adnunk kell valami reakciót a videóra. Ez nem feltétlen egy lájkot jelent, hanem mindössze akár annyit, hogy milyen gyorsan húzzuk feljebb a képernyőt, tehát váltunk át egy másik videóra.
A TikTok egyik fontos újítása tehát, hogy a felhasználói értékelésünket annyira könnyeddé, észrevétlenné tette az eddigi megoldásokhoz képest, mint mondjuk – hogy egy ősemberhez illő hasonlatot mondjak – a Windows a szoftverek elérését a DOS-hoz képest.
Azt tehát már látjuk, hogy akár egyetlen felhasználó pár perc alatt is rengeteg visszajelzést, ha úgy tetszik: adatot generál az MI számára. Márpedig jelenleg, mikor még a roppant adatéhes, nehezen tanuló MI-k korszakában járunk, az adat az egyik (ha nem A) legértékesebb nyersanyag. Valójában a sikerhez két kulcskérdést kell egy-egy alkalmazás fejlesztőinek megválaszolnia: miként lehet minél több felhasználói adathoz jutni, és aztán mihez kezdünk ezekkel? Az első kérdést a TikTok forradalmian válaszolta meg: olyan egyszerű interfészt kreált, amilyen egyszerű az érintőképernyők korában csak elképzelhető. Ám emögött egy mindent figyelő, nagyon is komplex mesterséges intelligencia működik.
Érdemes tisztázni, hogy amint a mesterséges intelligenciára és a háttérben kalkuláló algoritmusokra terelődik a szó, a ByteDance átmegy karthauzi szerzetesbe. Ez olyannyira igaz, hogy most amikor a vállalat amerikai fennmaradásról van szó, az Oracle-lel (a Microsoft után ők jöttek szóba potenciális amerikai partnerként) kötendő üzlet is épp emiatt került veszélybe. Úgy tűnik ugyanis, hogy amennyiben az Oracle válik tulajdonossá, nekik alapról kell felépíteniük (bár ebben a TikTok mérnökei segíthetnek) az MI-t, mivel a ByteDance nem adja ki a már meglévőt. Sőt mindez nem is a ByteDance, hanem inkább a kínai kormány rendelkezése, akik megtiltották a mesterséges intelligenciák exportját az ázsiai országból. Mivel pedig a TikTok algoritmusa kínai fejlesztés, ez a tilalom nem csak igaz rá, de valószínű, hogy épp a mostani üzlet miatt született meg.
Hiába hétpecsétes titok azonban maga az MI, a működése alapján egy-két dolgot megtudhatunk róla. Azonban, hogy ezt megérthessük, nézzük meg, mi történik egy videóval a feltöltés után!
A TikTok egy jól átgondolt, alaposan megtervezett, de lényegét tekintve gyártósor, ahol komplex mechanikák határozzák meg, hogy mi kerül egy-egy felhasználó képernyőjére. Amennyiben videót töltünk fel, az első lépés, pontosabban a nulladik lépés, hogy működésbe lép a Duo-Audit (kettős vizsgálati) rendszer. Ennek kidolgozására azért került sor, mert a ByteDance a tartalmak miatt már megütötte jó párszor a bokáját. Kínában például már szép kis büntetéseket fizetett ki pornográf tartalmak miatt. Amerikában a Federal Trade Commission 13 éves kor alattiak adatgyűjtésére vonatkozó rendelete miatt futott pofonba, és fizetett 5,7 millió dolláros büntetést (ez az a rendelet, ami miatt a YouTube is változtatott a működésén). Indiában és Indonéziában pedig egy időre be is tiltották az applikációt.
A Dou-Audit-rendszer ezt követően került bevezetésre. Ez – mint a neve mutatja – egy hibrid vizsgálati rendszer, amely részben a mesterséges intelligenciára, részben az emberi szemre alapszik. Lényegében arról van szó, hogy a feltöltött tartalmat először az MI ellenőrzi gépi látással elemezve a képsorokat, amit pedig az algoritmus megjelöl, az további vizsgálatra kerül az emberi cenzorok elé. Amennyiben a videó mindennek megfelelt, felkerül a TikTok rendszerébe.
Ezt követően kerül sor a valódi, első lépésre, amit Cold Startnak nevezünk. Ez azt jelenti, hogy kezdetben csak egy szűkebb felhasználói bázishoz, néhány száz emberhez jut el a videónk. Ez egyébként minden feltöltött videó esetén így történik: mindegy, hogy ez az első feltöltött mozgóképünk, vagy menő influenszerek vagyunk. Magyarán minden egyes videó – a feltöltő személyétől és hírnevétől független – ugyanazon a startmezőn kezd.
A harmadik lépés annak vizsgálata, hogy miként teljesített a videónk a Cold Start alatt. Itt az algoritmus tényleg minden felhasználói reakciót kielemez, és ezeket súlyozva pontozza. Az összpontszám alapján pedig a tartalom 10 százaléka már jóval combosabb 10-100 ezer közötti közönséghez kerül ki. Az ekkor is jól szereplő anyag pedig a harmadik lépés részeként (User Profile Amplifier) már nagyobb gyakorisággal jelenik meg az adott célközönség előtt. Például egy bámulatos halfogás innentől a legtöbb, horgászat iránt érdeklődő felhasználóhoz eljut. Ennek a lényege, hogy a rendszer összehozza az egymáshoz leginkább passzoló tartalmat és felhasználót.
Végül a negyedik lépés részeként a tartalmunk kirakatba is kerülhet (Boutique Trending Pool). Talán felesleges mondani, de ez már a videók egy igen szűk részét, kevesebb, mint 1 százalékát érintik. Ezek az anyagok azonban válogatás nélkül eljutnak az összes felhasználóhoz. Még akadnak kiegészítő működések, például a régebbi tartalmak megjelenése, előbányászása és hasonlók, de alapesetben így fest egy videó diadalútja.
Mint fentebb olvasható, a TikTok lényege, hogy összehozza a megfelelő tartalmat a megfelelő felhasználóval. Felmerül azonban a kérdés, hogy a videók teljesítményét mi alapján értékeli a rendszer, mi alapján dönti el, hogy melyik felhasználó mit lásson? A videó nézésével töltött idő, a váltás két videó között, a kommentek, a lájkok mind-mind számszerűsíthető reakciók, és ez alapján az algoritmus már nagyjából be tudja lőni, hogy nagy valószínűséggel mi fog tetszeni nekünk. Ez azt jelenti, hogy tartalomfogyasztóként a TikTok folyamatosan szondáz minket. Ha például autós videón időzünk el hosszabban, akkor egyre több ilyet (de nem csak ilyet) ajánl majd nekünk. Majd tovább elemzi a viselkedésünket. Nem vesszük észre, de folyamatos kommunikációt folytatunk tehát a mesterséges intelligenciával.
A TikTok pedig háromféle adatot gyűjt az elemzéshez: a tartalommal kapcsolatos adatok (mennyire felel meg a beállított tageknek a videó, nem másolat-e, nem cenzúrázandó-e satöbbi), felhasználói adatok (érdeklődési kör, foglalkozás, életkor, demográfia és egyebek), valamint a környezeti adatok (milyen környezetben mi iránt érdeklődik a felhasználó, például utazás közben más videókra kíváncsi-e, mint otthon). Végül ezen adatok alapján ajánl nekünk egy-egy videót a rendszer.
Lebutítva, de lényegében láthattuk, milyen adatokból miként működik a TikTok. A kicsit is hasonló szisztémákhoz (Netflix, YouTube) képest a legnagyobb különbség pedig, hogy az MI hozza meg helyettünk a döntést. Pontosabban mi észre sem vesszük azt a folyamatot, ami a mesterséges intelligencia döntéséhez vezet a mi preferenciáink alapján. Vagyis amíg eddig a hagyományos modellben több információ birtokában hoztunk meg egy döntést, most ezen információk híján, az MI kalkulációi alapján születik meg, hogy mi kerül a telefonunk képernyőjére.
A YouTube-on és a Netflixen választhatunk érdeklődési kört, és akkor megjelenik egy csomó releváns lehetőség. A TikTok azonban nem így működik: itt a tartalom elindul, mi pedig vagy átlépjük, vagy megnézzük, vagy lájkoljuk vagy kezdünk vele valamit. Észre sem vettük, de rögtön elkezdünk foglalkozni egy pár másodperces videóval, és több adatot szolgáltatunk róla, mint akár a kedvenc tévésorozatunkról. Mindez természetesen nem véletlen: a döntés ugyanis a részvétel ára (akkor találok nekem tetsző sorozatot, ha több közül kiválasztom). A döntéseim viszont a TikTokon számomra láthatatlanok, de rengeteget hozok meg belőlük, ami több adathoz és erősebb MI-hez vezet. Gazdasági oldalról pedig mivel eltűnt a folytonos váltás a döntés és a fogyasztás közt (tehát amíg a Netflixen totojázok három potenciálisan érdekes sorozat felett), ezért több idő jut a fogyasztásra, amibe a visszajelzések miatt ráadásul jobban is bevonódok. Ez pedig egy win-win helyzet: nekem kevesebbet kell dolgoznom a tartalomért, a szolgáltatónak pedig az adatokért, és közben több reklámidő is áll a rendelkezésére.
Ám ebből a mindenki számára előnyös gazdasági realitásból következik egy-két dolog, ami nem csak meghatározhatja, de kétségkívül meg is fogja határozni a jövőnket. Ezek közül beszéljünk arról, hogy:
Szóba került már, hogy a TikTok és kínai bátyókája nem kizárólagos termékei a ByteDance-nek. Sőt a technológiai vállalatnak több tucat terméke ismert (és ezek közt például hírszolgáltató applikáció is akad), és ezek nagy része a TikTokhoz hasonló, mesterséges intelligenciával működő ajánlási rendszereken alapulnak. Ezek a platformok szorgos méhecskeként gyűjtik az adatot, amit aztán a cég felhasznál, és a segítségével finomhangolja az algoritmusát, ami miatt az adott applikáció még jobban fog működni, ami még több felhasználót vonz, akiknek az adatai szintén feldolgozásra kerülnek... És így tovább.
A termék maga tehát nem a TikTok, a Douyin vagy bármely más applikáció, hanem, mint az idézet is szólt a cikk elején: a mesterséges intelligencia. A ByteDance ezt fejleszti, és ezt értékesítheti a többi, a szektorban ténykedő vállalat számára. Mindez azt is jelenti idővel, hogy ez a modell egyre inkább elterjedt lesz, már csak azért is, mert tehát felhasználónak és a vállalatnak egyformán megéri ezt választani.
Azonban érdemes végiggondolni, hogy amíg a YouTube és a Netflix a TikTokéhoz képest túlbonyolított, rossz értelemben robusztus felületein informált döntést hoztunk, mi az ára, hogy ezt a döntést megspóroljuk. Ha egy gép és ember közti párbeszéd eredményének tekintjük az említett döntéshez elvezető folyamatot, akkor ezt a párbeszédet eddig inkább mi irányítottuk, most viszont inkább már a gép. Mi elvesztettük az információk nagy részét, míg a gép mindent figyel. Természetesen mindez nem most kezdődött, a YouTube, a Twitter lényegében hasonló mód működik, és nyilván amint lehet, áttérnek valami hasonló modellre (akár a ByteDance algoritmusának licenszelése után).
A TikTokon meghozott döntéseink jelenleg ugyan nem bírnak különösebb jelentőséggel, ám ha a folyamatot lecsupaszítjuk, a következő történik: az algoritmus azt adja nekünk, amit szeretnénk (számunkra érdekes tartalmat), mi pedig azt adjuk az algoritmusnak, amit ő szeretne (releváns adatot), mivel pedig ez egy végtelen folyamat, idővel tényleg képtelenség lesz eldönteni, hogy az algoritmus hozta meg az adott döntést az adataink felhasználása segítségével, vagy még nekünk is maradt ebbe valamennyi beleszólásunk. Ez pedig elvezet egy elég aggasztó kérdéshez: észrevesszük-e, ha az MI, aminek minden releváns információ a birtokában van (miközben a mi birtokunkban egyre kevesebb ilyen információ van), már nem csak döntést hoz helyettünk, de elkezdi ezt a döntést befolyásolni is? Ez a kérdés pedig egy Kínához hasonló high-tech autokrácia esetén valószínűleg nem hogy időszerű, de későn is tettük fel.
Ahogy ugyanis a hasonló mesterséges intelligenciákból felsejlő jövő mutatja, elképzelhető, hogy végig félreértettük, hogy ez a technológia miképp jelenthet ránk veszélyt. Egyre inkább úgy tűnik, hogy túlbecsültük, hogy az automatizáció milyen gyorsan teszi az emberi munkát feleslegessé egy-egy területen. Vagy éppen az adataink hiábavaló védelmével voltunk elfoglalva, miközben boldogan osztjuk meg ezeket tömegével. Ám az adat – legyen bármily fontos – csak a képlet egy része, egy szükségszerűség, amely a mesterséges intelligencia jelenlegi fejlettségi szintjéből következik. Hiba volt viszont nem figyelni a nagyobb képre, hogy a mesterséges intelligencia miként képes előrejelezni a döntéseinket, és miként tudja is akár befolyásolni ezeket.
A cikkhez a következő forrásokat használtam fel:
(Képek: SOPA Images/Getty Images, Flickr/Solen Feyissa/Văn Tân Vũ)