A Twitter mobilos alkalmazásaiban (ideértve mind az Android, mind pedig az iOS változatokat) komoly változások történtek: az applikáció immár nem tömöríti, vágja méretre a képeinket. Eddig ugyanis ha feltöltöttünk egy képet, akkor az algoritmus ennek egy előnézeti változatát lőtte ki a hírfolyamba, amire ha valaki rákattintott, akkor láthatta a teljes képet. A probléma ezzel csak az volt, hogy valami alapján dönteni kellett, hogy egy nagyobb képnek pontosan melyik része kerüljön bele az előnézetbe. Mint arról a CNN beszámol, a vállalat korábban egy arcfelismerő algoritmust alkalmazott erre a feladatra, de miután ez rengeteg hibát követett el, inkább megszabadultak tőle. Ezt követte tehát egy új, továbbra is mesterséges intelligencia alapú megoldás, amely azt próbálta kitalálni, hogy egy adott képen mi keltheti fel az emberek figyelmét. Ezt a tekintetet elsőre megkapó pontot (saliency) gépi tanulással próbáltak meghatározni az alapján, hogy azt figyelték, mire néznek az emberek egy-egy képen. Tavaly szeptemberben ugyanakkor a vállalat bejelentette, hogy megvizsgálja az algoritmus működését, miután azt több kritika is érte.
Több bejelentés is érkezett ugyanis, hogy az algoritmus, ha választani kell, inkább fehér embereket rak ki az előnézetbe, mint feketéket. Illetve felmerült még, hogy a gép a „male gaze” alapján is választ – ez a kifejezés arra a nézőpontra utal, amely egy általánosnak vélt heteroszexuális férfihoz társítható: példa rá amikor mondjuk egy filmen a kamera végigpásztázza a női szereplő combját. Vagyis az algoritmus a panaszok szerint a képeken előszeretettel választotta ki a nők mellkasát, combját – vagyis azokat a területeket, melyek a „male gaze” szempontjából érdekesek lehetnek.
A Twitter vizsgálatanák eredményét pedig a héten tette közzé Rumman Chowdhury, a vállalat hivatalos blogcsatornáján. Chowdhury, aki a Twitter gépi tanulással kapcsolatos etikai kérdések, átláthatóság és elszámoltathatóság csapatát vezető szoftvermérnök, írása szerint a kérdést alaposan megvizsgálták, és kimerítő tanulmány is született róla. Mint írja, a kutatásban vizsgálták az algoritmus nemek, illetve bőrszínek szerinti választásait, valamint a „male gaze” kérdése is előkerült.
Kezdjük viszont azzal, hogy egyáltalán miért vagdosta fel a Twitter a képeket eddig (egyébként az extrém hosszú képeket most is tömöríti – ezeknek a közepét vágja bele a hírfolyamba). Ennek oka az volt, hogy az elképzelés szerint amennyiben a képek a hírfolyamban azonos méretűek, úgy egyetlen pillantásra a felhasználó több tweetet láthat. A most szóban forgó algoritmus 2018 óta üzemel, és azt próbálja meg kitalálni (ahogy arról már szó esett), hogy mi az, ami egy képen egy ember tekintetét elsőre megragadja, és ez alapján már el tudja dönteni azt is, hogy miként vágja úgy a képet, hogy ez a részlet látható maradjon – az eredmény pedig így került ki a hírfolyamba. Az algoritmust úgy képezték ki, hogy emberek szemmozgását figyelte, miközben azok bizonyos képeket néztek, majd ez alapján a képek minden régiójához bizonyos pontszámot társított – a legtöbb pontot kapott régió került az előnézeti kép középpontjába.
Mindezt figyelembe véve az algoritmust komolyabb adatállományon tesztelték, hogy a képeken mely régiók kapják a legtöbb pontot. Ha az algoritmus elfogulatlanul működik, akkor tehát a nemek és a bőrszínek eloszlása végül megegyezik, hiszen ha választani kell, akkor 50-50 százalék az esély arra, hogy a fekete vagy a fehér illető kapja a nagyobb pontot éppen, és ugyanez igaz a nemek esetén is. Ehhez képest a végső eredmény nem erről árulkodik: a nemi eloszlás esetén a gép 8 százalékkal többször választott nőt, mint férfit. 4 százalékkal többször pedig inkább fehér ember kapta a nagyobb pontszámot, mint a fekete. Ez a különbség azonban még nagyobb a fehér és a fekete nők közt, mivel ebben az esetben az algoritmus 7 százalékkal nagyobb eséllyel választotta a fehér nőt. Fekete és fehér férfi esetén is volt eltérés, csak kisebb – ebben az esetben az algoritmus 2 százalékkal nagyobb eséllyel osztott ki magasabb pontszámot a fehér férfira, mint a feketére. A „male gaze” hatását is vizsgálták 100 véletlenszerűen választott férfiakról és nőkről készült kép felhasználásával, de ez a tényező a kutatás szerint nem befolyásolta a kiosztott pontszámot. A blogposzt hozzáteszi ugyanakkor, hogy az algoritmus ilyetén működése egyéb veszélyeket is hordoz, ami a mostani vizsgálatnak nem volt tárgya, ilyen például az érzéketlenség a különböző kulturális nüanszokra.
A Twitternél végül arra jutottak, hogy ez a megoldás több bajt okoz, mint amennyi hasznot hajt, és azt a következtetést vonták le, hogy
a közösségi platformon nem minden bízható rá a mesterséges intelligenciára.
Ebben az esetben például bölcsebb az emberekre bízni, hogy mit szeretnének a képből a hírfolyamba beilleszteni. Márciusban ezért elkezdtek tesztelni egy új módszert, amely segítségével a standard képarányú képek a maguk teljességében jelennek meg mind az iOS, mind pedig az Android eszközökön – májusban tehát ez az új megoldás érhető már el mindenki számára ezeken a platformokon. A másik újdonság, hogy immár az elküldés előtt is láthatjuk, hogy miként fog a kép megjelenni mások hírfolyamában.
A Twitter szóvivője úgy nyilatkozott, hogy az algoritmust más módokon is használták, például amikor egyszerre több képet is tweetelünk, de a vállalat ezt is fejleszti. A szóvivő hozzátette azt is, hogy a változás azért a mobilos applikációkat érinti az első körben, mert a legtöbben ezeken a platformokon használják a cég termékét.
Összességében tehát ez egy újabb történetnek indult arról, hogy a gépi tanulásos megoldások milyen hibázásokra képesek, ugyanakkor ez annak felismeréséhez vezetett, hogy a mesterséges intelligencia nem minden területen válthatja ki az embert. Időnként tehát jó ötlet, ha visszakapjuk legalább valamennyire az irányítást. Külön jó hír, hogy ezt egy ekkora technológiai vállalat is felismerte, egyben mutatja, hogy a mesterséges intelligenciával kapcsolatos etikai kutatásoknak már most fontos szerepe van, ami a jövőben nyilván csak erősödni fog.
(Kép: Flickr/twistedwristerxxx)