Csütörtökön a világ talán legismertebb AI-vállalata, az OpenAI bemutatta az első ügynökét, angolul agentjét, ami a mesterséges intelligencia következő ígéretét válthatja be: hogy elég lesz néhány szót intéznünk a számítógépünkhöz, és az végigcsinál a programjainkban akár bonyolult, egymásra épülő folyamatokat is. Ahogyan a TechCrunch cikke aláhúzza, a nagy versenytársak közül a Google és az Anthropic, a kisebbek közül a Rabbit már próbálkozott hasonló megoldásokkal, így Sam Altmanék nem várhattak sokáig. Különösen, hogy a cégvezető korábban 2025-öt az ügynökök nagy évének nevezte, és nem a globális feszültségekre vagy James Bondra gondolt.
Operator nevű szoftverük egyelőre csak a böngészőnkben tudja átvenni a hatalmat, a havi nyolcvanezer forintos Pro csomag része, ráadásul most még csak Amerikában elérhető, de így is nagy szám.
"Európa sajnos el fog tartani egy darabig" - utalt Altman valószínűleg az eltérő, lényegesen szigorúbb szabályozói, adatvédelmi környezetre. De nem kell szomorkodni, az újdonság örömén kívül sok mindenről nem maradunk le. Az ígéret szerint a jövőben csak szólunk az Operatornak, hogy vásároljon be a kedvenc online áruházunkban, fizesse ki a rendelést egy hitelkártyával, végül írjon a gyerekeknek egy emailt, hogy számítsanak a futárra. Azonban a folyamat ma még messze nem ilyen sima: miután kiadjuk a parancsot, egy önálló böngészőablak jelenik meg, ahol nyomon követhetjük, hogy az ügynökünk mit és miért csinál. Ha elakad, gondolkodik. Ha nagyon elakad, szól. Ha nem tetszik, amit látunk, azonnal le tudjuk állítani. A kártyánk számát egyelőre nem jegyzi meg, levelet sem ír a felügyeletünk nélkül, és egyéb korlátozásokkal próbálja megvédeni önmagától a világot és minket.
Ami viszont jó hír, hogy a működéséhez az OpenAI-nak nem kell együttműködnie, leszerződnie a különböző weboldalakkal egyesével. A program, ahogyan egy ember, egérrel és billentyűzettel vezérli a weboldalak látható részét, nem API-okon, azaz a programok közti, külön lefejlesztett csatornákon keresztül kommunikál a szolgáltatásokkal. Vagyis ha egyszer jól fog működni, akkor pillanatok alatt nagyon sok weboldalon fog jól működni.
De itt még nem tartunk. A platformeres Casey Newton szakíró első próbálkozásai is lassabbak és kényelmetlenebbek voltak, mintha maga végezte volna el a feladatokat. A legérdekesebb londoni turistautakat szépen kikereste az Operator a TripAdvisorról, de ezt a listát a ChatGPT is összeszedte volna, gyorsabban. Amikor Newton élelmiszereket rendelt volna, akkor már a legközelebbi közért kiválasztása is kínszenvedés volt, és végül negyed órába telt némi üdítő és egy zsák málna beszerzése. Ugyanakkor az újságíró szerint az egész a korai robottaxizásra emlékezteti az embert: aki beült, érezte, hogy ez mekkora teljesítmény, és hogy meghatározhatja a jövőnket. És ha így megy tovább, akkor valóban, már elég lesz szólni az ügynöknek, és jöhet is értünk a taxi. Akár egy olyan, amiben nem ül sofőr.