A Meta szerdai prezentációja során Mark Zuckerberg bemutatta a közösségi média platform jövőbeli újításainak terveit, ami többek között a felhasználók és a rendszer közötti sokkal hatékonyabb kommunikációt lehetővé tevő mesterséges intelligencia fejlesztésére irányul. A projektek között megtalálható a világ összes nyelven értő fordítóprogram, a Universal Speech Translator, ami olyan nyelvek beszélői számára is tudna azonnali, valós idejű fordítást biztosítani, akiknek jelenleg nagyon kevés eszköz áll rendelkezésre ennek megvalósítására, valamint a Project CAIRaoke is, ami az embereket körülvevő, MI vezérlésű digitális asszisztensekkel való könnyebb interakciót segíti elő.
A vízió egyik legfontosabb részét a Builder Bot jelenti, ami a Meta által fejlesztett metaverzum építésében játszik majd szerepet. Az eszközzel a felhasználók pusztán a szavaikkal hozhatnak létre világokat és építhetnek fel különféle helyszíneket, amelyeket részletekbe menő pontossággal rendezhetnek be tárgyakkal, hangokkal és minden olyan hozzávalóval, ami a valósághű élményt biztosítja számukra. A Builder Bot működését bemutató videóban Zuckerberg utasításai alapján pillanatok alatt megszületett egy minimalista tengerparti jelenet, kiegészítve olyan hozzávalókkal, mint a pálmafák és a sirályvijjogás a háttérben. A rendszer egészen pontos leírások felismerésére is képes, mint a felhők különböző típusainak megkülönböztetése, legalábbis a prezentáció tanúsága szerint a Meta elnöke kifejezetten középmagas gomolyfelhőket rendelt a programtól, ami többé-kevésbé teljesült is.
A végeredmény a látványt illetően ugyan bőven hagy kivetnivalót maga után, mivel a Meta virtuális világa egyelőre messze elmarad a MetaHuman Creator és más, főként videojátékos avatárok és virtuális asszisztensek alkotására szakosodott programok minőségétől, de a Builder Bot esetében nem a kevésbé élethű látkép, hanem maga a megjelenítés módja a leglényegesebb elem, és az, hogy a felhasználók kezébe nagyobb kontroll kerüljön, megkönnyítve a párhuzamos világokba való átmenetet. A hangalapú irányítás mögött rejlő technológia az egyre fejlettebb algoritmusokon alapszik, amelyek egyre precízebben fordítanak nem csak nyelvek, hanem szavak és képek között is.
Hasonlóan működik például a Nvidia novemberben megjelent programja is, ami írott szavakat és kifejezéseket alakít képekké, néha egészen pontos, néha kevésbé eredményes módon. A cég GauGAN 2 mesterséges neurális hálózata valósághű tájképeket alkot a betáplált adatokból, de a valós idejű fordításra a leírásokból még ez az algoritmus sem képes. A Meta célja, hogy az azonnali alkotást is lehetővé tegye, bár ez a funkció még náluk sem elérhető: a cég egyelőre a program fejlesztésén dolgozik, de a jövőben, Zuckerberg ígérete szerint, a Builder Botnak köszönhetően sokkal részletesebb és kifinomultabb környezetet teremthetnek majd a Meta metaverzumának látogatói.
(Fotó: Meta)