A mesterséges intelligencia (MI) területén végzett kutatásairól ismert divízió egy blogposztban osztotta meg az elmúlt hét hónap legérdekesebb tanulságait és fejlesztéseit. Ezek közül kiemelkedik, hogy elkészítettek egy úgynevezett "robotalkotmányt", amely már rögtön azt szabályozza, hogy az autonóm rendszerek milyen feladatokat végezhetnek és végezzenek el. Ehhez az inspirációt természetesen Isaac Asimov sci-fi író három robotikai törvénye jelentette (https://hu.wikipedia.org/wiki/A_robotika_három_törvénye), amelyek előírják, hogy a robot nem árthat embernek, engedelmeskedni köteles annak, illetve meg kell védje önmagát, ha az nem ütközik az első két szabály betartásába. Természetesen a Google szerint is az első a legfontosabb, ám ezt olyan előírásokkal egészítették ki, mint hogy a robotjaik nem végezhetnek olyan feladatokat, amelyek embereket is érintenek, illetve nem léphetnek interakcióba állatokkal, éles tárgyakkal vagy elektronikus berendezésekkel, sőt, csak állandó emberi felügyelet mellett ténykedhetnek. A kollaboratív robotoknál mindez például azzal is kiegészül, hogy ha túl nagy nyomást éreznek az ízületeiken, le kell, hogy álljanak.
Ez azonban csak egy szelete a most bejelentett újdonságoknak.
A szakemberek arról is beszámoltak, hogy milyen technológiai megoldások visznek minket közelebb ahhoz, hogy egy ember számára könnyen érthető és kivitelezhető kérdés, mint a takarítás vagy a főzés, egy robotnak se jelentsen kihívást. AutoRT nevű rendszerük a nagy nyelvi modelleket, a nagy vizuális modelleket és a robotirányítási modelleket egyesíti, hogy így segítsen a robotoknak tájékozódni és tanulni új helyzetekben. A vizuális modell felméri a környezetet, a nyelvi modell lehetséges elvégezhető feladatokat talál ki, majd azok közül választ, részben a korábban említett robotalkotmányra támaszkodva. A cégnél több mint hatezerötszáz feladaton, és több mint hetvenezer részfeladaton tesztelték a robotjaikat az elmúlt időszakban.
A SARA-RT ezzel szemben azért felel majd, hogy hatékonyabban tudjon működni a robotok figyelme. Eddig ugyanis az MI-modellek érzékelésénél ha a befogadott adatmennyiség duplázódott, például a jobb minőségű kamerák miatt, akkor a számítási igény négyszereződött. Ezzel szemben itt már lineáris kapcsolat van a két tényező között. Ez később nem csak a robotikai, hanem bármilyen transzformeres technológiánál, a nagy nyelvi modellekkel működő chatbotoknál is komoly megtakarítást jelenthet.
A harmadik rendszer, az RT-Trajectory kifejezetten az érzékelést segíti: gyakorlatilag átrajzolja a robot kameráján keresztül látható emberi kezeket és robotkarokat, ezzel fókuszálva a figyelmet. Így a gépeknek nem maguktól kell kitalálniuk, hogy például hogyan töröljenek le egy asztalt, hanem elleshetnek fogásokat másoktól. A cégnél egyelőre olyan feladatokat bíztak a robotjaikra, mint hogy a nassolnivalókat helyezzék el a pulton, vagy döntsenek fel egy kólásdobozt, de a fenti fejlesztésekkel talán közelebb kerülnek ahhoz, hogy megfőzzék az ebédünket, majd még ki is takarítsák a konyhát.
(Borítókép: Google)