Szellem a gépben – ilyen, amikor android testbe ültetik a ChatGPT-t

2023 / 12 / 14 / Felkai Ádám
Szellem a gépben – ilyen, amikor android testbe ültetik a ChatGPT-t
A Tokiói Egyetem Alter3, ChatGPT-4-gyel felszerelt humanoid robotja spontán és változatos mozgásokat mutat be, méghozzá bármiféle előzetes programozás nélkül. A legújabb Nyelvi Modell integrációja lehetővé teszi az Alter3 számára, hogy az emberi parancsok Python-kódba fordításával közvetlen generáljon műveleteket – ez komoly előrelépés a humanoid robotika területén, amely kifejezőbb párbeszédeket tesz lehetővé a kontextus szempontjából releváns arckifejezésekkel és gesztusokkal.

A Tokiói Egyetem Alter3 androidja az intézmény humanoid robotsorozatának harmadik iterációja, amely a ChatGPT-4-val való integráció révén a legmodernebb képességekkel rendelkezik. Az Alter3 43 aktuátort kapott z arckifejezésekhez és a végtagmozgásokhoz – az aktuátorokat sűrített levegő hajtja, és sokféle kifejező gesztust tesznek lehetővé. Habár a robot egyelőre kizárólag álló helyzetben van (lépni, futni sem tud), az Alter3 felsőteste már most spontán és változatos mozgásokat képes végrehajtani, amelyeket önállóan generál az emberi parancsok ChatGPT-4 általi Python kódra történő fordításával – számol be róla az Interesting Engineering.

A robot innovatív kialakítása így szükségtelenné teszi az egyes testrészek manuális programozását, lehetővé téve a felhasználóknak a pózok módosítását anélkül, hogy komoly fejlesztési erőfeszítéseket kellene tenniük.

A kísérletek során az Alter3 bebizonyította, hogy képes utánozni az emberi pózokat egy kamerán és az OpenPose keretrendszeren keresztül: az ízületeket a megfigyelt pózok utánzásához igazította, és a sikeres utánzatokat későbbi felhasználás céljából el is tárolta. A ChatGPT, mint Nagy Nyelvi Modell (LLM) integrálásának köszönhetően így az Alter3 hatékonyan vehet részt a párbeszédben, miközben a kontextus szempontjából releváns arckifejezéseket és gesztusokat jelenít meg:

Az Alter3 emberekkel való interakciója változatos pózok betanulását eredményezte, ami nagyjából arra hasonlít, ahogy egy újszülött utánzása tanulási folyamatként végső soron a kifejezőképesség bővítéséhez járul hozzá. Habár a robot nem tud járni, de a járás és a futás mozdulatait képes szimulálni a kötöttségek ellenére is.

A kutatók szerint az Alter 3 idővel az érzelmek széles skáláját jelenítheti meg – örömet és bánatot egyaránt – a különböző narratívákra adott válaszként. Végső soron osztozhat az emberekkel az érzelmeiken, és ezt ráadul a hagyományos módszerek nélkül sikerül elérni – tehát amikor az említett aktuátorokat egyesével kellett részletesen beprogramozni a különböző pózok kialakításához. Ez utóbbi feladatot váltja tehát ki lényegében a ChatGPT.


Meztelen képeket generáltak az osztálytársaikról, próbára bocsátották és képzésekre kötelezték a tizenöt fiatalt
Meztelen képeket generáltak az osztálytársaikról, próbára bocsátották és képzésekre kötelezték a tizenöt fiatalt
A tizenhárom és tizenöt év közti spanyol fiatalok mesterséges intelligenciával készítettek montázsokat.
Megfejtették a világ legősibb számítógépének, az antiküthérai szerkezet titkát
Megfejtették a világ legősibb számítógépének, az antiküthérai szerkezet titkát
A 21. század egyik legérzékenyebb tudományos eszközével kifejlesztett technikák, amelyek a téridő hullámzásait elemzik, új megvilágításba helyezték a legrégebbi ismert analóg számítógép működését.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.