A kutatók azt remélik, hogy erőfeszítéseiknek hála megváltozhat azoknak az embereknek az élete, akik torokrák vagy motoros neuron betegségük miatt azzal szembesülnek, hogy elvesztik a beszéd képességét. Szeretnének az emberek számára olyan eszközöket biztosítani, melyekkel megőrizhetik identitásukat, ebben pedig sokat segíthet az a képesség, ha megőrizhetik a hangjukat, még akkor is, ha lehetetlenné válik számukra a beszéd előállítása.
Az együttműködés megkezdése előtt a VocaliD szolgáltatása lehetővé tette az emberek számára, hogy hangjukat otthonuk kényelmeiből rögzítsék. Ez azonban nem volt megfelelő módszer, mivel a legtöbb embernek hiányzott a felszerelése a jó minőségű felvételekhez, vagy háttérzajjal készítettek felvételeket. Az is problémát jelentett, hogy a legtöbb ember nem is tudott róla, hogy ez a lehetőség létezik.
Rupal Patel, a VocaliD alapítója és vezérigazgatója, valamint a központ vezető kutatója elmondta:
“Gyakran az utolsó pillanatban jönnek hozzánk. Nincs elég idejük a hangjuk rendes rögzítésére, annyira beburkolja őket a betegségük, majd a műtét - ez nagyon stresszes.”
Ez lett a fő oka annak, hogy a társaság összekapcsolódott a Northeastern University-vel, hogy a technológiát könnyebben hozzáférhetővé tegyék a tömegek számára és a betegeknek megfelelő felvételi környezetet biztosítsanak a jó minőségű hangzáshoz. A projekt neve „öröklés projekt” lett.
Először is a beteg rögzíti a hangját, miközben beszél. A klinika ehhez verseket, beszédeket és novellákat kínál a résztvevőknek számos témában, a felvételek pedig egy speciális hangfelvevő fülkében zajlanak.
"Körülbelül két-három órás beszéd rögzítésére kérjük meg őket. Ezekből a felvételekből már képesek vagyunk egy MI által generált hangmotort felépíteni, ami beszéd során épp úgy hangzik mint a saját hangjuk" - mondta el Patel.
A második lépésben a felvételeket gépi tanulási algoritmusokba táplálják. Az eljárás kifinomultabb, mint egy csomó szó felvétele, feldarabolása és összeillesztése. A MI által generált hangmotor nem csak megismétli a rögzített szavakat, de hangzóira bontja az emberi hangot, és így azzal olyan szavakat is kimondathat - a beteg hangján, - melyeket az soha nem rögzített.
Ezután a digitális hangot telepítik a kísérő alkalmazásra, melyet a beteg telefonjára vagy egy más eszközére telepítettek. Ezt követően ő már csak beírja, mit akar mondani, és az alkalmazás elkészíti a mondatok hangját a saját orgánumát használva.
“A rákbetegek megtartják a kontrollt a kezük irányítására és így kommunikálni is tudnak - de önmagukként szeretnék ezt megtenni” - tette hozzá Patel.
Ez a technológia arra is képes, hogy akár öregítse az ember hangját, hogy az velük együtt öregedhessen. Az még azonban nem lehetséges hogy egy gyermek hangját felnőtté változtassák. Fejlesztés alatt állnak viszont olyan szűrők is, amelyek több választási lehetőséget biztosítanak a felhasználó számára a mondatok kifejezési módja tekintetében.
(Forrás: IntelligentLiving Képek: Unsplash)