A CES 2020 kiállítás és vásáron az izraeli Voiceitt startup bejelentette, hogy beépíti nem szabványos beszédfelismerő programját a hang által aktivált okos-eszközökbe. A kiegészítés lehetővé tenné a kommunikációs deficittel élő emberek számára az ilyen rendszerek irányítását és használatát.
„Minden jel arra utal, hogy a hang-technológia folyamatosan fejlődik, tehát az akadálymentesítő komponensek igazán fontossá válnak” - mondta Sara Smolley, a Voiceitt társalapítója.
A Voiceitt okosotthon rendszere nem képes mindent megérteni abból, amit a nem átlagosan beszélő emberek mondanak. A felhasználók saját hangjukkal tanítják a rendszert, olyan kulcsfontosságú kifejezésekkel, mint a: „kapcsold be a lámpát”, amely így képessé válik megtanulni az egyes személyek sajátos hangmintáit.
Tucatnyi egészségügyi állapot, - beleértve az agyi bénulást, a Parkinson-kórt és a sztrókot, - befolyásolja az emberek kommunikációját: bár tudják, mit akarnak mondani, nem rendelkeznek elegendő kontrollal a beszédhez szükséges izmok felett, ami megnehezíti a mondandójuk megértését.
"Sok ember, - akinek ilyen betegsége van, - motoros kihívásokkal is küzd, és nem tud egyedül mozogni. Számukra komoly előnyei lennének az okosotthonok hang által aktivált technológiáinak, de a mai rendszerek gyakran nem értik a beszédüket. Fontos cél a népszerű okos-eszközök pontosságának javítása nem átlagos beszédértés területén, hogy eljuttassuk a technológiát az olyan emberek számára, akik a legjobban rá vannak utalva" - mondta Smolley.
A Voiceitt egy fordítóalkalmazással indult, mely jelenleg a béta tesztnél tart, amelynek az volt a célja, célja, hogy segítse a nem átlagos beszédű emberek kommunikációját barátaikkal, családjukkal és ápolóikkal. A felhasználók ezzel rögzítik a saját hangjukat, különféle kifejezéseket ismételve, ezután az alkalmazás a nem átlagos beszédminták adatbázisából összegyűjtött felvételeket és információkat felhasználja a beszéd értelmezésének megtanulására. Amikor a felhasználók rögzítik hangjukat az alkalmazással, az lefordítja a hanganyagot, valamint szöveges képet jelenít meg a képernyőn.
Smolley szerint a Voiceitt rendelkezik az egyik legnagyobb létező, nem átlagos emberi hang-adatbázissal. Ennek építését egy közösségi-finanszírozási kampánnyal kezdték, melyben felkérték az embereket, hogy adományozzák nekik hangmintáikat. A cég azt tervezi, hogy további hangokat ad az adatbázishoz, ahogy az emberek használatba veszik az alkalmazást.
Miközben a személyi fordító alkalmazás még mindig béta verzióban van, a vállalat szeretné kibővíteni a technológia alkalmazási területeit.
"Megtudtuk, hogy az emberek közötti személyes kommunikáción túl sokkal többet tehetünk az emberekért: segíthetünk nekik, hogy beszéljenek a gépeikkel"
- mondta Smolley.
A Voiceitt mögött az Alexa Fund, az Amazon hangtechnológiai innovációt finanszírozó kockázatitőke-alapja áll, és részt vettek accelerátor (gyorsító) programokban is, mind a Google, mind az Amazon mellett.
(Forrás: TheVerge Képek: Pixabay, Needpix, )