Egy új MI néhány órányi hangfelvétel alapján megőrizheti bárki hangját
2020 / 01 / 23 / justin.viktor
Egy új MI néhány órányi hangfelvétel alapján megőrizheti bárki hangját
A VocaliD nemrégiben egyesítette erőit a bostoni Northeastern University-vel, céljuk az emberek hangjának megőrzése és újraalkotása mesterséges intelligencia segítségével, a “The Voice Preservation Clinic” szolgáltatás-központon keresztül.

A kutatók azt remélik, hogy erőfeszítéseiknek hála megváltozhat azoknak az embereknek az élete, akik torokrák vagy motoros neuron betegségük miatt azzal szembesülnek, hogy elvesztik a beszéd képességét. Szeretnének az emberek számára olyan eszközöket biztosítani, melyekkel megőrizhetik identitásukat, ebben pedig sokat segíthet az a képesség, ha megőrizhetik a hangjukat, még akkor is, ha lehetetlenné válik számukra a beszéd előállítása.

Az együttműködés megkezdése előtt a VocaliD szolgáltatása lehetővé tette az emberek számára, hogy hangjukat otthonuk kényelmeiből rögzítsék. Ez azonban nem volt megfelelő módszer, mivel a legtöbb embernek hiányzott a felszerelése a jó minőségű felvételekhez, vagy háttérzajjal készítettek felvételeket. Az is problémát jelentett, hogy a legtöbb ember nem is tudott róla, hogy ez a lehetőség létezik.

Rupal Patel, a VocaliD alapítója és vezérigazgatója, valamint a központ vezető kutatója elmondta:

“Gyakran az utolsó pillanatban jönnek hozzánk. Nincs elég idejük a hangjuk rendes rögzítésére, annyira beburkolja őket a betegségük, majd a műtét - ez nagyon stresszes.”

 

Ez lett a fő oka annak, hogy a társaság összekapcsolódott a Northeastern University-vel, hogy a technológiát könnyebben hozzáférhetővé tegyék a tömegek számára és a betegeknek  megfelelő felvételi környezetet biztosítsanak a jó minőségű hangzáshoz. A projekt neve „öröklés projekt” lett.

Öröklés projekt

Először is a beteg rögzíti a hangját, miközben beszél. A klinika ehhez verseket, beszédeket és novellákat kínál a résztvevőknek számos témában, a felvételek pedig egy speciális hangfelvevő fülkében zajlanak.

"Körülbelül két-három órás beszéd rögzítésére kérjük meg őket. Ezekből a felvételekből már képesek vagyunk egy MI által generált hangmotort felépíteni, ami beszéd során épp úgy hangzik mint a saját hangjuk" - mondta el Patel.

A második lépésben a felvételeket gépi tanulási algoritmusokba táplálják. Az eljárás kifinomultabb, mint egy csomó szó felvétele, feldarabolása és összeillesztése. A MI által generált hangmotor nem csak megismétli a rögzített szavakat, de hangzóira bontja az emberi hangot, és így azzal olyan szavakat is kimondathat - a beteg hangján, - melyeket az soha nem rögzített.

Ezután a digitális hangot telepítik a kísérő alkalmazásra, melyet a beteg telefonjára vagy egy más eszközére telepítettek. Ezt követően ő már csak beírja, mit akar mondani, és az alkalmazás elkészíti a mondatok hangját a saját orgánumát használva.

“A rákbetegek megtartják a kontrollt a kezük irányítására és így kommunikálni is tudnak - de önmagukként szeretnék ezt megtenni” - tette hozzá Patel.

Öregedő hang

Ez a technológia arra is képes, hogy akár öregítse az ember hangját, hogy az velük együtt öregedhessen. Az még azonban nem lehetséges hogy egy gyermek hangját felnőtté változtassák. Fejlesztés alatt állnak viszont olyan szűrők is, amelyek több választási lehetőséget biztosítanak a felhasználó számára a mondatok kifejezési módja tekintetében.

(Forrás: IntelligentLiving Képek: Unsplash)


Igényes és férfias történeteket keresel? A Roadstert neked írjuk!
Olvass bele az egyik legszínvonalasabb hazai magazinba, szeretni fogod! A Roadster egy fantasztikus utazás az élet legjobb területein...
Kövesd a Rakétát a Facebookon is!
Kövess, üzenj, kommentelj a Rakéta Facebook oldalán!
Ezek is érdekelhetnek

Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.