Egy új MI néhány órányi hangfelvétel alapján megőrizheti bárki hangját

2020 / 01 / 23 / Justin Viktor
Egy új MI néhány órányi hangfelvétel alapján megőrizheti bárki hangját
A VocaliD nemrégiben egyesítette erőit a bostoni Northeastern University-vel, céljuk az emberek hangjának megőrzése és újraalkotása mesterséges intelligencia segítségével, a “The Voice Preservation Clinic” szolgáltatás-központon keresztül.

A kutatók azt remélik, hogy erőfeszítéseiknek hála megváltozhat azoknak az embereknek az élete, akik torokrák vagy motoros neuron betegségük miatt azzal szembesülnek, hogy elvesztik a beszéd képességét. Szeretnének az emberek számára olyan eszközöket biztosítani, melyekkel megőrizhetik identitásukat, ebben pedig sokat segíthet az a képesség, ha megőrizhetik a hangjukat, még akkor is, ha lehetetlenné válik számukra a beszéd előállítása.

Az együttműködés megkezdése előtt a VocaliD szolgáltatása lehetővé tette az emberek számára, hogy hangjukat otthonuk kényelmeiből rögzítsék. Ez azonban nem volt megfelelő módszer, mivel a legtöbb embernek hiányzott a felszerelése a jó minőségű felvételekhez, vagy háttérzajjal készítettek felvételeket. Az is problémát jelentett, hogy a legtöbb ember nem is tudott róla, hogy ez a lehetőség létezik.

Rupal Patel, a VocaliD alapítója és vezérigazgatója, valamint a központ vezető kutatója elmondta:

“Gyakran az utolsó pillanatban jönnek hozzánk. Nincs elég idejük a hangjuk rendes rögzítésére, annyira beburkolja őket a betegségük, majd a műtét - ez nagyon stresszes.”

 

Ez lett a fő oka annak, hogy a társaság összekapcsolódott a Northeastern University-vel, hogy a technológiát könnyebben hozzáférhetővé tegyék a tömegek számára és a betegeknek  megfelelő felvételi környezetet biztosítsanak a jó minőségű hangzáshoz. A projekt neve „öröklés projekt” lett.

Öröklés projekt

Először is a beteg rögzíti a hangját, miközben beszél. A klinika ehhez verseket, beszédeket és novellákat kínál a résztvevőknek számos témában, a felvételek pedig egy speciális hangfelvevő fülkében zajlanak.

"Körülbelül két-három órás beszéd rögzítésére kérjük meg őket. Ezekből a felvételekből már képesek vagyunk egy MI által generált hangmotort felépíteni, ami beszéd során épp úgy hangzik mint a saját hangjuk" - mondta el Patel.

A második lépésben a felvételeket gépi tanulási algoritmusokba táplálják. Az eljárás kifinomultabb, mint egy csomó szó felvétele, feldarabolása és összeillesztése. A MI által generált hangmotor nem csak megismétli a rögzített szavakat, de hangzóira bontja az emberi hangot, és így azzal olyan szavakat is kimondathat - a beteg hangján, - melyeket az soha nem rögzített.

Ezután a digitális hangot telepítik a kísérő alkalmazásra, melyet a beteg telefonjára vagy egy más eszközére telepítettek. Ezt követően ő már csak beírja, mit akar mondani, és az alkalmazás elkészíti a mondatok hangját a saját orgánumát használva.

“A rákbetegek megtartják a kontrollt a kezük irányítására és így kommunikálni is tudnak - de önmagukként szeretnék ezt megtenni” - tette hozzá Patel.

Öregedő hang

Ez a technológia arra is képes, hogy akár öregítse az ember hangját, hogy az velük együtt öregedhessen. Az még azonban nem lehetséges hogy egy gyermek hangját felnőtté változtassák. Fejlesztés alatt állnak viszont olyan szűrők is, amelyek több választási lehetőséget biztosítanak a felhasználó számára a mondatok kifejezési módja tekintetében.

(Forrás: IntelligentLiving Képek: Unsplash)


Hello Szülő! Ha a gyereked nem tud valamit, akkor téged fog kérdezni. De ha te szülőként nem tudsz valamit, akkor kihez fordulsz?
A digitális kor szülői kihívásairól is találhattok szakértői tippeket, tanácsokat, interjúkat, podcastokat a Telekom családokat segítő platformján, a https://helloszulo.hu/ oldalon.
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Repül már a vén diák. Hová? Hová?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.