Így tudjuk eltenni a hangunkat az örökkévalóságnak

2023 / 05 / 11 / Pőcze Balázs
Így tudjuk eltenni a hangunkat az örökkévalóságnak
Az Acapela negyed százada foglalkozik azzal, hogy leírt szövegből beszélt hangokat képezzen gépi úton, ám az elmúlt években a mesterséges intelligenciának köszönhetően ez a terület is komoly fejlődésen ment keresztül. Most már bárki el tudja raktároztatni a hangját, otthonról, ráadásul ingyen.

A TechCrunch-on olvasható hír szerint korábban nyolc órát vett igénybe, mire elég hangmintája volt a cégnek egy-egy betegtől. Ma ugyanezt már ötven rövidke mondat felolvastatásával, nagyjából tíz perc alatt meg tudják oldani. "Egyértelműen forradalom zajlik a (mesterséges intelligencia kialakításához használt) neurális hálózatokon alapuló "szövegből hang" rendszereknél" - idézi Remy Cadic alapítót a lap. Korábban mi is írtunk arról a Rakétán, hogy a Microsoft olyan hatékony hanghamisító szoftvert készített, hogy inkább nem hozza nyilvánosságra azt; a VALL-E nevű szoftvernek elég egy három másodperces hangminta, és máris tudja utánozni szinte bárkinek a hangját.

Míg a Microsoftnál elsősorban a kísérletezés állhatott a projekt hátterében, az Acapela "My own voice" (a saját hangom) szolgáltatása a degeneratív betegséggel küzdőkön hivatott segíteni.

Amennyiben később romlana a betegek állapota, akkor egy ilyen rendszer, a megfelelő hardverekkel párosítva, rengeteg helyzetben könnyítheti meg a mindennapjaikat. A cégnél még arra is ügyeltek, hogy gyerekek is könnyen tudják használni a szoftvert, illetve, hogy az ő esetükben is valósághű hangokat legyen képes generálni a program.

Mi is kipróbáltuk a My own voice-t, és ugyan a folyamat nem teljesen magától értetődő, de a kisebb akadályokat könnyen meg lehet ugrani. Ilyen például az, hogy a regisztrációk jóváhagyása még kézzel történik, így némi időt vesz igénybe, vagy hogy a felvételek kezelőfelülete helyenként akadozik. A szoftver valamivel több mint húsz nyelvet kezel, köztük a régióból a csehet és a lengyelt is, a magyart azonban egyelőre nem. Aki talál olyan nyelvet, amelyet beszél, az az ígéreteknek megfelelően nagyjából tíz perc alatt végezhet is a felolvasással. Miután jóváhagyta a felvételeit, emailen kap értesítést arról, hogy elkezdheti próbálgatni a szintetikus hangját. Erre nekünk körülbelül fél napot kellett várnunk, azóta egy egyértelműen mesterségesen csengő, de a hangszínünket, hanglejtésünket igen jól imitáló rendszert tesztelhetünk szabadon; fizetni csak akkor kéne, ha később valóban szükség lenne az elkészült mesterséges hangra, és le akarnánk azt tölteni az erre a célra szolgáló kütyükre.

(Borítókép: Pawel Czerwinski/Unsplash)


Hello Szülő! Ha a gyereked nem tud valamit, akkor téged fog kérdezni. De ha te szülőként nem tudsz valamit, akkor kihez fordulsz?
A digitális kor szülői kihívásairól is találhattok szakértői tippeket, tanácsokat, interjúkat, podcastokat a Telekom családokat segítő platformján, a https://helloszulo.hu/ oldalon.
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Repül már a vén diák. Hová? Hová?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.