A saját hangunkon szólalhatunk meg bármilyen idegen nyelven a Microsoft új generatív mesterséges intelligenciájával

2023 / 03 / 13 / Bobák Áron
A saját hangunkon szólalhatunk meg bármilyen idegen nyelven a Microsoft új generatív mesterséges intelligenciájával
A vállalat egyelőre nem tette nyilvánosan elérhetővé a VALL-E-t, de egy rövid videóban megmutatták, mit várhatunk az új neurális nyelvi modelltől.

Nem túlzás azt állítani, hogy az elmúlt hónapok a generatív mesterséges intelligencia diadalmenetét hozták, a ChatGPT népszerűségét látva - amely nemrég a valaha volt leggyorsabban növekvő alkalmazássá lépett elő a havi aktív felhasználók számát tekintve - pedig nem meglepő, hogy minden cég igyekszik kiaknázni a területre irányuló figyelmet. Közülük a Microsoft volt a leggyorsabb, akik az OpenAI-jal ápolt szoros kapcsolatnak köszönhetően villámgyorsan integrálták a Bing keresőbe és az Edge böngészőbe is a chatbot továbbfejlesztett változatát, emellett januárban azt is bejelentették, hogy egy saját neurális nyelvi modellen is dolgoznak.

A VALL-E-ről akkor még csak annyit árultak el, hogy a program akár egy néhány másodperces hangfelvétel alapján is képes tökéletesen leutánozni bárkinek a hangját annak minden ismertetőjegyével együtt, beleértve a hangszínt, a hanghordozást és egyéb tényezőket. Azt a Microsoft is felismerte, hogy a deepfake videók és a social engineering korában ez komoly veszélyeket is hordozhat magában, így azt is rögtön bejelentették, hogy a VALL-E-t egyelőre nem teszik elérhetővé a nyilvánosság számára, most viszont adtak egy kis ízelítőt belőle, hogyan lehet egy ilyen technológiát jó célokra felhasználni.

Ahogy arról az Interesting Engineering beszámolt, egy a napokban közzétett tanulmányban a Microsoft munkatársai egy sor demóban mutatták be, hogyan képes a VALL-E pillanatok alatt fordítani egyik nyelvről a másikra úgy, hogy közben megtartja az eredeti beszélő hangjának a jellmezőit, vagyis elméletben a VALL-E segítségével bármilyen nyelven megszólalhatunk a saját hangunkon. Erről az AlphaSignal hírlevél szerzője osztott meg egy rövid videót Twitteren:

A generatív mesterséges intelligenciában rejlő lehetőségeket természetesen nem csak a Microsoft igyekszik kihasználni. A Google nem sokkal a ChatGPT berobbanása után bejelentette, hogy egy az OpenAI megoldásához hasonló, generatív nyelvi modellen alapuló chatboton dolgoznak, nemrég pedig azt is bejelentették, hogy már folyamatban van egy olyan mesterséges intelligencia fejlesztése is, ami a világ ezer nyelve között tud majd fordítani.

(Borítókép: Kilito Chan/Getty Images)

A magyar újságíróknak egyelőre nem kell amiatt aggódniuk, hogy egy chatbot elveszi a munkájukat Az elmúlt időszakban a ChatGPT elsöprő népszerűsége kapcsán ismét előtérbe került a téma, hogy a mesterséges intelligencia leválthatja-e az újságírókat, és bár vannak arra utaló jelek, hogy legalább részben igen, a magyar újságíróknak egyelőre biztosan nincs okuk emiatt aggódni.


Csődbe ment a cég, ami piacra dobta a világ első hajlítható kijelzős telefonját
Csődbe ment a cég, ami piacra dobta a világ első hajlítható kijelzős telefonját
A Royole FlexPai örökre beírta magát az okostelefonok történelmébe, de a gyártója nem igazán tudott profitálni abból, hogy a Samsungot és a Huaweit is megelőzték.
Feldarabolhatják a Google-t, a Chrome kényszereladása lehet az első lépés
Feldarabolhatják a Google-t, a Chrome kényszereladása lehet az első lépés
Az amerikai Igazságügyi Minisztérium benyújtotta a kéréseit az antitröszt per bírójának.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.