Így szól a zene, amit mesterséges intelligencia szerzett

2023 / 01 / 31 / Pőcze Balázs
Így szól a zene, amit mesterséges intelligencia szerzett
A Google bemutatta MusicLM nevű szoftverét, amely néhány szavas utasítások alapján képes zenét szerezni. Az eredmények izgalmasak, de annyi a jogi és minőségi kérdés, hogy a cég még nem meri nyilvánosságra hozni a rendszert.

A TechCrunchon olvasható hír kiemeli, hogy nem ez az első ilyen kísérlet: akadt például olyan program, ami a beírt szövegből képet készített, majd abból hangokat, de a MusicLM az első, amely komplex és jó minőségű végterméket tud előállítani. A szoftver működésének az alapja hasonló azokhoz az MI-khez, amelyekről többször írtunk az elmúlt évben a Rakétán. Mindegy, hogy esszét ír József Attila szerelmi költészetéről, festményt készít arról, hogy űrlények érkeznek biciklivel a Fehér Házba, vagy épp hitelesen hangzó mondatokat ad bárkinek a szájába; a lényeg, hogy hatalmas mennyiségű adaton edzik, tanítják a programokat, amelyek egyre ügyesebben tudják utánozni azt, amit korábban láttak.

Ebben az esetben a Google kétszáznyolcvanezer órányi zenét hallgattatott meg az MI-vel, amelyet tíz hivatásos zenész látott el leírásokkal.

A tanulmány szerint nagyjából négy mondatot írtak minden hangmintáról, kitérve például a műfajra, a hangulatra vagy a tempóra. Így aztán, ha azt mondjuk a szoftvernek, hogy generáljon egy "elbűvölő jazz dalt egy emlékezetes szaxofon-szólóval és szólóénekessel", máris megkapjuk a kért hangmintát, ami a készítők szerint konzisztens minőségű marad perceken át. De azt is írhatjuk, hogy "elektronikus zene egy videojátékból, majd meditációs dal egy folyó mellett, majd tűz és tűzijáték", ami így fog szólni. Ez pedig a "reggaeton és az elektronikus zene fúziója, amitől úgy érezzük magunkat, mintha elvesztünk volna az űrben".

Nem minden dal, ami prüntyög

Ahogyan a cikk is kiemeli, a figyelemre méltó teljesítmény ellenére nem tökéletes a szoftver: hasonlóan az MI-generálta képekhez, itt is sok az elkent, értelmetlen részlet, apró hibácska. Ami pedig talán még aggasztóbb, hogy a készítők felismerték, hogy az esetek egy százalékában a rendszer egy az egyben koppintja a tanultakat. Épp ezért, a Microsoft hanghamisító szoftveréhez hasonlóan, egyelőre ezt a programot sem hozzák nyilvánosságra. Így legalább a zenészeknek nem kell olyan pert indítaniuk, mint a képzőművészeknek.

(Fotó: Unsplash/Lucas Alexander)


Hello Szülő! Ha a gyereked nem tud valamit, akkor téged fog kérdezni. De ha te szülőként nem tudsz valamit, akkor kihez fordulsz?
A digitális kor szülői kihívásairól is találhattok szakértői tippeket, tanácsokat, interjúkat, podcastokat a Telekom családokat segítő platformján, a https://helloszulo.hu/ oldalon.
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Hogyan válasszunk külföldi egyetemet? És mennyibe fog ez kerülni a családnak?
Repül már a vén diák. Hová? Hová?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogyan vélekednek a magyarok a net veszélyeiről – és kik a leginkább fenyegetettek?
Hogy áll a magyar lakosság generációkra bontva a kiberbiztonsághoz? – Erről szól az ESET rendkívül átfogó felmérése, amelyből olyan meglepő eredmények is kiderülnek, hogy kik a romantikus csalások legfőbb célpontjai, miközben az adott csoport nem is nagyon ismeri ezt a fenyegetést.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.