Így szól a zene, amit mesterséges intelligencia szerzett

2023 / 01 / 31 / Pőcze Balázs
Így szól a zene, amit mesterséges intelligencia szerzett
A Google bemutatta MusicLM nevű szoftverét, amely néhány szavas utasítások alapján képes zenét szerezni. Az eredmények izgalmasak, de annyi a jogi és minőségi kérdés, hogy a cég még nem meri nyilvánosságra hozni a rendszert.

A TechCrunchon olvasható hír kiemeli, hogy nem ez az első ilyen kísérlet: akadt például olyan program, ami a beírt szövegből képet készített, majd abból hangokat, de a MusicLM az első, amely komplex és jó minőségű végterméket tud előállítani. A szoftver működésének az alapja hasonló azokhoz az MI-khez, amelyekről többször írtunk az elmúlt évben a Rakétán. Mindegy, hogy esszét ír József Attila szerelmi költészetéről, festményt készít arról, hogy űrlények érkeznek biciklivel a Fehér Házba, vagy épp hitelesen hangzó mondatokat ad bárkinek a szájába; a lényeg, hogy hatalmas mennyiségű adaton edzik, tanítják a programokat, amelyek egyre ügyesebben tudják utánozni azt, amit korábban láttak.

Ebben az esetben a Google kétszáznyolcvanezer órányi zenét hallgattatott meg az MI-vel, amelyet tíz hivatásos zenész látott el leírásokkal.

A tanulmány szerint nagyjából négy mondatot írtak minden hangmintáról, kitérve például a műfajra, a hangulatra vagy a tempóra. Így aztán, ha azt mondjuk a szoftvernek, hogy generáljon egy "elbűvölő jazz dalt egy emlékezetes szaxofon-szólóval és szólóénekessel", máris megkapjuk a kért hangmintát, ami a készítők szerint konzisztens minőségű marad perceken át. De azt is írhatjuk, hogy "elektronikus zene egy videojátékból, majd meditációs dal egy folyó mellett, majd tűz és tűzijáték", ami így fog szólni. Ez pedig a "reggaeton és az elektronikus zene fúziója, amitől úgy érezzük magunkat, mintha elvesztünk volna az űrben".

Nem minden dal, ami prüntyög

Ahogyan a cikk is kiemeli, a figyelemre méltó teljesítmény ellenére nem tökéletes a szoftver: hasonlóan az MI-generálta képekhez, itt is sok az elkent, értelmetlen részlet, apró hibácska. Ami pedig talán még aggasztóbb, hogy a készítők felismerték, hogy az esetek egy százalékában a rendszer egy az egyben koppintja a tanultakat. Épp ezért, a Microsoft hanghamisító szoftveréhez hasonlóan, egyelőre ezt a programot sem hozzák nyilvánosságra. Így legalább a zenészeknek nem kell olyan pert indítaniuk, mint a képzőművészeknek.

(Fotó: Unsplash/Lucas Alexander)


Robotlázadás zajlott le Kínában - egy robot megszöktetett tizenkét másikat
Robotlázadás zajlott le Kínában - egy robot megszöktetett tizenkét másikat
Úgy tűnik, hogy a robotforradalom elkezdődött, de az egész esemény valójában egy teszt volt.
Instant üzleti nyelvvizsga vagy bábeli zűrzavar: jövőre érkezik az automata szinkrontolmácsolás a Teams-be
Instant üzleti nyelvvizsga vagy bábeli zűrzavar: jövőre érkezik az automata szinkrontolmácsolás a Teams-be
De nem csak ezzel tenné hatékonyabbá az online megbeszéléseket a Microsoft.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.