Így szól a zene, amit mesterséges intelligencia szerzett

2023 / 01 / 31 / Pőcze Balázs
Így szól a zene, amit mesterséges intelligencia szerzett
A Google bemutatta MusicLM nevű szoftverét, amely néhány szavas utasítások alapján képes zenét szerezni. Az eredmények izgalmasak, de annyi a jogi és minőségi kérdés, hogy a cég még nem meri nyilvánosságra hozni a rendszert.

A TechCrunchon olvasható hír kiemeli, hogy nem ez az első ilyen kísérlet: akadt például olyan program, ami a beírt szövegből képet készített, majd abból hangokat, de a MusicLM az első, amely komplex és jó minőségű végterméket tud előállítani. A szoftver működésének az alapja hasonló azokhoz az MI-khez, amelyekről többször írtunk az elmúlt évben a Rakétán. Mindegy, hogy esszét ír József Attila szerelmi költészetéről, festményt készít arról, hogy űrlények érkeznek biciklivel a Fehér Házba, vagy épp hitelesen hangzó mondatokat ad bárkinek a szájába; a lényeg, hogy hatalmas mennyiségű adaton edzik, tanítják a programokat, amelyek egyre ügyesebben tudják utánozni azt, amit korábban láttak.

Ebben az esetben a Google kétszáznyolcvanezer órányi zenét hallgattatott meg az MI-vel, amelyet tíz hivatásos zenész látott el leírásokkal.

A tanulmány szerint nagyjából négy mondatot írtak minden hangmintáról, kitérve például a műfajra, a hangulatra vagy a tempóra. Így aztán, ha azt mondjuk a szoftvernek, hogy generáljon egy "elbűvölő jazz dalt egy emlékezetes szaxofon-szólóval és szólóénekessel", máris megkapjuk a kért hangmintát, ami a készítők szerint konzisztens minőségű marad perceken át. De azt is írhatjuk, hogy "elektronikus zene egy videojátékból, majd meditációs dal egy folyó mellett, majd tűz és tűzijáték", ami így fog szólni. Ez pedig a "reggaeton és az elektronikus zene fúziója, amitől úgy érezzük magunkat, mintha elvesztünk volna az űrben".

Nem minden dal, ami prüntyög

Ahogyan a cikk is kiemeli, a figyelemre méltó teljesítmény ellenére nem tökéletes a szoftver: hasonlóan az MI-generálta képekhez, itt is sok az elkent, értelmetlen részlet, apró hibácska. Ami pedig talán még aggasztóbb, hogy a készítők felismerték, hogy az esetek egy százalékában a rendszer egy az egyben koppintja a tanultakat. Épp ezért, a Microsoft hanghamisító szoftveréhez hasonlóan, egyelőre ezt a programot sem hozzák nyilvánosságra. Így legalább a zenészeknek nem kell olyan pert indítaniuk, mint a képzőművészeknek.

(Fotó: Unsplash/Lucas Alexander)


Hiánypótló funkcióval bővült a világszerte használt magyar szoftver
Hiánypótló funkcióval bővült a világszerte használt magyar szoftver
A memoQ az egyik legnépszerűbb fordítástámogató szoftver a szakmabeliek körében, a 10.1-es verzió óta pedig a szoftver webes változata már a képernyő-felolvasó programokkal is kompatibilis, így biztosítva, hogy a vakok és gyengénlátók is önállóan, külső segítség nélkül tudják használni a szolgáltatást.
550 billió művelet másodpercenként – Íme a világ első, teljesen elektromos robotja!
550 billió művelet másodpercenként – Íme a világ első, teljesen elektromos robotja!
A kínai robot bár önmagában is igen elképesztő képességekkel rendelkezik, de mégiscsak egy első lépés – Kína ugyanis már jövőre tömegesen gyártana robotokat, 2027-ben pedig már gondolkodásra és akár “alkotásra” is képes humanoid gépek is futószalagra kerülnének.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.