Így szól a zene, amit mesterséges intelligencia szerzett

2023 / 01 / 31 / Pőcze Balázs
Így szól a zene, amit mesterséges intelligencia szerzett
A Google bemutatta MusicLM nevű szoftverét, amely néhány szavas utasítások alapján képes zenét szerezni. Az eredmények izgalmasak, de annyi a jogi és minőségi kérdés, hogy a cég még nem meri nyilvánosságra hozni a rendszert.

A TechCrunchon olvasható hír kiemeli, hogy nem ez az első ilyen kísérlet: akadt például olyan program, ami a beírt szövegből képet készített, majd abból hangokat, de a MusicLM az első, amely komplex és jó minőségű végterméket tud előállítani. A szoftver működésének az alapja hasonló azokhoz az MI-khez, amelyekről többször írtunk az elmúlt évben a Rakétán. Mindegy, hogy esszét ír József Attila szerelmi költészetéről, festményt készít arról, hogy űrlények érkeznek biciklivel a Fehér Házba, vagy épp hitelesen hangzó mondatokat ad bárkinek a szájába; a lényeg, hogy hatalmas mennyiségű adaton edzik, tanítják a programokat, amelyek egyre ügyesebben tudják utánozni azt, amit korábban láttak.

Ebben az esetben a Google kétszáznyolcvanezer órányi zenét hallgattatott meg az MI-vel, amelyet tíz hivatásos zenész látott el leírásokkal.

A tanulmány szerint nagyjából négy mondatot írtak minden hangmintáról, kitérve például a műfajra, a hangulatra vagy a tempóra. Így aztán, ha azt mondjuk a szoftvernek, hogy generáljon egy "elbűvölő jazz dalt egy emlékezetes szaxofon-szólóval és szólóénekessel", máris megkapjuk a kért hangmintát, ami a készítők szerint konzisztens minőségű marad perceken át. De azt is írhatjuk, hogy "elektronikus zene egy videojátékból, majd meditációs dal egy folyó mellett, majd tűz és tűzijáték", ami így fog szólni. Ez pedig a "reggaeton és az elektronikus zene fúziója, amitől úgy érezzük magunkat, mintha elvesztünk volna az űrben".

Nem minden dal, ami prüntyög

Ahogyan a cikk is kiemeli, a figyelemre méltó teljesítmény ellenére nem tökéletes a szoftver: hasonlóan az MI-generálta képekhez, itt is sok az elkent, értelmetlen részlet, apró hibácska. Ami pedig talán még aggasztóbb, hogy a készítők felismerték, hogy az esetek egy százalékában a rendszer egy az egyben koppintja a tanultakat. Épp ezért, a Microsoft hanghamisító szoftveréhez hasonlóan, egyelőre ezt a programot sem hozzák nyilvánosságra. Így legalább a zenészeknek nem kell olyan pert indítaniuk, mint a képzőművészeknek.

(Fotó: Unsplash/Lucas Alexander)


memoQ Lányok napja: a pályaválasztásról – nem csak lányoknak
Véget ért a memoQ Lányok napja, ami 2019 óta segíti a pályaválasztás előtt álló lányokat, hogy igazán kiteljesedjenek karrierjükben.
Hiánypótló funkcióval bővült a világszerte használt magyar szoftver
A memoQ az egyik legnépszerűbb fordítástámogató szoftver a szakmabeliek körében, a szoftver webes változata már a képernyő-felolvasó programokkal is kompatibilis, így biztosítva, hogy a vakok és gyengénlátók is önállóan tudják használni a szolgáltatást.
memoQ Lányok napja: a pályaválasztásról – nem csak lányoknak
memoQ Lányok napja: a pályaválasztásról – nem csak lányoknak
Véget ért a memoQ  Lányok napja, ami 2019 óta segíti a pályaválasztás előtt álló lányokat, hogy igazán kiteljesedjenek karrierjükben. Szenzitíven és nyitottan álltak a fiatalokhoz, kérdezték őket a digitális trendekről is: a TikTok az új YouTube, a Facebook régóta a boomereké, chatelni pedig már csak Instagramon szokás – beszámoló
Ezek a videók mutatják meg igazán, milyen fejlett kognitív képességekkel rendelkezik a Google új AI-asszisztense
Ezek a videók mutatják meg igazán, milyen fejlett kognitív képességekkel rendelkezik a Google új AI-asszisztense
A Project Astra megmosolyogtatóan ügyetlen rajzokról is gond nélkül megmondja, hogy mit ábrázolnak, ha pedig egymásután több képet mutatnak neki, akkor utólag is képes mindegyiket helyesen megnevezni.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.