NVIDIA otkriva Fugatto: Revolucionarni AI za generisanje zvuka i muzike
Brief news summary
NVIDIA je predstavila Fugatto, Osnovni Generativni Audio Transformer Opus 1, koji je pionirska AI tehnologija za manipulaciju zvukom. Ovaj alat omogućava korisnicima da generišu i uređuju audio sadržaje, poput muzike i glasova, jednostavno putem tekstualnih naredbi. Kreiran od strane tima međunarodnih AI stručnjaka, Fugatto se ističe u obradi različitih akcenta i jezika, sa ciljem replikacije ljudskog stvaranja zvuka, kako objašnjava Rafael Valle iz NVIDIA. Fugatto ima raznolike primjene: muzički producenti mogu brzo kreirati prototipove pjesama, osobe koje uče jezike mogu personalizovati audio sadržaje, a u igrama može prilagoditi zvukove kako bi odgovarali akcijama igrača dok planira složene audio efekte. Također ima kapacitet za proizvodnju dinamičnih, evoluirajućih zvučnih pejzaža. Iako informacije o izlasku Fugatta još nisu dostupne, na tržištu se nalaze razni drugi AI alati. Meta nudi open-source alat za konvertovanje teksta u zvuk, a Googleov MusicLM omogućava pretvaranje teksta u muziku kroz platformu AI Test Kitchen.NVIDIA je predstavila eksperimentalni generativni AI model nazvan Foundational Generative Audio Transformer Opus 1, ili Fugatto. Ovaj model, opisan kao "švicarski nož za zvuk, " koristi tekstualne sugestije za generisanje ili modifikaciju audio, muzike, glasovnih i zvučnih datoteka. Dizajniran od strane globalnog tima istraživača, njegove "višejezične i sa više naglaska sposobnosti" su poboljšane, prema NVIDIA-i. Rafael Valle, istraživač i menadžer primenjenog audio istraživanja u NVIDIA-i, izjavio je: "Željeli smo stvoriti model koji razumije i generira zvuk kao i ljudi. " Kompanija sugeriše da bi Fugatto mogao pomoći muzičkim producentima u brzom generisanju prototipova pjesama, omogućavajući lake izmjene različitih stilova, glasova i instrumenata. Fugatto bi se također mogao koristiti za generisanje glasovnih materijala za alate za učenje jezika, a developeri video igara bi mogli koristiti za kreiranje varijacija sadržaja baziranih na radnjama igrača. Nadalje, istraživači su otkrili da uz malo prilagođavanja, Fugatto može obavljati zadatke izvan svog predtreninga, kao što je kombinovanje zasebnih instrukcija za generisanje specifičnih govora ili zvučnih scenarija, poput određenog naglaska i emotivnog tona, ili pjev ptica tokom oluje.
Osim toga, može proizvoditi zvukove koji se vremenom razvijaju, poput promjene oluje. NVIDIA nije potvrdila javni pristup Fugattu. Međutim, to nije prvi generativni AI sposoban za kreiranje zvuka iz tekstualnih sugestija. Meta je objavila open-source AI alat za generisanje zvuka, a Google nudi tekst-u-muziku AI, MusicLM, dostupan kroz svoju AI Test Kitchen web-stranicu.
Watch video about
NVIDIA otkriva Fugatto: Revolucionarni AI za generisanje zvuka i muzike
Try our premium solution and start getting clients — at no cost to you