Az Nvidia új "Fugatto" modellje fejleszti a generatív mesterséges intelligenciát azáltal, hogy átalakítja a zenét, hangokat és zajokat, sőt még soha nem hallott hangokat is képes létrehozni. Bár még nem érhető el nyilvánosan, a weboldalon található példák bemutatják, hogyan tudja módosítani a hangzó tulajdonságokat, például szaxofonokat úgy megszólaltatni, mintha ugatnának, vagy víz alatti beszédet, illetve mentőszirénákat kórusban. Ez a széleskörű képesség késztette az Nvidiát, hogy a Fugattót a hang "svájci bicskájának" nevezze. A kihívás egy olyan képzési adathalmaz kidolgozása, amely kiemeli a jelentős kapcsolódásokat az audio és a nyelv között. Az Nvidia kutatói egy LLM által generált Python szkriptet használva számos sablon alapú és szabad formájú útmutatást alkottak az audio "személyiségek" leírására. Ezeket egy széles körű, nyílt forráskódú audio adathalmazra alkalmazták, amelyeket természetes nyelvi leírásokkal annotáltak, értékelve az érzelmet, nemet és beszédminőséget. A kutatók bizonyos tényezőket állandónak tartottak, míg másokat variáltak, hogy a modell különbségeket tanuljon, mint például boldogabb beszéd vagy különböző hangszerhangok. Miután 20 millió mintát (50 000 óra audiót) feldolgoztak, az Nvidia tenzormagjainak segítségével egy 2, 5 milliárd paraméterrel rendelkező modellt fejlesztettek ki, amely megbízható audio minőségi pontszámokat mutat. A képzés mellett a Fugatto "ComposableART" rendszere lehetővé teszi a testre szabható audió kimenetet.
Az adathalmazából származó tulajdonságok kombinálásával új, soha nem hallott hangokat hoz létre, "feltételes útmutatást" alkalmazva az ismeretlen kombinációkra. Bár nem minden kimenet hangzik tökéletesen, az olyan hangok változatossága, mint például egy nevető baba hangjára emlékeztető hegedű, bemutatja a Fugatto átalakító képességét. Lényegében a Fugatto állítható kontinuumokként kezeli a hangzó tulajdonságokat, nem pedig binárisokként. Képes hangokat kombinálni, például egy akusztikus gitárt a folyó vízzel, az egyensúly módosításával, valamint változtatja a beszéd akcentusait vagy érzelmeit. Olyan feladatokat hajt végre, mint a beszélő szöveg érzelmeinek megváltoztatása, vokális sávok izolálása, és a MIDI zenében a hangjegyek különféle vokális előadásokká cserélése. Az Nvidia a Fugattót egy lépésnek tekinti a felügyelet nélküli multitask tanulás felé, és dal prototípusokban, valamint dinamikus videojáték zenékben képzel el alkalmazásokat. Ilyen modelleket az audio művészek eszközeinek szánják, nem pedig helyettesítőknek. Ahogy Ido Zmishlany producer/dalszerző mondja, a technológia folyamatosan újraformálja a zenét, az MI pedig a zenei innováció új fejezetét jelenti.
Nvidia Fugatto: A generatív mesterséges intelligencia forradalmasítása a hang területén
Egy AI-vezérelt digitális ökoszisztémában a perception nemcsak az emberi nézőpontokat, hanem a gépi értékeléseket is alakítja.
A Tidalwave projektek várhatóan több mint 200 000 hitelt érintenek 2026 végéig, a növekedést egy novemberben bejelentett 22 millió dolláros Series A finanszírozási kör hajtja, melybe Permanent Capital és D.R. Horton fektetett be.
Mesterséges intelligencia (MI) mélyrehatóan alakítja át az értékesítési környezetet, alapvetően változtatva meg, hogy a vállalkozások miként dolgozzák ki és valósítják meg értékesítési stratégiáikat.
A marketing az egyik kevés olyan funkció, amit egyetlen iparág sem engedhet meg magának, hogy figyelmen kívül hagyjon, ami magyarázza az AI-alapú marketingeszközök sorozatos, agresszív népszerűsítését a marketingesek körében ma.
A digitális marketing világa jelentős átalakuláson megy keresztül, mivel egyre nagyobb szerepet kap a mesterséges intelligencia (MI), ami jelentősen megváltoztatja a szakemberek SEO (keresőoptimalizálás) kezelését.
Az Amazon elindította a Project Rainier nevű, ambiciózus, 11 milliárd dolláros kezdeményezést, amelynek célja egy korszerű mesterséges intelligencia adatközpont megépítése Indiana államban, ezzel jelentős lépést téve a vállalat mesterséges intelligencia technológia iránti elkötelezettségében.
Vera úttörő áttörést jelent a televíziós videógyártásban, mivel kihasználja a generatív mesterséges intelligencia legújabb fejlődéseit, és átalakítja a videós tartalom létrehozásának és elosztásának módját.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today