lang icon English
Nov. 26, 2024, 9:17 a.m.
2289

Nvidia Fugatto: Helide generatiivse tehisintellekti revolutsiooniline uuendaja

Brief news summary

Nvidia Fugatto on tipptasemel heli sünteesi tehnoloogia, mis teisendab tekstipõhised juhised helideks, kuid pole veel avalikkusele kättesaadav. Demo näitab selle muljetavaldavat võimet lisada efekte nagu veealune kõne ja koorilaadsed sireenid. Üks suuremaid väljakutseid Fugatto arendamisel oli luua andmekogum, mis hõlmaks keerukaid heli- ja keeleliste interaktsioone. Nvidia lahendas selle, kasutades keelemudelit, et luua stsenaariume mitmekesiste heliisiksuste jaoks, tagades 50 000 tunni andmekogumi, mis oli hädavajalik mudeli treenimiseks ja millel on 2,5 miljardit parameetrit. Fugatto võtmeomadus on "ComposableART", mis võimaldab kasutajatel segada koolitusandmetes leiduvaid omadusi täpseks kontrolliks heliomaduste, nagu aktsendid ja emotsioonid, üle. See võime võimaldab reguleerida kõne emotsioone ja muusikas vokaaliradade eraldamist, pakkudes loomingulisi võimalusi, mis ulatuvad kaugemale lihtsalt sünteesist. Nvidia näeb Fugattot kui tööriista, mis suurendab loovust helide loomisel sellistes valdkondades nagu muusika prototüüpimine ja dünaamiline mängude helindamine, püüdes täiendada traditsioonilisi meetodeid, mitte neid asendada. Ettevõte usub, et AI-tööriistad nagu Fugatto võivad sügavalt mõjutada muusikalise loovuse tulevikumaastikku.

Nvidia uus "Fugatto" mudel täiustab generatiivset tehisintellekti, teisendades muusikat, hääli ja helisid ning luues isegi varem kuulmata helisid. Kuigi see pole veel avalikult saadaval, näitavad veebisaidi näited selle võimet muuta audio omadusi, alates saksofonidest, mis kõlavad nagu haukuvad koerad, kuni veealuse kõne või kiirabi sireenide koorideni. See lai võimekus on viinud Nvidia kirjeldama Fugattot kui helide "Šveitsi armeenuga. " Väljakutse seisneb treeningandmestiku loomises, mis rõhutab tähenduslikke seoseid heli ja keele vahel. Nvidia uurijad lõid LLM-i genereeritud Pythoni skripti abil arvukalt mallipõhiseid ja vabavormilisi juhiseid, et kirjeldada heli "persoonasid. " Need rakendati laiale valikule avatud lähtekoodiga helikomplektidele, märkides neid looduslike keelekirjeldustega, mida kvantifitseeriti emotsiooni, soo ja kõne kvaliteedi järgi. Uurijad hoidsid teatud tegurid konstantsena, samas kui teisi muutsid, et õpetada mudelile erisusi nagu rõõmsam kõne või erinevad instrumentide helid. Pärast 20 miljoni näidise (50 000 tundi heli) töötlemist kasutasid nad Nvidia tensorituumasid, et arendada mudelit, millel on 2, 5 miljardit parameetrit ja mis demonstreerib usaldusväärseid helikvaliteedi hindeid. Lisaks treenimisele võimaldab Fugatto "ComposableART" süsteem kohandatavat heliväljundit. See ühendab oma andmestikust pärit omadusi uute kuulmata helide loomiseks, kasutades "tingimuslikku juhtimist" nägemata kombinatsioonide jaoks.

Kuigi kõik tulemused pole toonitäpsed, näitab erinevate helide, nagu naerev lapsena kõlav viiul, paljusus Fugatto transformatiivset võimet. Olulisel määral käsitleb Fugatto helide omadusi häälestatavate kontinuumidena, mitte binaarsetena. See ühendab helid, nagu akustiline kitarr ja voolav vesi, muutes tasakaalu, ning kohandab aktsente või emotsioone kõnes. See täidab selliseid ülesandeid nagu räägitud teksti emotsiooni muutmine, vokaaliradade isoleerimine ja MIDI-muusika nootide asendamine erinevate vokaalesitustega. Nvidia näeb Fugattot sammuna järelevalveta multitask-õppimise suunas ning soovib seda rakendada näiteks laulu prototüüpimisel ja dünaamilistes videomängu skoorides. Sellised mudelid on mõeldud helikunstnike tööriistadeks, mitte asendajateks. Nagu produtsent/laulukirjutaja Ido Zmishlany väidab, muudab tehnoloogia pidevalt muusikat ning tehisintellekt tähistab uut peatükki muusikalises uuenduslikkuses.


Watch video about

Nvidia Fugatto: Helide generatiivse tehisintellekti revolutsiooniline uuendaja

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 10, 2025, 1:40 p.m.

Tehisintellekti optimismus tõstab pooljuhttehnolo…

Pool kogemateriaalide nõudlus on järjepidevalt kasvanud, tõstes kiipide tootjate müüki ja tulusid.

Nov. 10, 2025, 1:20 p.m.

AI-keskus SMM 2024 näitusel tutvustab tehisintell…

Aastal 2024 saavutas Hamburgi SMM näitus olulise verstaposti, määrates uued standardid koostöös tehisintellekti (AI) abil.

Nov. 10, 2025, 1:20 p.m.

Parimad tehisintellekti tööriistad SEO strateegia…

Digitaalmarketingi kiiresti muutuvas valdkonnas nõuab konkurentsivõime säilitamine tipptasemel tehnoloogiate kasutuselevõttu, kus tehisintellekt (AI) mängib nüüd olulist rolli, eriti otsingumootori optimeerimises (SEO).

Nov. 10, 2025, 1:18 p.m.

Dappier teeb koostööd News-Press & Gazette'iga, e…

Dappier, tehisintellekti andmete litsentsimisele keskendunud start-up, teatas uue partnerluse kohta News-Press & Gazette Companyga, eesmärgiga suurendada juurdepääsu kvaliteetsele uudiste sisule AI rakenduste jaoks.

Nov. 10, 2025, 1:16 p.m.

Tehisintellekti videokokkuvõtte tööriistad aitava…

Sisuloonõustajad kasutavad üha enam tehisintellekti (AI) videokoondamise tööriistu, et tõhusalt kureerida ja jagada oma publikuga asjakohast videomaterjali.

Nov. 10, 2025, 1:13 p.m.

Maailma esimene tehisintellekti turundusspetsiali…

Turundustööstus kogeb muutuste hetke, kuna turule on jõudnud Head, mis on esimene tõeline tehisintellektiga turundusplatvorm maailmas.

Nov. 10, 2025, 9:34 a.m.

Tehisintellekti loodud uudistevideod: kahe teraga…

Viimastel aastatel on tehisintellekti (AI) kiire arengu tulemusena muutunud paljud igapäevaelu aspektid, sealhulgas uudiste tootmine ja tarbimine.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today