lang icon En
Nov. 26, 2024, 9:17 a.m.
2595

Nvidia's Fugatto: De Revolutie van Generatieve AI voor Geluid

Brief news summary

Nvidia's Fugatto is een geavanceerde audiosynthesetechnologie die tekstprompts omzet in geluiden, hoewel het nog niet beschikbaar is voor het publiek. Een demo toont zijn indrukwekkende vermogen om effecten zoals onderwaterspraak en sireneachtige koren toe te voegen. Een grote uitdaging bij de ontwikkeling van Fugatto was het samenstellen van een dataset die complexe audio-taalinteracties vastlegt. Nvidia pakte dit aan door een taalmodel te gebruiken om scripts te creëren voor diverse audiopersona's, wat resulteerde in een dataset van 50.000 uur die essentieel is voor het trainen van het model met 2,5 miljard parameters. Een belangrijk kenmerk van Fugatto is "ComposableART", waarmee gebruikers kenmerken uit de trainingsdata kunnen combineren voor nauwkeurige controle over audioaspecten zoals accenten en emoties. Deze mogelijkheid maakt aanpassingen in spraaksentimenten en de scheiding van vocale tracks in muziek mogelijk, wat creatieve mogelijkheden biedt die verder gaan dan basale synthese. Nvidia voorziet Fugatto als een hulpmiddel om de audiocreativiteit te verbeteren in gebieden zoals muziekprototyping en dynamische spelmuziek, met als doel traditionele methoden aan te vullen in plaats van te vervangen. Het bedrijf gelooft dat AI-tools zoals Fugatto een diepgaande impact zouden kunnen hebben op het toekomstige landschap van muzikale creativiteit.

Het nieuwe "Fugatto"-model van Nvidia verbetert generatieve AI door muziek, stemmen en geluiden te transformeren en zelfs nieuwe, nog nooit eerder gehoorde geluiden te creëren. Hoewel het nog niet openbaar beschikbaar is, tonen voorbeelden op de website het vermogen om audiokenmerken aan te passen, van saxofoonklanken die als geblaf klinken tot onderwaterspraak of koren van ambulancesirenes. Vanwege deze brede vaardigheid beschrijft Nvidia Fugatto als een "Zwitsers zakmes voor geluid". De uitdaging ligt in het samenstellen van een trainingsdataset die betekenisvolle relaties tussen audio en taal benadrukt. Onderzoekers van Nvidia gebruikten een door een LLM gegenereerd Python-script om talrijke sjabloon-gebaseerde en vrije instructies te creëren om audio "personas" te beschrijven. Deze werden toegepast op een breed scala aan open-source audiodatasets en geannoteerd met natuurtalige beschrijvingen, gekwantificeerd door emotie, geslacht en spraakkwaliteit. De onderzoekers hielden bepaalde factoren constant terwijl ze andere varieerden om het model te leren onderscheid te maken tussen bijvoorbeeld vrolijkere spraak of verschillende instrumentklanken. Na het verwerken van 20 miljoen voorbeelden (50. 000 uur aan audio), gebruikten ze Nvidia tensorcores om een model met 2, 5 miljard parameters te ontwikkelen, wat betrouwbare audio kwaliteitscores liet zien. Buiten de training stelt Fugatto's "ComposableART"-systeem maatwerk in audio-uitvoer mogelijk.

Het combineert eigenschappen uit zijn dataset om nieuwe, nog niet eerder gehoorde geluiden te creëren, met behulp van "voorwaardelijke begeleiding" voor ongeziene combinaties. Hoewel niet alle uitgangen toonzuiver zijn, toont de verscheidenheid aan geluiden, zoals een viool die als een lachende baby klinkt, de transformerende vaardigheid van Fugatto aan. Cruciaal is dat Fugatto audio-eigenschappen beschouwt als afstembare continuüms, geen binaries. Het combineert geluiden, zoals een akoestische gitaar met stromend water, door de balans aan te passen, en veranderde accenten of emoties in spraak. Het voert taken uit zoals het veranderen van de emotie van gesproken tekst, het isoleren van vocale sporen, en het vervangen van noten in MIDI-muziek met gevarieerde vocale uitvoeringen. Nvidia ziet Fugatto als een stap richting ongecontroleerd multitask-leren en voorziet toepassingen in liedprototypevorming en dynamische video game scores. Dergelijke modellen zijn bedoeld als hulpmiddelen voor audioartiesten in plaats van vervangingen. Zoals producer/songwriter Ido Zmishlany stelt, hervormt technologie voortdurend muziek, waarbij AI een nieuw hoofdstuk in muzikale innovatie markeert.


Watch video about

Nvidia's Fugatto: De Revolutie van Generatieve AI voor Geluid

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 1:28 p.m.

De snelle groei en internationale uitbreiding van…

Z.ai, voorheen bekend als Zhipu AI, is een vooraanstaand Chinees technologisch bedrijf dat zich specialiseert in kunstmatige intelligentie.

Dec. 19, 2025, 1:27 p.m.

Het heden en de toekomst van AI in verkoop en GTM…

Jason Lemkin leidde de seedronde via SaaStr Fund in unicorn Owner.com, een AI-gedreven platform dat de manier waarop kleine restaurants opereren transformeert.

Dec. 19, 2025, 1:25 p.m.

Waarom ik het niet eens ben met AI over de media-…

Het jaar 2025 werd gedomineerd door AI, en 2026 zal hierin een vergelijkbare rol spelen, met digitale intelligentie als de belangrijkste ontwrichtende factor in media, marketing en reclame.

Dec. 19, 2025, 1:23 p.m.

AI-video-compressietechnieken verbeteren streamin…

Kunstmatige intelligentie (AI) transformationeert op dramatische wijze de manier waarop videocontent wordt geleverd en ervaren, vooral op het gebied van videocompressie.

Dec. 19, 2025, 1:19 p.m.

Het benutten van AI voor lokale SEO: het vergrote…

Lokale zoekmachine-optimalisatie is nu cruciaal voor bedrijven die klanten in hun directe geografische omgeving willen aantrekken en behouden.

Dec. 19, 2025, 1:15 p.m.

Adobe lanceert geavanceerde AI-agenten om digital…

Adobe heeft een nieuwe suite van kunstmatige intelligentie (AI) agents geïntroduceerd die bedoeld zijn om merken te helpen de interacties met consumenten op hun websites te verbeteren.

Dec. 19, 2025, 9:32 a.m.

Marktplaats Briefing: Hoe Amazon Verkopers SEO He…

De openbare richtlijnen van Amazon voor het optimaliseren van productvermeldingen voor Rufus, zijn AI-gestuurde shopping assistant, blijven ongewijzigd, met geen nieuw advies voor verkopers.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today