lang icon Polish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Nov. 26, 2024, 9:17 a.m.
32

Fugatto firmy Nvidia: Rewolucja w Generatywnej AI dla Dźwięku

Nowy model Nvidia "Fugatto" rozwija generatywną sztuczną inteligencję, przekształcając muzykę, głosy i dźwięki, a nawet tworząc wcześniej niesłyszane brzmienia. Jeszcze nie jest dostępny publicznie, ale przykłady na stronie internetowej pokazują jego zdolność do modyfikacji cech audio, od saksofonów brzmiących jak szczekanie, po podwodne mowy czy chóry syren ambulansów. Ta szeroka zdolność sprawiła, że Nvidia określa Fugatto jako „szwajcarski scyzoryk dla dźwięku”. Wyzwanie polega na stworzeniu zestawu danych treningowych, który podkreśla sensowne związki między dźwiękiem a językiem. Naukowcy Nvidia, używając skryptu Python generowanego przez LLM, stworzyli liczne instrukcje oparte na szablonach i w formie wolnej do opisu „osobowości” dźwięku. Zostały one zastosowane do szerokiego spektrum otwartych zbiorów danych audio, oznaczając je naturalnymi opisami emocji, płci i jakości mowy. Naukowcy utrzymali pewne czynniki stałe, zmieniając inne, aby nauczyć model rozróżniać np. bardziej szczęśliwą mowę czy różne dźwięki instrumentów. Po przetworzeniu 20 milionów próbek (50 000 godzin audio) użyli rdzeni tensorowych Nvidii do stworzenia modelu z 2, 5 miliarda parametrów, prezentując wiarygodne oceny jakości dźwięku. Poza treningiem, system "ComposableART" Fugatto pozwala na dostosowywanie wyjścia audio.

Łączy cechy z zestawu danych, aby tworzyć nowe, niesłyszane dźwięki, używając „warunkowego przewodnictwa” dla nieznanych kombinacji. Choć nie wszystkie wyniki są idealne w kwestii tonacji, różnorodność dźwięków, jak skrzypce brzmiące jak śmiejące się dziecko, pokazuje transformacyjne zdolności Fugatto. Kluczowe jest, że Fugatto traktuje cechy audio jako regulowane kontinuum, a nie jako binarne opcje. Łączy dźwięki, np. gitarę akustyczną z bieżącą wodą, zmieniając balans i dostosowując akcenty lub emocje w mowie. Wykonuje zadania takie jak zmiana emocji w mówionym tekście, izolowanie ścieżek wokalnych i zastępowanie nut w muzyce MIDI różnymi występami wokalnymi. Nvidia postrzega Fugatto jako krok w kierunku niesuperwizyjnego uczenia się wielozadaniowego i przewiduje zastosowania w prototypowaniu piosenek oraz dynamicznych ścieżkach dźwiękowych gier komputerowych. Takie modele są przeznaczone jako narzędzia dla artystów dźwiękowych, a nie jako ich zamienniki. Jak stwierdza producent/autorka piosenek Ido Zmishlany, technologia nieustannie przekształca muzykę, a AI otwiera nowy rozdział w innowacjach muzycznych.



Brief news summary

Fugatto firmy Nvidia to nowoczesna technologia syntezy dźwięku, która przekształca tekst w dźwięki, chociaż wciąż jest niedostępna dla publiczności. Demo pokazuje jej imponującą zdolność do dodawania efektów, takich jak mowa pod wodą czy syreny przypominające chór. Jednym z głównych wyzwań w rozwoju Fugatto było stworzenie zestawu danych, który uchwyci skomplikowane interakcje między dźwiękiem a językiem. Nvidia rozwiązała to, stosując model językowy do tworzenia scenariuszy dla różnorodnych osobowości dźwiękowych, co zaowocowało zestawem danych o długości 50 000 godzin, niezbędnym do trenowania modelu o 2,5 miliarda parametrów. Kluczową cechą Fugatto jest "ComposableART", umożliwiająca użytkownikom łączenie cech z danych treningowych dla dokładnej kontroli nad aspektami audio, takimi jak akcenty i emocje. Ta funkcja pozwala na dostosowanie emocji w mowie i separację ścieżek wokalnych w muzyce, oferując możliwości twórcze wykraczające poza podstawową syntezę. Nvidia przewiduje, że Fugatto będzie narzędziem wspomagającym kreatywność dźwiękową w takich obszarach jak prototypowanie muzyki i dynamiczne tworzenie ścieżek dźwiękowych do gier, mając na celu uzupełnienie tradycyjnych metod, a nie ich zastępowanie. Firma uważa, że narzędzia AI, takie jak Fugatto, mogą głęboko wpłynąć na przyszły krajobraz muzycznej kreatywności.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 17, 2025, 2:23 p.m.

Justin Sun's Tron wejdzie na giełdę poprzez odwro…

Justin Sun, założyciel ekosystemu blockchain Tron wart 26 miliardów dolarów, ogłosił plany wejścia Tron na giełdę poprzez odwróconą fuzję z notowanym na Nasdaq SRM Entertainment, co stanowi kluczowy krok w rozwoju i zwiększeniu widoczności Trona w sektorach finansowym i technologicznym.

June 17, 2025, 2:22 p.m.

Najwyższy urzędnik ds. pracy Trumpa: pracownicy w…

Keith Sonderling, były zastępca Sekretarza Pracy za czasów administracji Trumpa, niedawno podkreślił główną barierę w wdrażaniu sztucznej inteligencji na rynku pracy w USA: brak zaufania ze strony pracowników.

June 17, 2025, 10:42 a.m.

Avail przechodzi na pełny stos technologiczny, ab…

17 czerwca 2025 – Dubaj, Zjednoczone Emiraty Arabskie Avail oferuje jedyny w swoim rodzaju stos blockchain, który zapewnia horyzontalną skalowalność, łączność między łańcuchami oraz zunifikowaną płynność, przy jednoczesnym zachowaniu decentralizacji

June 17, 2025, 10:29 a.m.

Microsoft i OpenAI prowadzą trudne negocjacje dot…

Microsoft i OpenAI obecnie uczestniczą w skomplikowanych i napiętych negocjacjach, które mogą znacząco przekształcić ich strategiczne partnerstwo i wpłynąć na szerszy rynek sztucznej inteligencji.

June 17, 2025, 6:28 a.m.

Grupa kryptowalutowa Tron wprowadzi się na giełdę…

Firma blockchainowa Tron, związana z hongkońskim przedsiębiorcą kryptowalutowym Justinem Sunem, przygotowuje się do wejścia na giełdę w Stanach Zjednoczonych poprzez odwróconą fuzję z SRM Entertainment (SRM.O).

June 17, 2025, 6:15 a.m.

OpenAI zabezpiecza kontrakt obronny Stanów Zjedno…

OpenAI zabezpieczyło kontrakt o wartości 200 milionów dolarów od Departamentu Obrony USA, co stanowi ważny kamień milowy we współpracy w dziedzinie sztucznej inteligencji z sektorem obrony federalnej.

June 16, 2025, 2:43 p.m.

Eksperci ds. AI dyskutują o potencjalnych zagroże…

Szybki postęp sztucznej inteligencji (SI) wywołał poważne dyskusje i obawy wśród ekspertów, szczególnie w kwestii jej długoterminowych skutków dla ludzkości.

All news