lang icon En
Nov. 26, 2024, 9:17 a.m.
3099

એનવિડિયાનો ફગાટ્ટો: અવાજ માટે જનરેટિવ AIમાં ક્રાંતિ લાવી રહ્યું છે

Brief news summary

Nvidia નું Fugatto એક અદ્યતન ઓડિયો સિન્થેસિસ ટેકનોલોજી છે જે ટેક્સ્ટ પ્રોમ્પ્ટને ધ્વનિયમાટે ફેરવે છે, જો કે તે જાહેર જનતા માટે હજુ ઉપલબ્ધ નથી. ડેમો તેની પ્રભાવશાળી ક્ષમતા દર્શાવે છે જેમ કે અંડરવોટર સ્પીચ અને કૉયરના જેવી સાઇરન જેવા અસર જોડવામાં આવે છે. Fugatto વિકસિત કરવા માટેનો એક મુખ્ય પડકાર એક ડેટાસેટ નમણિયું કરવાનો હતો કે જે જટિલ ઓડિયો-ભાષા ક્રિયાપ્રતિક્રિયાઓને કેદ કરે છે. Nvidia એ વિવિધ ઓડિયો પર્સોના માટે સ્ક્રિપ્ટ્સ બનાવવા માટે ભાષા મોડેલનો ઉપયોગ કરીને આનો સામનો કર્યો, 50,000 કલાકના ડેટાસેટના પરિણામે જે મોડેલને ટ્રેઇન કરવા માટે જરૂરી હતું, જે 2.5 અબજ પૅરામીટરો ધરાવે છે. Fugatto ની એક મુખ્ય વિશેષતા "ComposableART" છે, જેને વપરાશકર્તાઓને પ્રશિક્ષણ ડેટામાંથી લક્ષણો મિશ્રિત કરવાની સક્રિયતા આપે છે જેથી કરીને ઉચ્ચારણ અને ભાવના જેવા ઓડિયો પાસાઓ પર સચોટ નિયંત્રણ મળી શકે. આ ક્ષમતા ભાષણની ભાવનાઓમાં ફેરફાર કરવાની અને સંગીતમાં વોકલ ટ્રૅકને અલગ કરવાની મંજૂરી આપે છે, મૂળભૂત સિન્થેસિસથી આગળ સર્જનાત્મક શક્યતાઓ પ્રદાન કરે છે. Nvidia Fugatto ને સંગીતની પ્રોટોટાઇપિંગ અને ગેમ સ્કોરિંગમાં અવાજની સર્જનાત્મકતા વધારવા માટે એક સાધન તરીકે જોવાનું રહેશે, જે તે પરંપરાગત પદ્ધતિઓને બદલે નું આવરણ નહીં કરશે. કંપની માનતી છે કે Fugatto જેવો AI સાધનો સંગીત સર્જનની ભવિષ્યની દృશ્યાવલીઓને ઊંડું અસર કરી શકે છે.

Nvidiaનો નવો "Fugatto" મોડલ જેનરેટિવ AIને વધારાને બદલે સંગીત, અવાજ અને ધ્વનિઓને વિકસિત કરી શકે છે, એવું સૂચવે છે કે તે અગાઉથી અસાધારણ અવાજો પણ બનાવી શકે છે. હજી સુધી જાહેરમાં ઉપલબ્ધ નથી છતાં, વેબસાઇટ પરના ઉદાહરણો તેનો અવાજના ગુણધર્મો સુધારવાની ક્ષમતા દર્શાવે છે, જેમ કે સેક્સોફોનને બાર્કિંગ જેવું અથવા પાણીનાઢમાં બોલાય તેવું કે એમ્બ્યુલન્સ સીરન્સના ચોરસ ફાર્મેશનની ગાયકી. આ વ્યાપક ક્ષમતાની અસરમાં Nvidia Fugattoને એક પ્રકારનું "સ્વિસ આર્મી ચાકુ સ્ઊન્ડ માટે" કહે છે. મુશ્કેલી એક એવા ટ્રેનિંગ ડેટાસેટ તૈયાર કરવામાં છે જે ધ્વનિ અને ભાષા વચ્ચેના અર્થપૂર્ણ સંબંધોને આગાહ કરે છે. Nvidiaના સંશોધકોએ, એક LLM-મૂળિત પિથોન સ્ક્રિપ્ટનો ઉપયોગ કરીને, અઢળક નમુના આધારિત અને મુક્ત-અન્વેષણ સૂચનાઓ બનાવી, જેનો ઉપયોગ અવાજ "વ્યક્તિમૂર્તિઓ"નો વર્ણન કરવા માટે થયો. આ વિવિધ ખોલા સ્ત્રોત અવાજ ડેટાસેટ્સ માટે લાગુ પડ્યું, જેઓને નેચરલ લૅન્ગ્વેજ વર્ણનો સાથે ચિહ્નિત કરી, ભાવના, જાત અને ભાષણની ગુણવત્તાના આધારે . સંશોધકોએ કેટલાક પરિબળોને સ્થાયી રાખી અન્યોને પરિવૃત્તિ કરી મોડલના ભિન્નતા શીખવવા જેમ કે વધુ ખુશાળ ભાષણ અથવા વિવિધ સાધનના અવાજો. ૨. ૫ અબજ પેરેમીટર ધરાવતી મોડલ બનાવવાનું કામ કરવામાં ૨૦ મિલિયન નમૂનાઓ (૫૦, ૦૦૦ કલાકનો અવાજ) સંચાલિત કર્યા પછી, તેમણે Nvidia ટેન્સર કોરનો ઉપયોગ કર્યો. પ્રશિક્ષણની આગળ વઘમાં, Fugattoનું "ComposableART" સિસ્ટમ કસ્ટમાઇઝેબલ અવાદ ઉદ્યોગને મંજૂરી આપે છે.

તે તેનો ડેટાસેટમાંથી લક્ષણો જોડીને નવા, ન સંભળાયેલા અવાજો બનાવે છે, "શરતો મુજબ માર્ગદર્શન"ના ઉપયોગથી અવિશીષ્ઠ સંયોજનો માટે. જ્યારે બધી ઉદ્પન્નો પિચ-નિર્મળ નથી, તો પણ વેરાફેરાના અવાજો, જેમ કે હસતા બાળક જેવું વાગતું વાયોલિન, Fugattoની પરિવર્તનક્ષમ ક્ષમતા દર્શાવે છે. મહત્વપૂર્ણ રીતે, Fugatto અવાજના લક્ષણોને ટ્યુનેબલ સતત તરીકે જોવા છે, બાઇનરી તરીકે નહીં. તે ધ્વનિઓ, જેમ કે એકોસ્ટિક ગિટાર સાથે વહેતું પાણી, સંયોજનથી તુલાત્મકતા બદલવા, અને ભાષણમાં ભાષા અથવા ભાવનાને ગોઠવવા કરે છે. તે ભાષણ લિપિ ભાવનાને બદલવું, વોકલ ટ્રેક અલગ કરવી, અને MIDI સંગીતમાં લક્ષ્યોને વિવિધ વોકલ પ્રદર્શન સાથે બદલવાં કરે છે. Nvidia Fugattoને સ્વયંસાધિત મલ્ટિટાસ્ક લર્નિંગ તરફના પગલાં તરીકે જોવે છે અને ગીત પ્રોટોટાઇપિંગ અને ગતિશીલ વિડિયો રમત સ્કોર્સમાં ઉપયોગીતા ગયો છે. આવા મોડલો અવાજના કલાકારો માટે સાધનો છે, અર્થાત્ પ્રતિનિધિ નહીં. જેમ કે ઉત્પાદક/ગીતલેખક ઇડો ઝમિશલાની કહે છે, ટેકનોલોજી સતત સંગીતને રૂપાંતરિત કરી રહી છે, જે આઇએ દ્વારા સંગીતમાં નવી નવ્ઝીનું કલ્પિત છે.


Watch video about

એનવિડિયાનો ફગાટ્ટો: અવાજ માટે જનરેટિવ AIમાં ક્રાંતિ લાવી રહ્યું છે

Try our premium solution and start getting clients — at no cost to you

Content creator image

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

March 11, 2026, 2:31 p.m.

એનvideઆ ડેવલપ કરી રહ્યું છે 'નિવેમોક્લો' એઆઈ એજంట్ ઓ…

ન્વિડિયા એક નવો એઆઈ એજન્ટ NemoClaw વિકસાવી રહ્યું છે, જે OpenClaw અને અન્ય સમાન એઆઈ ટૂલો સાથે સ્પર્ધા કરવા માટેDesigned છે.

March 11, 2026, 2:24 p.m.

સોશિયલ મીડિયા એલгоритમ: ૨૦૨૫ માટે તમામ મોટાં નેટવ…

ભગવાન કે તરત કન્ટેન્ટને તેલ માટે તાત્કાલિક શોર્ટકો જાણી શકાતી નથી, પરંતુ સત્ય અને માન્ય રીતો અને વ્યૂહરચનાઓ અવશ્ય હાજર છે જે સવારિક ઉપાડે અમુક ચોક્કસ મુદ્દાઓનું પાલન કરીને ઓર્ગેનિક રીચને મહત્તમ કરી શકે છે.

March 11, 2026, 2:18 p.m.

ઓપેનએઆઇએ લિંક્ડઇન સાથે સ્પર્ધા કરવા માટે એઆઈ નોકરીઓ …

ઓપનએઆઈ रोजगारક્ષેત્રને રૂપાંતરિત કરવામાં બે મુખ્ય પહેલlerle માન્ય પ્રગતિ કરી રહી છે, જે કૃત્રિમ બુદ્ધિનો ઉપયોગ કરીને નોકરી શોધનારાઓને કામદાતાઓ સાથે જોડે છે સાથે સાથે કર્મચારીમાં AI કુશળતાનું વિકાસ કરે છે.

March 11, 2026, 2:16 p.m.

નવો એએસઓ: રેન્કિંગથી ભલામણો સુધી એઆઇ શોધમાં

કૃત્રિમ બુદ્ધિનું ઝડપી અને સતત વિકસાનારા ક્ષેત્ર શોધ અન્યથા ટેક્નોલોજી પરિવર્તન કરી રહ્યું છે, જે વ્યવસાયોને તેમને સામગ્રીની વ્યૂહરચનાઓ પર પુનર્વિચાર કરવા માટે પ્રેરણા આપે છે.

March 11, 2026, 2:15 p.m.

માઇક્રોસોફ્ટે ટાઉન હોલમાં એઆઇ વેચાણની જાહેરાત કરી, …

માઇક્રોસોફ્ટ કોર્પોરેશનએ તાજેતરમાં કંપનીના સમગ્ર ટાઉનહોલ બેઠક દરમિયાન પોતાની આર્ટિફિશિયલ ઈન્ટેલિજન્સ (AI) ટૂલ્સની અપનાવમાં મહત્વપૂર્ણ પ્રગતિ દર્શાવી છે.

March 11, 2026, 2:15 p.m.

Recall.ai: વિડિયोकૉન્ફરન્સ રેકોર્ડિંગ માટે એઆઈ ટૂલ્સ …

कल्पना કરો કે નવા કર્મચારીનું કર્મચારી પસંદગી માત્ર લેખિત સામગ્રીઓ—ઈમેઈલ, દસ્તાવેજ—પઠન કરીને કરવામાં આવે છે—કોઈ વાતચીતના بغیر.

March 11, 2026, 10:24 a.m.

કેવી રીતે SMM પેનલ્સ સોશિયલ મીડિયા માર્કેટિંગ અને વ…

ડિજિટલ માર્કેટિંગ 2026માં એસએમએમ પેનલ્સ સોશિયલ મીડિયામાં માર્કેટિંગ અને વૃદ્ધિ કેવી રીતે બદલાઇ રહી છે સિમરન મિશ્રા દ્વારા | મનિષા શર્મા દ્વારા સમીક્ષા કરાયેલ સારાંશ: એસએમએમ પેનલ્સ સોશિયલ મીડિયા પર પ્રથમ ભાગીદારી વધારવામાં મદદ કરે છે, પોસ્ટ્સની દેખાશણી વધarei તેમજ વધુ પાત્રો સુધી કન્ટેન્ટ ઝડપી પહોંચાડવાનું તક આપે છે

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

AI Company welcome image

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today