એનવિડિયા દ્વારા ફ્યુગાટ્ટોનું અનાવરણ: અવાજ અને સંગીત ઉત્પન્ન કરવા માટેની એક ક્રાંતિકારી કૃત્રિમ બુદ્ધિ.
Brief news summary
NVIDIA એ Fugatto રજૂ કર્યું છે, જે Foundational Generative Audio Transformer Opus 1 છે, જે ઓડિયો મેનીપ્યુલેશન માટેના AI ટેક્નોલોજીમાં અગ્રગણ્ય છે. આ ટૂલ યુઝર્સને માત્ર ટેક્સ્ટ પ્રોમ્પ્ટ્સ દ્વારા સંગીત અને અવાજ જેવી ઓડિયો પેદા કરવા અને સંપાદિત કરવાની મnośćતા આપે છે. આંતરરાષ્ટ્રીય AI નિષ્ણાતોની એક ટીમ દ્વારા બનાવાયેલી, Fugatto વિવિધ ઉચ્ચારો અને ભાષાઓને પ્રોસેસ કરવામાં કુશળ છે, માનવ જેવી અવાજ પેદા કરવાની મહેનત છે, જેમ કે NVIDIAના રાફેલ વેલી દ્વારા સમજી શકાય છે. Fugattoનાં વિવિધ ઉપયોગો છે: સંગીત ઉત્પાદકો ફટાફટ ગીતોના પ્રોટોટાઇપ્સ બનાવી શકે છે, ભાષા શીખનારાઓ ઓડિયો સામગ્રીને વ્યકિતગત બનાવી શકે છે, અને ગેમિંગમાં, તે રમનારાઓની ક્રિયાઓ સાથે અવાજોને અનુકૂળ બનાવી શકે છે જ્યારે સંપૂર્ણ ઓડિયો અસર માટે આયોજન કરી શકે છે. તેમાં ગતિશીલ, વિકસતી અવાજના દ્રશ્યો ઉત્પન્ન કરવાની ક્ષમતા પણ છે. જ્યારે Fugattoના રજૂઆત વિશેની જાણકારી હજી ઉપલબ્ધ નથી, અન્ય વિવિધ AI ટૂલ્સ બજારમાં છે. Meta ટેક્સ્ટને અવાજમાં કન્વર્ટ કરવા માટે ખુલ્લા સ્ત્રોત ટૂલકિટ આપે છે, અને Google's MusicLM AI Test Kitchen પ્લેટફોર્મ મારફતે ટેક્સ્ટથી મ્યુઝિકની સુવિધા પ્રદાન કરે છે.NVIDIA એ Foundational Generative Audio Transformer Opus 1 અથવા Fugatto નામથી એક પ્રાયોગિક જનરેટિવ AI મોડેલ રજૂ કર્યો છે. આ મોડલને "ધ્વનિ માટેની સ્વિસ આર્મી છરી" તરીકે વર્ણવવામાં આવ્યું છે, જે ટેક્સ્ટ પ્રોમ્પ્ટ્સનો ઉપયોગ કરીને ઓડિઓ, મ્યુઝિક, વોઇસ અને સાઉન્ડ ફાઇલો પેદા અથવા ફેરફાર કરી શકે છે. NVIDIA અનુસાર, વૈશ્વિક સંશોધકોની ટીમ દ્વારા ડિઝાઇન કરાયેલા Fugatto ની "મલ્ટી-એક્સેન્ટ અને મલ્ટીલિંગ્વલ ક્ષમતા" વધારવામાં આવી છે. NVIDIA ના એપ્લાઇડ ઓડિયો રિસર્ચના સંશોધક અને મેનેજર, રફેલ વેલે એ કહ્યું, "અમે એવું મોડલ બનાવવું માગતા હતા કે જે મનુષ્યની જેમ ધ્વનિને સમજે અને પેદા કરે. " કંપની સૂચવે છે કે Fugatto સંગીત નિર્માતાઓને દ્રুতપણે ગીત પ્રોટોટાઇપ પેદા કરવામાં મદદ કરી શકે છે, વિવિધ શૈલીઓ, અવાજો અને સાધનોમાં સહેલાઈથી ફેરફાર કરવાની મંજૂરી આપે છે. Fugatto વોઇસ મટેરિયલ પેદા કરવા માટે ભાષા શીખવાની साधनोમાં ઉપયોગ કરી શકાય છે, અને વિડિયો ગેમ ડેવલપર્સ મૂળભૂત પ્લેયર એક્શન્સ પર આધારિત ટોચના વેરિયેશન્સ બનાવવા માટે તેનો ઉપયોગ કરી શકે છે. વધુમાં, સંશોધકોએ શોધ્યું કે થોડી ફાઇન-ટ્યુનિંગ સાથે Fugatto pretrained ક્ષમતાઓની બહાર કાર્યો કરી શકે છે, જેમ કે અલગ સૂચનાઓને સંયોજિત કરીને ખાસ ભાષણ અથવા અવાજની પરિસ્થિતિઓ, જેમ કે ખાસ એક્સેન્ટ અને ભાવનાત્મક સ્વર અથવા વાદળછાયું વાતાવરણમાં પક્ષીઓની કૂક સુરી દર્શાવવા માટે.
ઉપરાંત, તે સમય સાથે વિકસતો અવાજ પણ પેદા કરી શકે છે, જેમ કે ભીજ વાવાઝોડું. NVIDIA એ Fugatto માટે જાહેર ઉપયોગની પુષ્ટિ નથી કરી. તેમ છતાં, તે ટેક્સ્ટ પ્રોમ્પ્ટ્સ પરથી ધ્વનિ પેદા કરવા માટે સક્ષમ પ્રથમ જનરેટિવ AI નથી. Meta એ અવાજ પેદા કરવાની ઓપન-સોર્સ AI કિટ બહાર પાડી છે, અને Google એ પોતાના AI Test Kitchen વેબસાઇટ દ્વારા MusicLM નામનું ટેક્સ્ટ-ટૂ-મ્યુઝિક AI ઉપલબ્ધ કર્યું છે.
Watch video about
એનવિડિયા દ્વારા ફ્યુગાટ્ટોનું અનાવરણ: અવાજ અને સંગીત ઉત્પન્ન કરવા માટેની એક ક્રાંતિકારી કૃત્રિમ બુદ્ધિ.
Try our premium solution and start getting clients — at no cost to you