એલેસ્ટિકડિફ્યૂઝન: રાઈસ યુનિવર્સિટીમાં AI સાથે છબી પેદમાં સુધારો
Brief news summary
જનરેટિવ આર્ટિફિશિયલ ઇન્ટેલિજન્સ, ખાસ કરીને ડિફ્યુઝન મોડેલા, ખાસ કરીને ચોરસ ફોર્મેટમાં ફાઇન ફીચર્સ જેવી ચહેરા સમકક્ષતા જાળવવામાં મુશ્કેલી સાથે સુસંગત અને વિગતવાર છબીઓ પેદા કરી શકે છે. રાઈસ યુનિવર્સિટીના સંશોધકો દ્વારા સીટલેમાં વિડીયો અને પેટર્ન રિકગ્નિશન માટેના IEEE 2024 કોન્ફરન્સમાં ડોક્ટરલ વિદ્યાર્થી મોયદ હાજી અલી દ્વારા રજૂ કરેલી નવી પદ્ધતિ જે એલેસ્ટિકડિફ્યૂઝન તરીકે ઓળખાય છે. સ્ટેબલ ડિફ્યુઝન અને ડીALL-E જેવા પૂર્વ મોડેલો કરતાં અનુકૂલન કરતી વખતે આધારીત ડેટા સાથે ભૂલો ઘટાડે છે, જ્યારે દ્રશ્ય સુસંગતતા જાળવે છે, વધારાના તાલીમની જરૂરિયાત વિના. હાલમાં, એલેસ્ટિકડિફ્યુઝન પરંપરાગત મોડેલો કરતા 6-9 ગણો ધીમું છે; હજીયે મહેનતો છબી પેદા કરતી વખતે વપરાયેલ સમય સાથે સુસંગત બનાવવા માટે તેની કામગીરી સુધારવા માટે છે.જૂનરેટિવ આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI), જેમ કે મોડેલો જેમ કે સ્ટેબલ ડિફ્યુઝન, મિડજર્ની, અને ડીALL-E, ખાસ કરીને ચહેરાની સમકક્ષતા અને યોગ્ય આંગળિઓના પ્રતિનિધિત્વ જેવી વિગતો સાથે સુસંગત છબીઓ પેદા કરવામાં અવારનવાર મુશ્કેલી અનુભવતી હોય છે. આ મોડેલો સામાન્ય રીતે ચોરસ છબીઓ પેદા કરે છે, જે અન્ય પાસપોર્ટ રેશિયોમાં છબીઓ બનાવવા માટેના કાર્યમાં સમસ્યાઓ પેદા કરાવી શકે છે, જેમ કે વધારાના આંગળિઓ અથવા વિકૃત આકારો. આ સમસ્યાઓને કાયદું કરવામાં, રાઈસ યુનિવર્સિટીના કમ્પ્યુટર વિજ્ઞાનીઓએ એલેસ્ટિકડિફ્યૂઝન વિકસાવ્યું છે, જે પ્રિ-ટ્રેઇન્ડ ડિફ્યુઝન મોડેલનો ઉપયોગ કરતી નવી પદ્ધતિ છે. રાઈસના ડોક્ટરલ વિદ્યાર્થી મોયદ હાજી અલીએ સીટલેમાં વિડીયો અને પેટર્ન રિકગ્નિશન માટેના IEEE 2024 કોન્ફરન્સમાં આ પદ્ધતિ રજૂ કરી. હાજી અલી સમજાવ્યું કે પરંપરાગત ડિફ્યુઝન મોડેલો ખાસ રિઝોલ્યુશનમાં જ છબીઓ પેદા કરી શકે છે, જે ઓવરફિટિંગનું પરિણામ છે, જ્યાં એક AI મોડેલ પરિચિત ડેટા પર સર્વોત્કૃ મકપર્દશન કરે છે પરંતુ ભિન્નતાઓ સાથે સંઘર્ષ કરે છે. એલેસ્ટિકડિફ્યૂઝન છબી પેદા કરતી વખતે સ્થાનિક અને વૈશ્વિક માહિતી અલગ કરીને પરિપૂર્ણતા સુધારે છે, તેમ કે તેમને શામેળાવ્ય બાંધવાની જગ્યાએ.
આ વિભાજન બિનચોરસ છબીઓ માટે અનુકૂલન કરતી વખતે પુનાવર્તિત ડેટામાંથી ઉદભવતી દ્રશ્ય અપરિપક્વતાને ટાળવામાં મદદ કરે છે. હાજી અલી તપાસ્યું કે પ્રક્રિયામાં પ્રથમ માં છબીની સમગ્ર માળખું કલ્પાયેલી ગ્લોબલ સ્કોર મેળવવું અને પછી વિભાગોમાં પિક્સેલ સ્તરે વિગતો ભરવું છે. આ પદ્ધતિ વિવિધ પાસપોર્ટ રેશિયોમાં વધુ સ્પષ્ટ છબીઓ પેદા કરવું સક્ષમ કરે છે بغیر કેવળ મોડેલ તાલીમની જરૂરિયાતને. જ્યારે એલેસ્ટિકડિફ્યૂઝન છબી પેદા કરતી વખતે વિધેયતા અને અનુકૂલનક્ષમતા પેદા કરે છે, ત્યારે તે વેપારબારી સાથે આવે છે: હાલમાં તે પરંપરાગત ડિફ્યુઝન મોડેલો કરતા 6-9 ગણો સમય લે છે. હાજી અલી પ્રક્રિયાને સર્જન સમય સાથે સુસંગત બનાવતી વખતે ઉચ્ચ ગુણવત્તાવાળી છબીઓ પેદા કરવા માટે સલાહ આપી છે.
Watch video about
એલેસ્ટિકડિફ્યૂઝન: રાઈસ યુનિવર્સિટીમાં AI સાથે છબી પેદમાં સુધારો
Try our premium solution and start getting clients — at no cost to you