ડેટા-સંવેદનશીલ તાલીમનો પુનર્વિચાર: AI મોડેલ્સનો ભવિષ્ય
Brief news summary
AI ઉદ્યોગના અગ્રણીઓ ભાષા મોડેલો તાલીમ આપવા માટે મોટા ડેટાસેટ્સ પર ઊંડો આધારને ફરીથી વિચારતા થયા છે. OpenAI, Meta અને Google જેવી કંપનીઓ પરંપરાગત રીતે માનતી છે કે વધુ ડેટા કાર્યોક્ષમતામાં વધારો કરે છે, ખાસ કરીને ટ્રાન્સફોર્મર આર્કિટેક્ચરના ઉપયોગથી. જોકે, ચિંતાઓ વધતી જતી છે કે આ વ્યૂહરચનાથી મેલ ઓછું મળી શકે છે, જે વૈકલ્પિક પદ્ધતિઓની શોધખોળને પ્રોત્સાહન આપે છે. સ્કેલ AIના એલેક્ઝાન્ડર વાંગ, સ્કેલિંગ અંગે બહુ જોર આપવા સાથેના મુદ્દાઓને રેખાંકિત કરે છે. Cohereના સીઇઓ આઇડન ગોમેસ વર્તમાન અભિગમની અકાર્યક્ષમતાને આલોચે છે અને નાના, ખર્ચ-અસરકારક મોડેલો માટે સમર્થન આપે છે. કેટલાક નિષ્ણાતોએ શંકા વ્યક્ત કરી છે કે વર્તમાન તકનીકો કૃત્રિમ અખિલ વિશ્વસનની બુદ્ધિને હાંસલ કરી શકશે કે નહીં. રિચાર્ડ સોચર પ્રશ્નોને કોડમાં પરિવર્તિત કરીને મોડેલની નિખાલસતામાં સુધારના નવા પદ્ધતિ સૂચવે છે. ચિંતાઓ હોવા છતા, કેટલાક સ્કેલિંગને લઈને આશાવાદી છે. માઇક્રોસોફ્ટના સીટીઓ કેવિન સ્કોટ વિભિન્ન દ્રષ્ટિકોણ આપે છે અને ઓપનએઆઇ નવીન પ્રયોગો ચાલુ રાખે છે. સપ્ટેમ્બરમાં, ઓપનએઆઇએ o1 મોડેલ નું પરિચય આપ્યું, જે પરિમાણાત્મક કાર્યોમાં શ્રેષ્ઠ છે અને ChatGPTને પાછળ મૂક્યું. વલીદ કાદોસ મુજબ, જ્યારે GPT-4 ઝડપી પ્રતિસાદ આપે છે, o1 મોડેલ વધુ ઊંડા વિશ્લેષણ પ્રદાન કરે છે, જેમાં વપરાશકર્તાઓને સુધારેલી અર્થઘટન ક્ષમતાઓ મળે છે.AI નેતાઓ વિશાળ ભાષા મહિરતના મોડેલો માટે ડેટા-ગૂણવત્તાવાળી તાલીમનું પુનર્મૂલ્યાંકન કરી રહ્યા છે કારણ કે પરંપરાગત મોડેલો, જે ડેટાની સાથે રેખીય રીતે ફેલાય છે, તેના મર્યાદા સુધી પહોંચી ગયા હોય શકે છે. ઉદ્યોગ હવે નાના, વધુ કાર્યક્ષમ મોડેલો અને નવી તાલીમ પદ્ધતિઓને સમર્થન આપી રહ્યો છે. વર્ષોથી, OpenAI, Meta, અને Google જેવી કંપનીઓએ વિશાળ ડેટાસેટ્સ એકઠા કર્યા છે, ધારણ કરીને કે વધુ ડેટા વધુ સ્માર્ટ મોડેલો પરિણામ આપે છે. પરંતુ પરંપરાગત બુદ્ધિ ફરીથી વિચારવામાં આવી રહી છે. સંશોધન દર્શાવે છે કે ટ્રાન્સફોર્મર્સ, જે આ મોડેલો પાછળની ન્યૂરલ નેટવર્ક્સ છે, તે તેઓને મળતી ડેટા અને ગણતરી શક્તિ સાથે મહત્તમ થાય છે. મોહમ્મદ બિન ઝયેદ યુનિવર્સિટી ઓફ આર્ટીફિશિયલ ઇન્ટેલિજન્સના સલાહકાર એલેક્સ વોઇકાએ સમજાવ્યું કે પરંપરાગત ટ્રાન્સફોર્મર મોડેલો આ રેખીય સંબંધનું પાલન કરે છે. પરંતુ અધિકારીઓ આ અભિગમમાં મર્યાદા જોઈ રહ્યા છે અને ટેક્નોલોજી ને આગળ વધારવાની નવી રીતો શોધી રહ્યા છે. AIમાં મોટા મૂડીરોકાણો આ માન્યતા પર આધારિત રહ્યા છે કે આ સ્કેલિંગ ચાલુ રહેશે, જેમ કે સ્કેલ AIના સીઈઓ એલેક્ઝાન્ડ્ર વાંગ એને "ઉદ્યોગમાં મોટી પ્રશ્ન" કહેતા છે.
કેટલાક દલીલ કરે છે કે વર્તમાન પદ્ધતિ સરળ છે; કોરના સીઈઓ એઇડન ગોમેઝ કહે છે કે માત્ર મોડેલો અને ગણતરીને વધારવું તે માડલ્સને સુધારવાની સૌથી વિશ્વસનીય અને સૌથી ઓછું નવીન રીત છે. ગોમેઝ નાના, ખર્ચ-પ્રભાવશાળી મોડેલો પ્રોત્સાહન આપે છે, જેને ઉદ્યોગના સમર્થન પણ મળી રહ્યું છે. પરંતુ ચિંતા છાપ રહી છે કે આ અભિગમ કૃત્રિમ સામાન્ય બુદ્ધિ, કે જે માનવ સ્તરના બુદ્ધિવાળા AIનું લક્ષ્ય છે, તે હાંસલ નહીં કરી શકે. મોટા ભાષા મોડેલો "અગાઉનો ટોકન" અનુમાનવા માટે તાલીમમાં મુકવામાં આવે છે, જેમ Richard Socher, You. comના સીઈઓએ સમજાવ્યું છે. તે કહે છે કે પ્રશ્નોને કોડમાં રૂપાંતરિત કરીને મોડલો સુધારી શકાય છે, જેથી ભૂલો ઘટે અને ક્ષમતાઓ વધે. બધા નેતાઓ આ મતલબે નથી કે AI મર્યાદા મા ચૂકી ગઈ છે. Microsoftના સીટીઓ કેવિન સ્કોટ દલીલ કરે છે કે સ્કેલિંગ હજુ પણ વળતર આપે છે, કેટલીક ઉદ્યોગ માની ઢીલા મૂમતાવાળી ધારણાની વિરુદ્ધ. ઉદાહરણ તરીકે, OpenAI ચાલુ મોડેલો જેમ કે o1 ને સુધારવાનો પ્રયાસ કરે છે, જે સપ્ટેમ્બરમાં બહાર પડેલી વિશિષ્ટ પોસ્ટ બતાવતી મપમંવામાં કામ કરી રહી છે. o1 અને ChatGPT વચ્ચેનો મતલબ તે છે કે o1નો સુધારેલો પ્રોસેસિંગ સમય છે જવાબો જનરેટ કરવા માટે. વલીદ કાદોસ, ભૂતપૂર્વ એન્જિનિયરિંગ લીડ, GPT-4 ને વાતૂઃળ મિત્ર કહે છે જે ઘણી વિચારણાઓ આપે છે, જ્યારે o1 ભાવે મા વિઘીણ વ્યક્તિ સર્વે સાચી જવાબો આપે છે.
Watch video about
ડેટા-સંવેદનશીલ તાલીમનો પુનર્વિચાર: AI મોડેલ્સનો ભવિષ્ય
Try our premium solution and start getting clients — at no cost to you