lang icon English
Dec. 26, 2024, 8:59 p.m.
12827

डीपसीक V3: चीनचा अग्रगण्य ओपन AI मॉडेल अनावरण करण्यात आला.

Brief news summary

डीपसीक, एक प्रमुख चिनी एआय कंपनी, ने डीपसीक V3, हा ओपन-सोर्स एआय मॉडेल लॉन्च केला आहे. हे मॉडेल विकसकांना विविध हेतूंसाठी, त्यात व्यावसायिक उपयोगांसह, डाउनलोड करण्याची, बदलण्यासाठी आणि वापरण्याची परवानगी देते. डीपसीक V3 कोडिंग, भाषांतर, आणि लेखन कार्यांमध्ये उत्कृष्ट आहे, आणि हे सहसा मेटा, ओपनएआय, आणि अलीबाबा सारख्या प्रतिस्पर्ध्यांच्या तुलनेत चांगले कार्य करते. त्याच्या क्षमता 14.8 ट्रिलियन टोकन आणि 671 अब्ज पॅरामिटर असलेल्या मोठ्या डेटासेटवर विस्तृत प्रशिक्षणामुळे आहेत, जे मेटाच्या लामा 3.1 च्या 405 अब्ज पॅरामिटर्सपेक्षा जास्त आहे. या विशाल डेटासेटसाठी विशेष हार्डवेअरची आवश्यकता आहे उत्कृष्ट कार्यक्षमतेसाठी. डीपसीकने दोन महिन्यांसाठी Nvidia H800 GPUs वापरले, ज्यामुळे ओपनएआयच्या GPT-4 च्या तुलनेत किफायतशीर प्रशिक्षण प्रक्रिया झाली. त्याच्या शक्ती असूनही, हा मॉडेल राजकीय संवेदनशील विषयांसारख्या बाबींमध्ये आव्हानांना सामोरे जातो, जसे की तियानमेन चौक, चीनी नियमांचे पालन करण्यासाठी. हाय-फ्लायर कॅपिटल मॅनेजमेंट एआय सर्व्हर इन्फ्रास्ट्रक्चर, त्यात मोठे Nvidia GPU क्लस्टर समाविष्ट आहे, मध्ये गुंतवणूक करून डीपसीकला समर्थन देते, "अत्युच्च बुद्धिमान" प्रणालीकडे एआयला पुढे नेण्यासाठी आणि बंद-स्रोत एआयच्या मर्यादा ओलांडण्यासाठी.

एक चीनी प्रयोगशाळा एका अत्यंत शक्तिशाली "ओपन" AI मॉडेलचे अनावरण केले आहे, ज्याला DeepSeek V3 म्हणतात. AI फर्म DeepSeek द्वारे विकसित केलेले हे मॉडेल बुधवारी एक उदार अनुज्ञप्ती अंतर्गत प्रकाशित केले गेले आहे, ज्यामुळे विकसकांना ते डाउनलोड आणि सुव्यवस्थित करण्याची परवानगी मिळते, व्यावसायिक उपयोगांसह जवळपास सर्व उद्देशांसाठी. DeepSeek V3 विविध मजकूर-आधारित कार्यांमध्ये पारंगत आहे, जसे कि कोडिंग, भाषांतर, आणि निबंध व ईमेलचा मसुदा तयार करणे. DeepSeek च्या अंतर्गत चाचण्यांनुसार, DeepSeek V3 दोन्ही डाउनलोडसाठी उपलब्ध, "ओपन" मॉडेल्स आणि केवळ API द्वारे प्रवेशाजोग्या "क्लोज्ड" AI मॉडेल्सपेक्षा श्रेष्ठ आहे. कोडफोर्सेसच्या प्रोग्रामिंग स्पर्धांमध्ये, DeepSeek इतर मॉडेल्सपेक्षा उत्कृष्ट प्रदर्शन करते, ज्यामध्ये Meta’s Llama 3. 1 405B, OpenAI’s GPT-4o, आणि Alibaba’s Qwen 2. 5 72B यांचा समावेश आहे. हे Aider Polyglot चाचण्यांमध्येही पारंगत आहे, ज्याचा उद्देश हा आहे की मॉडेल विद्यमान कोडमध्ये एकत्रित होणारा नवीन कोड लिहू शकते की नाही याचा अंदाज घेणे. DeepSeek V3 चा प्रशिक्षण डेटासेट 14. 8 ट्रिलियन टोकन्सचा आहे. डेटा सायन्समध्ये, टोकन्सला असंख्या कच्च्या डेटाचे घटक मानले जाते, जिथे 1 दशलक्ष टोकन्स साधारणतः 750, 000 शब्दांसमान आहेत. हे मॉडेल आकारानेही विशाल आहे, 671 अब्ज पॅरामिटर्स (किव्हा AI डेव्हलपमेंट प्लॅटफॉर्म Hugging Face वर 685 अब्ज), जे आतंरिक चल मॉडेल्स वापरतात निर्णय घेण्यासाठी. हा आकार Llama 3. 1 405B च्या 405 अब्ज पॅरामिटर्सपेक्षा सुमारे 1. 6 पट अधिक आहे. सामान्यतः, अधिक पॅरामिटर्स असलेले मॉडेल चांगले कार्य करतात, पण त्यांना कार्यक्षमतेसाठी शक्तिशाली हार्डवेअरची आवश्यकता असते. अप्तत DeepSeek V3 ला माफक गतीसाठी उच्च-स्तरीय GPU च्या बँकेची आवश्यकता असते. तथापि, त्याची अपरिहार्यता असूनही, DeepSeek V3 एक मोठी उपलब्धी आहे. DeepSeek ने मॉडेल दोन महिन्यांत प्रशिक्षण घेतले, Nvidia H800 GPU चा डेटा सेंटर वापरून, ज्या मिळवायला अलीकडेच अमेरिकेच्या कॉमर्स विभागाने चीनी कंपन्यांना प्रतिबंधित केले आहे.

कंपनीचा दावा आहे की त्यांनी फक्त 5. 5 दशलक्ष खर्च केले DeepSeek V3 चे प्रशिक्षण घेण्यासाठी, जे OpenAI च्या GPT-4 सारख्या मॉडेलच्या खर्चाच्या तुलनेत एक लहान हिस्सा आहे. तरीही, मॉडेलच्या राजकीय विचारांची काहीशी मर्यादा आहे. उदाहरणार्थ, तो तिआनानमेन चौक विषयावर टिप्पणी करणार नाही. एक चीनी कंपनी म्हणून, DeepSeek चा इंटरनेट नियमनाच्या अंतर्गत आहे, याची खात्री करणे की मॉडेलच्या प्रतिसादांमध्ये "प्रमुख समाजवादी मूल्ये" समर्थित आहेत. अनेक चीनी AI प्रणाली अशा विषयांपासून दूर राहतात ज्यामुळे नियामकांना त्रास होऊ शकतो, जसे की शी जिनपिंग शासनाबद्दल चर्चा. DeepSeek, ज्याने अलीकडेच DeepSeek-R1 प्रस्तुत केले आहे OpenAI च्या o1 "रेझनिंग" मॉडेलला प्रतिसाद म्हणून, एक आकर्षक संघटना आहे. हे High-Flyer Capital Management द्वारे समर्थित आहे, एक चीनी हेज फंड जो ट्रेडिंगसाठी AI वापरतो. High-Flyer त्यांच्या स्वत:च्या सर्व्हर क्लस्टर्सचे निर्माण करते मॉडेल प्रशिक्षणसाठी, ज्यात एकात 10, 000 Nvidia A100 GPU चा समावेश आहे आणि ज्याचा खर्च 1 अब्ज येन (~ $138 दशलक्ष) आहे. Liang Wenfeng, एक संगणक विज्ञान पदवीधर, यांनी स्थापन केलेले हाय-फ्लायर, DeepSeek च्या माध्यमातून "सुपरइंटेलिजेंट" AI साध्य करण्याच्या दिशेने काम करीत आहे. वेनफेंग यांनी या वर्षाच्या सुरुवातीला दिलेल्या एका मुलाखतीत बंद-असलेले AI, जसे की OpenAI चे, "तात्पुरती" वाढ असलेल्या म्हणून वर्णन केले. “[हे] इतरांनाही पकडण्यापासून थांबवले नाही, ” त्यांनी निरीक्षण केले. खरोखरच.


Watch video about

डीपसीक V3: चीनचा अग्रगण्य ओपन AI मॉडेल अनावरण करण्यात आला.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic ने चीनशी संबंधित AI-चालित हॅकिंग मोहिमा…

अँथ्रोपिक, एक अग्रगण्य AI कंपनी, सायबरसुरक्षेत एक नवा आणि धोकादायक विकास उघडकीस आणला आहे: AI स्वयंपाकाने हॅकिंग मोहिमा चालवणाऱ्या पहिल्या प्रलेखित प्रकरणाचे निदान.

Nov. 14, 2025, 1:25 p.m.

आय-निर्मित सोरा व्हिडिओजे ICE छाप्यांचे आहेत फेसबुकव…

“आपली पायरी लक्षात ठेवा, सभा, पुढे चालत रहा,” असा एक पोलिस अधिकारी ज्याच्या वेस्टवर ICE असे लिहिलेले आहे आणि “POICE” असे टॅग लावलेले आहे, असे म्हणतात एका Latino दिसणाऱ्या माणसाला जो Walmart च्या कर्मचारी वेस्टमध्ये घालणारा आहे.

Nov. 14, 2025, 1:18 p.m.

केविन रेइलि यांच्या कडून एआय सल्लागार कंपनी कार्टेलच्…

केविन रिली, एक अनुभवी हॉलीवूड कार्यकारी, ज्यांना "द सोप्रानोज," "द ऑफिस," आणि "ग्ली" या लक्षणीय टीव्ही मालिकांच्या सुरुवातीस महत्त्वाची भूमिका निर्वाहल्यामुळे ओळखले जाते, त्यांनी बेव्हरली हिल्समधील आर्टिफिशियल इंटेलिजन्स क्रिएटीव्ह कन्सल्टन्सी कर्टेलचे सीईओ म्हणून नवीन आव्हान स्वीकारले आहे.

Nov. 14, 2025, 1:14 p.m.

गुगलवर स्पॅम धोरणांमुळे युरोपीयन प्रतिज्ञा तपासणी सु…

युरोपियन युनियनने Googleच्या स्पॅम धोरणांवर मोठ्या प्रमाणावर ऍंटिट्रस्ट तपास सुरू केला आहे, त्यानंतर युरोपभरच्या अनेक वृत्तपत्र प्रकाशकांकडून चिंता व्यक्त करण्यात आली आहे.

Nov. 14, 2025, 1:12 p.m.

डीलिझमने व्हाइब विक्रीवर आधारित पहिले एआय विक्री एजं…

सिंगापूर, १३ नोव्हेंबर, २०२५ /PRNewswire/ -- सिंगापूरस्थित DEALISM PTE.

Nov. 14, 2025, 9:31 a.m.

एआय-चालित एसईओ: डिजिटल मार्केटिंगमधील पुढील सीमा

कृत्रिम बुद्धिमत्ता (AI) ही डिजिटल मार्केटिंगमध्ये लवकरच एक परिवर्तनकारी शक्ती बनत आहे, विशेषतः सर्च इंजिन ऑप्टिमायझेशन (SEO) मध्ये.

Nov. 14, 2025, 9:22 a.m.

आयआय एक मित्र आहे, शत्रू नाही

शेली ई.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today