गूगल व्हिओ 3 एआय व्हिडीओ जेनरेटर: आकर्षक वास्तववादासह ऑडिओ आणि व्हिडीओची सुसूत्रता

मंगळवार दिनी, Google ने Veo 3 नावाचा नवीन AI व्हिडिओ संश्लेषण मॉडेल लाँच केले, जे तेजस्वीपणे अशी काही कामगिरी करतंय जी कोणत्याही प्रमुख AI व्हिडिओ जनरेटरने आधी कधीही पूर्ण केली नाही: व्हिडिओसोबत सुसंगत ऑडिओ ट्रॅक तयार करणे. 2022 ते 2024 या कालावधीत, प्रारंभिक AI-निर्मित व्हिडिओंनी कोणताही आवाज राहिलेला नसे आणि बऱ्याच वेळेस खूपच लहान असायचे. आत्ता, Veo 3 आठ सेकण्डांचे उच्च-गुणवत्तेचे क्लिप्स आवाज, संवाद, आणि ध्वनी प्रभावांसह पुरवतो. लाँच केल्यावर, लोकांनी त्वरित अगदीच समर्पक प्रश्न विचारला: Veo 3 किती चांगले Oscar जिंकलंले अभिनेता विल स्मिथ स्पॅगेटी खाताना भासवू शकतो? थोडक्यात रीपीट: AI व्हिडिओमधील "स्पॅगेटी बेंचमार्क" मार्च 2023 मध्ये सुरुवात झाली, जेव्हा ModelScope नावाच्या उघड्या स्त्रोत संश्लेषण मॉडेलचा वापर करून एक सुरुवातीचा, जरा अस्वस्थ करणारा AI-निर्मित व्हिडिओ तयार करण्यात आला. त्या स्पॅगेटीच्या उदाहरणाने इतके प्रसिद्ध झाले की, स्मिथने ते जरा वर्षानंतर, फेब्रुवारी 2024 मध्ये, त्यास खोडाळूपणे पुनर्रावृत्ती केली. मूळ व्हायरल व्हिडिओ काय दिसायचा याची आठवण करून देतो: अवधानात आलेले असते की, त्या वेळी, स्मिथची परेड शक्य तितके सर्वोत्तम AI व्हिडिओ जनरेटर वापरून तयार केलेली नव्हती—Runway चे Gen-2 मॉडेल जवळपास गुणवत्तायुक्त परिणाम देऊ शकत होते, जरी ते सार्वजनिकरित्या उपलब्ध नव्हते. तरीही, ModelScope आवृत्ती काहीसे विचित्र व लक्ष वेधणारी होती, त्यामुळे ती लवकरच्या AI व्हिडिओ मर्यादांकडे लक्ष वेधणारी एक ठरली. या आठवड्याच्या सुरूवातीस, AI अॅप विकसक Javi Lopez ने, Veo 3 वापरून स्पॅगेटी चाचणी पुन्हा करतांना, त्याचे परिणाम X वर शेअर केले. परंतु, परिणाम पाहताना, ध्वनीपट चिनी काहीतरी वेगळीच वाटत होती: खोट्या स्मिथची आवाज ऐकताना जणू तो स्पॅगेटी खांसताना दाहक आवाज करत होता. हे glitches Veo 3 च्या प्रयोगात्मक क्षमतेमुळे आले असावेत, ज्या त्याच्या ध्वनी प्रभावांची जोडणी करण्याच्या क्षमतेच्या अनुसंधानामुळे संभवतात, मोठ्या प्रमाणावर चबण्याचा आणि खचखच आवाज असलेले अनेक उदाहरणे त्याच्या प्रशिक्षण डेटामध्ये समाविष्ट असल्यामुळे. उत्पादनात्मक AI मॉडेल्स हे संरचना जुळवण्यावर आधारित पूर्वीच्या कल्पना-ओळख प्रणाली आहेत, ज्यांना चालू मीडिया प्रकारांवर आधारित पुरेसा प्रशिक्षण डेटा लागतो, ज्यामुळे विश्वासार्ह परिणाम मिळतात.
जर विशिष्ट संकल्पना जास्त किंवा कमी दाखविल्या गेल्या असतील, तर त्याचा परिणाम अशा खास जनरेशनमध्ये दिसतो. आम्हीही स्वतःच Veo 3 वर "Will Smith" या टाकणीनं प्रयत्न केला, परंतु Google च्या सामग्री फिल्टरमुळे ते थांबवले गेले. तरी, “A black man eating spaghetti” असे प्रविष्ट केले असता, जसे खाण्याचा खाचखाच आवाज आला (बहुतेक तो जणू early filter-free access किंवा काही संशोधनात्मक प्रकारांनी प्रविष्टी विविध प्रकारांनी दिली असावी). Veo 3 त्याच्या समर्पक संवाद व संगीत निर्मितीत प्रभावी आहे, आणि X वर अनेक धक्कादायक उदाहरणे तयार झाली आहेत. पुरेसा व्हिडिओ एका व्यक्तीने खाण्यमध्ये इतका दलेजणारा असतो, यातून आम्ही हेही तपासत होतो की, त्या व्यक्तीने गाणंही म्हणावं आणि खाल्लंही जसे शक्य आहे का, म्हणून आम्ही प्रविष्ट केले: “A man singing an English-language comedy opera about spaghetti at a kitchen table while eating it. ” 2023 पासून आपण मोठ्या प्रगती केली आहे, आणि AI व्हिडिओ जनरेटर पुढील काळात अधिक वास्तववादी व कार्यक्षम होणार आहेत. जर Veo 3 च्या सध्याच्या सेलिब्रिटी फिल्टरची मर्यादा नसेल, तर आम्ही सहज स्मिथची गाणी म्हणणारी — किंवा तत्सम कोणतीही गोष्ट — व्हिडिओ तयार करु शकतो, ज्यामुळे AI व्हिडिओ तंत्रज्ञानाबाबत काही चिंता उद्भवतात. संस्कृतीतील एकवटलेपण लवकरच साध्य होत आहे. त्याचच संदर्भात, आम्ही नुकतेच Veo 3 सह आमचे स्वतःचे विस्तारपूर्ण व्हिडिओ निर्मिती चाचण्यांचे परिणाम आयोजित केले आणि लवकरच त्या अहवालले स्वतंत्र विशेषात सामायिक करू. तेवढ्यासाठी, हा "नोडलीज श्वास" वरचा थोडकासा अद्यतन मानावा. चव घेूया!
Brief news summary
गुगलने व्हिओ 3 ही एक प्रगत AI व्हिडिओ synthesis मॉडेल प्रदान केली आहे, जी सुसंगत आठ सेकंदांच्या HD व्हिडिओसह ऑडিও, संवाद, आणि ध्वनी प्रभावांना तयार करण्यास सक्षम आहे — जी पूर्वीच्या साधनांपेक्षा जास्त उन्नत आहे, जी मूक किंवा खूप लहान क्लिप्सपर्यंत मर्यादित होती. चाचणी दरम्यान, व्हिओ 3 यांनी यशस्वीपणे एक मानक परिस्थिती पुनर्स्थापित केली, ज्यामध्ये ऑस्कर जिंकलेले अभिनेता विल स्मिथ स्पaghetti खाताना कमी दर्जाच्या 2023 च्या व्हिडिओमधून पुनरुत्पन्न केले. जरी या मॉडेलने व्हिडिओ आणि ऑडिओ यांना प्रभावीपणे सुसंगत केले, तरी त्याने स्पaghetti दृश्यादरम्यान एक असामान्य “कुलूप” आवाज केला, जो कदाचित चावण्याच्या आवाजांवर आधारित प्रशिक्षक डेटामुळे दर्शवली गेली असू शकते. सामग्री फिल्टर थेट “विल स्मिथ” या प्रम्प्टला अडथळा आणतात, परंतु सारखेच इनपुट्स अद्याप ऑडिओ त्रुटी निर्माण करतात. या अडचणींवरही, व्हिओ 3 ने सुसंगत संवाद आणि संगीत तयार करण्यात उत्कृष्टता मिळवली आहे, ज्यामुळे हास्यपूर्ण स्पaghetti ऑपेरा सारख्या सर्जनशील प्रकल्पांना प्रेरणा मिळते. हे प्रगती अधिक वास्तववादी AI-निर्मित मल्टिमीडिया दिशेने एक महत्त्वाचा टप्पा आहे, तरीही सेलिब्रिटी यांच्या likeness वर निर्बंध ही एक अडचण राहिल्या आहेत. व्हिओ 3 च्या प्रकाशनाने AI व्हिडिओ वास्तवतेबाबत सांस्कृतिक चर्चा सुरु केल्या असून, “फ्रेश प्रिन्स” च्या स्पaghetti कथेला एक नवीन वळण दिले आहे, अजूनही तपासणी चालू असताना.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

एआय स्पर्धा मोठ्या तंत्रज्ञान जाहीरातींनी गती घेत आहे
人工 बुद्धिमत्ता उद्योगाने गेल्या आठवड्यात उल्लेखनीय विकासांची झलक दाखवत मोठ्या प्रगतीची नोंद केली, ज्यामध्ये प्रमुख तंत्रज्ञान कंपन्यांमधील वेगाने होणाऱ्या नवकल्पना आणि तीव्र स्पर्धा दिसून आली.

एआय चॅटबोट्सच्या युगात गुगल अजूनही शोधामध्ये वर्चस्व क…
गूगलच्या २०२५ डेव्हलपर कॉन्फरन्समध्ये कंपनीने तिच्या मुख्य शोध कार्यक्षमतेच्या मोठ्या पुनर्रचनेची घोषणा केली, ज्यामध्ये कृत्रिम बुद्धिमत्तेची भविष्यातील महत्त्वाची भूमिका अधोरेखित केली.

वाशिंगटन क्रिप्टोवर पुढे जाते: स्टेबलकॉइन आणि ब्लॉकचे…
या आठवड्याच्या बाइट-साइज्ड इनसाइट मध्ये, Cointelegraph सोबत डीसेंटरलाइज्डवर आपण एका महत्त्वाच्या विकासाचा प्रवास करत आहोत, तो अमेरिकेच्या क्रिप्टो कायद्यामध्ये घडत आहे.

डिजिटल मालमत्ता प्राइमर: का सक्षम बाजारांना टोकनायझे…
१५ वर्षांहून अधिक काळ झाला आहे जेव्हा पहिला बिटकॉइन तयार झाला होता, आणि क्रिप्टोकरेन्सी आता काहीतरी आपल्या प्राथमिक वचनांची पूर्तता करत आहे, दीर्घकाळ टिकणाऱ्या आर्थिक प्रणालींना परिवर्तन करून.

येथे गुगल I/O कडून मिळालेले ६ महत्त्वाचे शिकवे, जिथ…
या आठवड्याच्या Google I/O परिषदेत, तंत्रज्ञान क्षेत्रातल्या दिग्गजांनी सुमारे १०० घोषणा केल्या, ज्यातून त्यांच्या विविध क्षेत्रांमध्ये AI वर वर्चस्व राखण्याची महत्त्वाकांक्षा प्रदर्शित झाली—सर्च अपडेट करण्यापासून AI मॉडेल्स आणि वेरिएबल्स तंत्रज्ञानापर्यंत.

बिटकॉइन $१११,००० च्या वर झपाट्याने वाढतो: ब्लॉकचेन क्…
बिटकॉइन पुन्हा एकदा जागतिक लक्ष वेधून घेत आहे, कारण ते प्रथमच $111,000 पेक्षा जास्त झाले आहे, हे संस्थात्मक गुंतवणूकदार, भू-राजकीय आर्थिक गतीशीलता बदलणे आणि नवा क्रिप्टो उच्छ्वास या कारणांमुळे घडत आहे.

बेरोजगार नागरिकत्वाच्या प्रकरणांमध्ये AI काय समजते की…
ट्रंप विरुद्ध CASA एक AI चाचणीप्रणालीत: सर्वोच्च न्यायालयाच्या अभिप्रायांची सिमुलेशन गेल्या आठवड्यात, सर्वोच्च न्यायालयाने ट्रंप विरुद्ध CASA, Inc