Google Veo 3 AI વિડિયો જનરેટર: પ્રભાવશાળી વસ્તુવાદ સાથે ઓડિયો અને વિડિયોનું સમન્વય

মঙ্গলবার, গুগಲ್ ভিও 3 নতুন AI ভিডিও সংশ্লেষণ মডেল উন্মোচন করলো, যার মাধ্যমে কেউ বড় AI ভিডিও জেনারেটর আগে কখনো যে কাজটি করতে পারেনি তা সম্ভব হলো: ভিডিওর সাথে সঙ্গতিপূর্ণ অডিও ট্র্যাক তৈরি। ২০২২ থেকে ২০২৪ এর মধ্যে, শুরুর AI-উৎপন্ন ভিডিওগুলি ছিল নিরাজ এবং সাধারণত খুব সংক্ষিপ্ত। এখন, ভিও 3 আট সেকেন্ডের হাই-ডেফিনিশন ক্লিপের সাথে দেখা দেয় যেখানে ভয়েস, সংলাপ ও শব্দ প্রভাবসহ রয়েছে। প্রচলিত হওয়ার পরে, адамдар সঙ্গে সঙ্গে স্পষ্ট প্রশ্ন তুললেন: ভিও 3 কতটা ভালোভাবে অস্কারজয়ী অভিনেতা উইল স্মিথকে স্পাঘেটি খাচ্ছে বলে মেকি করে দেখাতে পারবে? একটি সংক্ষিপ্ত সারাংশ: AI ভিডিওতে "স্পাঘেটি মানদণ্ড" শুরু হয় মার্চ ২০২৩ এ, যখন একটি ওপেন সোর্স সংশ্লেষণ মডেল ModelScope ব্যবহার করে একটি প্রথম, কিছুটা অনভিজ্ঞ AI-উৎপন্ন ভিডিও তৈরি করা হয়েছিল। সেই স্পাঘেটি উদাহরণটি এতটাই জনপ্রিয় হয়ে উঠেছিল যে প্রায় এক বছর পরে, ২০২৪ এর ফেব্রুয়ারিতে, স্মিথ সেটাকে স্পুফ করে দেখিয়েছিল। এখানে মূল ভাইরাল ভিডিওর কিছু দেখানো হলো: সাধারণত ভুলে যায় যে তখন, স্মিথের প্যারোডি খুবই ভালো AI ভিডিও জেনারেটর দিয়ে তৈরি হয়নি—Runway এর Gen-2 নামের একটি মডেল ছিল, যা ইতিমধ্যে উচ্চমানের ফলাফল দিচ্ছিল, যদিও সেটি এখনও জনসাধারণের হাতে পৌঁছায়নি। তবুও, ModelScope সংস্করণটি অদ্ভুত এবং মনে রাখার মতো ছিল, কারণ এটি প্রযুক্তির অগ্রগতি চলাকালে প্রাথমিক AI ভিডিওর সীমাবদ্ধতা বোঝাতে একটি রেফারেন্স পয়েন্ট হয়ে উঠেছিল। এই সপ্তাহের শুরুতে, AI অ্যাপ ডেভেলপার জাভি লোপেজ তার ফ্যানদের জন্য ভিও 3 দিয়ে স্পাঘেটি পরীক্ষার পুনরায় চেষ্টা করার জন্য প্রতীকী মন্তব্য শেয়ার করেন X- এ। তবে ফলাফল দেখলে, সাউন্ডট্র্যাকটি অদ্ভুত মনে হলো: কৃত্রিম স্মিথের মতো শোনা গিয়েছিল যেন সে স্পাঘেটিটি চিবাচ্ছে। এই গ্যাপের কারণ হলো ভিও 3- এর পরীক্ষামূলক অডিও প্রভাব যোগ করার ক্ষমতা, সম্ভবত কারণ এর প্রশিক্ষণ ডাটায় প্রচুর চিবানোর সঙ্গে ক Assets ওঠানো নমুনা ছিল। জেনারেটিভ AI মডেলগুলি প্যাটার্ন-ম্যাচিং ভবিষ্যদ্বাণী ব্যবস্থা, যা বিভিন্ন মিডিয়া ধরণের পর্যাপ্ত প্রশিক্ষণ ডাটার ওপর নির্ভর করে সন্তোষজনক আউটপুট তৈরি করে। যখন কিছু ধারণা অতিরিক্ত বা কম উপস্থিত হয়, তখন তা অদ্ভুত জেনারেশন আর্টিফ্যাক্টের দিকে নিয়ে যায়। আমরাও নিজস্বভাবে ভিও 3-এ “উইল স্মিথ” প্রম্পটে চালিয়েছি, কিন্তু গুগলের কন্টেন্ট ফিল্টার দ্বারা ব্লক হয়ে গেছে। তবে "একজন কালো ব্যক্তি স্পাঘেটি খাচ্ছে" এই প্রম্পট ব্যবহার করে, তেমনই একটি জনপ্রিয় ক্ৰাঞ্চিং সাউন্ড ইফেক্ট পাওয়া গিয়েছিল (লোপেজের হয়তো আগে ফিল্টার মুক্ত অ্যাক্সেস ছিল বা তিনি নির্দিষ্ট প্রম্পট ভ্যারিয়েশন পরীক্ষা করেছিলেন যেগুলি পার হয়ে গিয়েছিল)। ভিও 3 তার মনোরম সংলাপ ও সঙ্গীত তৈরি করার ক্ষমতার জন্য প্রভাব ফেলছে, এবং ইতিমধ্যে X- এ বেশ কিছু আকর্ষণীয় উদাহরণ দেখা যাচ্ছে। মাত্র একজন মানুষ খুব আল দিনটে নুডলস খাচ্ছে এমন ভিডিওতেই থেমে না থেকে, আমরা পরীক্ষা করলাম সেই চিত্র কি একসাথে গান গাইতে ও খেতে পারে কী না, প্রম্পট দিয়ে: "একজন মানুষ ইংরেজি কমেডি অপেরা গাইছে যে স্পাঘেটি নিয়ে রান্নাঘরে টেবিলে বসে খাচ্ছে।" ২০২৩ থেকে আমরা উল্লেখযোগ্য উন্নতি করেছি, এবং AI ভিডিও জেনারেটরগুলি বাস্তবতা ও কার্যকারিতায় আরও উন্নতি করবে। ভিও 3- এর বর্তমান সেলিব্রিটি ফিল্টার থাকলে, হয়তো আমরা খুব সহজেই স্মিথের গান গাচ্ছে বা অন্য কিছু করে এমন ভিডিও তৈরি করতে পারতাম—যা AI ভিডিও প্রযুক্তির সম্ভাব্য উদ্বেগগুলো তুলে ধরে। সাংস্কৃতিক এককত্ব দ্রুত কাছাকাছি আসছে। এই বিষয়ে, আমরা সম্প্রতি আমাদের নিজের বিশাল ভিডিও জেনারেশন টেস্ট সম্পন্ন করেছি ভিও 3 দিয়ে এবং শীঘ্রই সেই ফলাফলগুলো একটি বিশেষ বৈশিষ্ট্যে শেয়ার করব। আপাতত, এটি একটি সংক্ষিপ্ত আপডেট যা নুডলটাইমের ফ্রেশ প্রিন্স সম্পর্কে। বিশ্রাম করুন!
Brief news summary
ગૂગલે વિઓ 3 રજૂ કર્યો છે, એક અદ્યતન AI વિડિયો સંશ્લેષણ મોડલ જે સુમેટે ઓમ્નિઆસાર-સ્પષ્ટ આઠ સેકંડના HD વિડીઓ યૂઝર સાથે સીરીયલ વિડીયો, સંવાદ અને વાજબી અવાજ સાથે બનાવવાની ક્ષમતા ધરાવે છે — અગાઉના સાધનો કરતાં વધુ, જે નિષ્ક્રિય અથવા ખૂબ ટૂંકો ક્લિપ્સ સુધી મર્યાદિત હતા. પરીક્ષણોમાં, વિઓ 3 સફળતાપૂર્વક એક માપદંડ પરિપ્રેક્ષ્યને પુનઃસર્જિત કર્યુ, જેમાં ઓસ્કાર વિજેતા અભિનેતા વિકલાંગી સ્નિગ્ધિય ચૂમ્સ પિગેટીનું ખાવાનું એક નીચલી ગુણવત્તાવાળી 2023ની વિડિયો પરથી પુનઃ ઉત્પન્ન કર્યુ. જયારે મોડેલે વિડિયો અને અવાજ યોગ્ય રીતે સુમેટે સમન્વયિત કર્યા, ત્યારે પિગેટી દ્રશ્ય દરમિયાન અનોખી “ક્રંચિંગ” અવાજ ઉત્પન્ન થયો, શક્યતયા તાલીમ ડેટા ના પૂર્વગ્રહોથી ચેબિંગ અવાજો ઉપર ભાર મૂકવાને કારણે. સામગ્રી ફિલ્ટર સીધા “વિલ સ્મિથ” સૂચનોને અવરોધે છે, પરંતુ સમાન ઇનપુટ્સ હજુ પણ અવાજ ગડબડ સર્જે છે. આ પડકારો છતાં, વિઓ 3 સુમેટે સંવાદ અને સંગીત સર્જવામાંredir exceptional છે, જે રસિક પ્રોજેક્ટ્સ જેવા કે એક કોમેડી પિગેટી ઓપરા માટે પ્રેરણા આપે છે. આ વિકાસ એક વ્યાવસાયિક AI-પેદા મલ્ટીમિડીયા તરફનો મહત્વપૂર્ણ քայլ ચિહ્નિત કરે છે, છતાં સેલિબ્રિટી લુક પર પ્રતિબંધો ચાલતાં આવતી મુશ્કેલીઓ ચાલુ રહે છે. વિઓ 3 ના પ્રકાશનથી એઆઇ વિડિયો યુધ્ધમાં તેમજ മറ്റાન્ય પ્રકારની દ્રશ્યમાન માટે સંસ્કૃતિ ચર્ચાઓ ઉઠી છે અને “ફ્રેશ પ્રિન્સ” પિગેટી કથાઓમાં નવી ટવિસ્ટ ઉમેરે છે, જે ચાલુ પરીક્ષણો વચ્ચે વધ્યું છે.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

એ.આઈ. સ્પર્ધા મહત્વપૂર્ણ ટેકનિકલ જાહેરનામાઓ સાથે ઝડપી…
કૃત્રિમ બુધ્ધિ ઉદ્યોગ છેલ્લા સપ્તાહમાં નોંધપાત્ર વિકાસની અગ્રેસર ચંચલતા અનુભવી હતી, જે ઝડપી નવીનતા અને અગ્રણી ટેક કંપનીઓ વચ્ચે તીવ્ર સ્પર્ધાનું પ્રકાશન કરે છે.

શું AI ચેટબોટ્સ ના યુગમાં ગુગલ હજુ પણ શોધમાં યથાવત…
ગૂગલની 2025 ડેવલપર કન્ફરન્સમાં, કંપનીએ તેની મુખ્ય શોધ કાર્યક્ષમતાનું મહત્વપૂર્ણ પુનઃલખાણ રજૂ કર્યું, જેમાં બતાવાયું કે આર્ટિફિશિયલ ઈનટેલિજન્સ તેની ભવિષ્યમાં મહત્ત્વરૂપ ભુમિકા ભજવશે.

વોશિંગટન ક્રિપ્ટો પર આગળ વધી રહ્યું છે: સ્થિરમોદી અને…
આ સપ્તાહના બ્લાયદ સાઇઝ્ડ ઈનસાઈટ ઑન ડીસેન્ટ્રલાઈઝ સાથે કૉઇન્ટેલિગ્રાફમાં, અમે યુએસ ક્રિપ્ટો કાનૂની বিধિમંડળમાં એક મહત્વપૂર્ણ વિકાસ અંગે શોધખોળ કરીએ છીએ.

ડિજિટલ એસેટ પ્રાઇમર: શા માટે ઇક્વિટી માર્કેટને ટોકના…
અરે 15 વર્ષથી વધુ સમય થઈ ગયો છે જ્યારે પ્રથમ બિટકોઇન બનાવવામાં આવ્યું હતું અને کریપ્ટોકરન્સી હાલમાં તેના કેટલીક પ્રારંભિક વચનાઓને પુરા કરી રહી છે, લાંબા સમયથી ચાલતી आर्थिक પ્રણાળીઓને બદલાય રહી છે.

અહીં-google I/Oમાંથી 6 સૌથી મોટી ખાલીગોળીઓ છે, જ્ય…
આ સપ્તાહની Google I/O સંમેલનમાં, ટેક્નોલોજી ծառઝઙ એટલી મોટી જાહેરાતો કરી કે તે વિવિધ ક્ષેત્રોમાં AI દુનિયાએ ધબકતું રાખી છે—ძიયાઈ શોધને નવી રીતમાં બદલવા, AI મોડેલ્સ અને વેરેબલ ટેકનોલોજી અપડેટ કરવા સહિત.

Bitcoin રૂપિયા 111,000 થી ऊपर ઊંચું: બ્લોકચેન ક્લાઉ…
બિટકોઇનની મહત્વપૂર્ણ ઉપલબ્ધિ સાથે ફરીથી વૈશ્વિક ધ્યાન પોતાની બાજુ ખેંચી રહ્યા છે, જેમાં પ્રથમ વખત $111,000 ને પારી કરતાં વધુ મૂલ્ય હતું, તે પણ સંસ્થાઓના રોકાણકારો, રાજનીતિક અથડામણો બદલાતા ગ્લોબલ મો nen ઼રીલ ગતિવિધિઓ, અને ક્રિપ્ટોકરે પીછલું લાઇફ મોડ પાછું આવવાથી પ્રેરિત થઈ રહ્યુ છે.

બ્રિથરાઇટ સિટિઝનશિપ કેસોમાં AI શું વિચારે છે કે શુ…
એઆઈ ચિતામણીમાં ટ્રમ્પ વિ.