ഗൂഗിൾ വീയോ 3 എഐ വിഡിയോ ജനറേറ്റർ: എളുപ്പതും അത്യുത്തമ യാഥാർത്ഥ്യവുമായും ഓഡിയോയും വിഡിയോയും സെക്കുന്റായി അനുഡ়ുക

ചൊവ്വാഴ്ച, ഗൂഗിൾ ഹിതം കണ്ടു വേഓ 3 എന്ന പുതിയ AI വീഡിയോ സിന്തസിസ് മോഡലിനെ പുകർത്തി, ഇത് മുമ്പ് വലിയ AI വീഡിയോ ജനറേറ്ററുകൾ നേടാനായിട്ടില്ലാത്ത ഒരു കാര്യ senaയം അനുകരിക്കാനാണ്ഡം: വീഡിയോയോടൊപ്പം സമന്വയിപ്പിച്ച ശബ്ദ ട്രാക്കും ഉണ്ടാകുന്നു. 2022 നും 2024 നും ഇടയിൽ, ആദ്യം ഉണ്ടാക്കിയ AI-ഉള്ള വീഡിയോകൾ ശബ്ദമില്ലാതെ വളരെ ചെറിയവയായിരുന്നു. ഇപ്പോൾ, വേഓ 3 എട്ട് സെക്കന്റ് ഹൈ-ഡെഫിനിഷൻ ക്ലിപ്പുകൾ ശബ്ദങ്ങൾ, സംഭാഷണം, ശബ്ദ പ്രഭാഷണങ്ങൾ എന്നിവയോടുകൂടി നൽകുന്നു. ലाँचിനുശേഷം, ആളുകൾ താത്ക്കളികമായി ചോദിച്ചു: വേഓ 3 ഒറ്റത്തവണ ഒസ്കാർ വിജയിയായ ഇരുവരും ആയ വിൽ സ്മിത്ത് സ്പാഗറ്റി കഴിക്കുന്നതിനെ എത്ര നല്ലപോലെ കൃത്രിമമാക്കും? സംക്ഷേപം: AI വീഡിയോയിൽ "സ്പാഗറ്റി മേഴാത്ത അളക്കൽ" മാർച്ച് 2023 ല് ആരംഭിച്ചു, ഒറിജിനൽ, അൽപം അബദ്ധകരമായ AI സിന്തസിസ് വീഡിയോ ഒരു ഓപ്പൺ സോഴ്സ് മോഡൽ. ഈ സ്പാഗറ്റി ഉദാഹരണം അത്ര പ്രശസ്തമായിരുന്നു, അതുകൊണ്ട് സ്മിത്ത് ഇതിനെ כמעט ഒരു വർഷത്തേക്കാൾ കൂടി, 2024 ഫെബ്രുവരി സെക്കന്റെ അനുകരണം ചെയ്തു. ഇവിടെ ഓ rijeଣൽ വൈറൽ വീഡിയൊയുടെ ചിത്രം കാണാം: അത് ഓർക്കാമായിരുന്നു: ആ സമയത്ത്, സ്മിത്ത് പാരഡിയുടെ ഏറ്റവും മികച്ച AI വീഡിയോ ജനറേറ്റർ ഉപയോഗിച്ചിരുന്നില്ല — റൺവോയുടെ ജെൻ-2 എന്ന മോഡലു പിന്നീട് അതിന്റെ മേലുള്ള ഗുണനിലവാരമുള്ള ഫലങ്ങൾ നൽകിയിരുന്നതായി, പക്ഷേ അത് ഏതാനും ദിവസങ്ങൾക്കകം പൊതുവിൽ ലഭ്യമാകാനായിരുന്നില്ല. എന്നിരുന്നാലും, മോഡൽസ്കോപ് പതിപ്പ് അത്ര വിചിത്രവും ഓർമിക്കാവുന്നതുമായിരുന്നു, ഇത് തുടക്കം കുറിച്ച AI വീഡിയോത്തിലെ പരിധികളെ അടയാളപ്പെടുത്തുന്നതായി. മേൾക്ക്, എഐ അപ്ലിക്കേഷൻ ഡവലപ്പർ ജാവി ലോപെസ് ഇതിനോടകം "സ്പാഗറ്റി ടെസ്റ്റ്" വീണ്ടും പരിശോധിക്കാൻ താത്പര്യമുള്ള താരങ്ങളെ പിൻവലിച്ചുകൊണ്ട് X-ൽ തന്റെ കണ്ടുപിടുത്തുകൾ പങ്കുവെച്ചു. എന്നാൽ ഫലങ്ങൾ കണ്ടപ്പോൾ, ഓഡിയോ അസാധാരണമായിരുന്നു: തള്ളലുണ്ടായ സ്മിത്ത് സ്പാഗറ്റി ചവിട്ടി കാണും പോലെ ശബ്ദം ഉണ്ടാക്കെ. ഈ തകരാറിന്റെ കാരണം വേഓ 3ന്റെ പരീക്ഷ്ണയിലുള്ള ശബ്ദ പ്രഭാഷണങ്ങൾ കൂട്ടിച്ചേർക്കാനുള്ള സാധ്യതയാണ്, കാരണം അതിന്റെ പരിശീലന ഡാറ്റയിൽ ചവിട്ടലും കുരക്കുന്നതും ഉള്ള നിരവധി ഉദാഹരണങ്ങൾ ഉണ്ടായിരുന്നതിനാൽ. ജനറേറ്റീവ് AI മോഡലുകൾ പാടകലക്കാനുൽപ്പന്നങ്ങളായി പ്രവർത്തിക്കുന്നു, വിശ്വാസ്യതയുള്ള ഔട്ട്പുട്ട് ഉണ്ടാക്കാനായി വിവിധ മാധ്യമങ്ങളിലെ മതിയായ പരിശീലന ഡാറ്റയിലേറെ ആശ്രയിച്ചിരിക്കുന്നു.
ചില ആശയങ്ങൾ അതിൽ അനധികൃതമായി കൂടുതലോ കുറവോ വരുന്നത്, ഇത്തരം ദോഷങ്ങളിലേക്ക് നയിക്കുന്നു. നാം തന്നെakeunച്ചുതുടങ്ങിയുതന്നെ, "വിൽ സ്മിത്ത്" എന്നത് ഗൂഗിൾയുടെ ഉള്ളടക്കം ഫിൽറ്ററുകൾ തടഞ്ഞുവെച്ചു. അതിനെ പകരം "ഒരു കള്ളക്കൂട്ടനെ സ്പാഗറ്റി കഴിക്കുമ്പോൾ" എന്ന് പറഞ്ഞാൽ, സമാനമായ കുരക്കൽ ശബ്ദം ഉണ്ടാകുകയുണ്ടായി (ലോപെസ് താംശമായുള്ള ഫിൽറ്റർ ഇല്ലാതായിട്ടുണ്ടാകാമോ, അല്ലെങ്കിൽ പരീക്ഷണമോ അതിലുണ്ട്). വേഓ 3 ഉയർന്ന ബൗദ്ധികത, സംഗീതം, സംഭാഷണം എന്നിവ സൃഷ്ടിക്കുന്നതിനാണ് വ്യവസ്ഥിതമായെടുത്തിരിക്കുന്നു, ഇതിനാലാണ് X-ൽ ലക്ഷ്യമിടുന്ന നിരവധി മനോഹര ഉദാഹരണങ്ങൾ. ഒരു വ്യക്തി വളരെ അത്ഭുതകരമായ നോഡിൽസ് കഴിക്കുന്ന വീഡിയോ മാത്രമല്ല, അതേ സമയം പാടാനും കഴിക്കുന്നതിനു കഴിയുമോ എന്ന് പരിശോധിക്കാൻ "ഒരു പുരുഷൻ ഇംഗ്ലീഷ് കോമഡി ഓപ്പറ പ്രവേശിപ്പിച്ച് ചിരിയ്ക്കാനായി പാചകമേഖലയിൽ സ്പാഗറ്റി പാടുകയും ഭക്ഷ്യവും കഴിക്കുകയും ചെയ്യുന്ന ചിത്രം" എന്ന പ്രേംപ്റ്റ് ഉപയോഗിച്ചു. 2023 മുതലുള്ള വലിയ പുരോഗതിയുമായി, AI വീഡിയോ ജനറേറ്ററുകൾ കൂടുതൽ യാഥാർത്ഥ്യത്തിൽ ഉള്ള, പ്രവർത്തനക്ഷമമായ രീതിയിൽ പുരോഗമിക്കുന്നു. വേഓ 3ന്റെ ഇപ്പോള് கொண்ட സെലിബ്രിറ്റി ഫിൽറ്റർ ഇല്ലായിരുന്നെങ്കിൽ, സ്മിത്ത് പാടുന്നവരെയോ ഏതെങ്കിലും മറ്റേതെങ്കിലും സ്ഥിരം പ്രവർത്തനങ്ങളായിട്ടൊ നിർമ്മിച്ചേക്കാമായിരുന്നു—ഇതുകണ്ടു AI വീഡിയോ സാങ്കേതികവിദ്യയുടെ ഭാവി സംബന്ധിച്ച ചില ആശങ്കകൾ ഉയരുന്നു. സംസ്കാരിക ഏകാന്തത അതിവേഗത്തിൽ അടുത്തുകൊണ്ടിരിക്കുന്നു. അതോടെ, നമ്മൾ തന്നെ വേഓ 3 ഉപയോഗിച്ച് ഒരു വിശാലമായ വീഡിയോ നിർമ്മാണ പരീക്ഷണങ്ങൾ നടത്തി, അത് ഉടൻ തന്നെ പ്രത്യേക ലേഖനത്തിൽ പങ്കുവെയ്ക്കും. ഇപ്പോൾ ഇത് ഒരു സംക്ഷിപ്ത അപ്ഡേറ്റാണ്, "ന്യൂഡോളറ്റൈം" എന്ന പേരിൽ. സ്വാദിഷ്ടമായ്!
Brief news summary
ഗൂഗിൾ വെഹ് 3 എന്ന ഒരു ഉയര്ന്ന നിലവാരമുള്ള എഐ വീഡിയോ സിന്തസിസ് മോഡൽ അവതരിപ്പിച്ചു, ഇത് ഓട്ടോ സമന്വയിപ്പിച്ച എട്ട് സെക്കണ്ടുകളുള്ള ഹൈഡെഫിനിഷൻ വീഡിയോകളും ശബ്ദം, സംഭാഷണം, ശബ്ദഘടകങ്ങളും സംയോജിപ്പിച്ച് അടങ്ങിയതാണ്—മുന്നറിയിപ്പ് മുതൽ ചുളിപ്പില്ലാത്ത അല്ലെങ്കിൽ വളരെ ചെറിയ ക്ലിപ്പുകളിലും പരിമിതമായ ഉപകരണങ്ങളെക്കാൾ അതിക്രമകരമാണ്. പരിശ്രമങ്ങളിൽ, വെഹ് 3 യ সফলമായി ഒസ്കാർ നേടിയ അഭിനേതാവ് വിൽ സ്മിത്ത് സ്പaghetti തിന്നുന്ന ഒരു ചെറുപ്പ വീഡിയോയായ 2023 ലെ കുറഞ്ഞ ഗുണമേന്മയുള്ള വിഡിയോയെ പുനഃസൃഷ്ടിച്ചു. മോഡൽ വീഡിയോയും ശബ്ദവും എഫക്റ്റ്സ്വും കാര്യക്ഷമമായി സമന്വയിപ്പിച്ചിരുന്നുണ്ടെങ്കിലും, സ്പaghetti രംഗത്ത് ഒരു അപരിചിതമായ “ crunching” ശബ്ദം ഉല്പന്നമായിരുന്നു, ഇത് പരിശീലന ഡാറ്റയിലെ ചവുട്ടൽ ശബ്ദങ്ങളെക്കുറിച്ചുള്ള മുൻഗണനകൾ കാരണം ഉണ്ടാകാനാകും. ഉള്ളടക്ക ഫിൽട്ടറുകൾ നേരിട്ടുള്ള “വിൽ സ്മിത്ത്” രൂപങ്ങൾ തടയുന്നതു പ്രകാരം, സമാനമായ ഇൻപുട്ടുകൾ ആയി ശബ്ദ അഴിച്ചുപറച്ചിൽ ഉണ്ടാകാറുണ്ട്. ഈ വെല്ലുവിളികളിലുണ്ടായിരുന്നാലും, വെഹ് 3 വ്യക്തമായ സംഭാഷണവും സംഗീതവും ഉത്പാദിപ്പിച്ചുവെന്ന് കാട്ടുന്നു, ഇത് പകർപ്പു നാടക സ്പaghetti ഓപ്പറയൊക്കെപോലെ സൃഷ്ടികളെ പ്രോത്സാഹിപ്പിക്കുന്നു. ഈ പുരോഗതി യഥാർത്ഥവുമായ എഐ ആണ് ഉപയുക്തമൊക്കെയുള്ള മീഡിയമായി മാറുന്നതിനുള്ള ഒരു വലിയ ചുവടു പറയപ്പെടുന്നു, എങ്കിലും സেলിബ്രസ്റ്റി മുഖം രൂപങ്ങൾ നിയന്ത്രണമുണ്ടാകുന്നതു തുടർന്നുള്ള തടസ്സങ്ങളായി നിലകൊള്ളുന്നു. വെഹ് 3യുടെ പുറത്തിറക്കം അതിർത്തമല്പിച്ചിരിക്കുകയാണ് എഐ വീഡിയൊ യാഥാർഥ്യത്തെക്കുറിച്ചുള്ള സാംസ്കാരിക ചർച്ചകൾ പതിപ്പിക്കുകയും, “ഫ്രെഷ് പ്രിൻസ്” സ്പaghetti കഥയിലേക്ക് പുതിയ ഒരു വിരൽ ചുവടെ ചേർക്കുകയും ചെയ്യുന്നു.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

കൃത്രിമ ബുദ്ധി മത്സരം പ്രധാന ടെക് പ്രഖ്യാപനങ്ങളോടുകൂടി വേ…
കൃത്രിമ ബുദ്ധിമുട്ടിന്റെ വ്യവസായം കഴിഞ്ഞ ആഴ്ച വലിയ പുരോഗതികളുമായി അപൂർവമായ ഒരു ഉയർച്ച കണ്ടു, പ്രധാന ടെക് കമ്പനികളിൽ ഇടുക്കിയ്ത്ത് ഉയർന്ന പുതുമയും ശക്തമായ മത്സരം ഉണ്ടാക്കി.

കൃത്രിമ ബുദ്ധിയുടെ ചാറ്റ്ബോട്ടുകളുടെ കാലത്ത് ഗൂഗിള്ക്ക് തി…
ഗൂഗിളിന്റെ 2025 ഡെവലപ്പറ്സConferenceല്, കമ്പനി തന്റെ പ്രധാന തിരച്ചിൽ ഫംഗ്ഷനാലിറ്റിയിൽ വലിയ പുനഃസംഘടനവ് നടത്തി, ഭാവിയിൽ കൃത്രിമ ബുദ്ധിമുട്ട് യുശ്രാപാടമായ കടത്തലുകളെ സുപ്രധാന താളത്തിൽ അടിസ്ഥാനം സ്ഥാപിക്കുകയാണെന്ന് ഠിൽക്കുന്ത്ത്.

വാഷിംഗ്ടൺ ക്രിപ്റ്റോയിലേക്ക് മുന്നോട്ട് പോകുന്നു: സ്റ്റെയ്ബിക…
ഈ ആഴ്ചയുടെ ബൈറ്റ്-സൈസ്ഡ് ഇൻസൈറ്റ് ആന്റ് ഡെസെന്്ട്രലൈസ് ചെയ്ത കോയിൻടെലെഗ്രാഫ് എന്ന പരിപാടിയിൽ, യുഎസ് ക്രിപ্টো നിയമത്തിലെ ഒരു അത്യന്താപ്രധാന പുരോഗതി ഞങ്ങൾ അന്വേഷിക്കുന്നു.

ഡിജിറ്റൽ ആസറ്റ് ആരംഭിക: എങ്ങനെ ഇക്വിറ്റി മാർക്കറ്റുകൾ ടോക്…
പുതിയ ഡിജിറ്റൽ കറൻസിയുടെ ഉദ്ഭവത്തോടെ 15 വർഷങ്ങൾക്ക് മുമ്പായിരുന്നു ആദ്യത്തെ ബിറ്റ്കോയിൻ സൃഷ്ടിച്ചിരുന്നത്.

ഗൂഗിൾ ഐ/ഒയിൽ നിന്നുള്ള ആറു പ്രധാന വശങ്ങൾ ഇവയാണ്, ടെക് വ…
ഈ ആഴ്ച നടന്ന ഗൂഗിള് ഐഓ കണ്ടന്ഷനില്, ടെക് മഹത്തായ കമ്പനി ഏകദേശം 100 പ്രഖ്യാപനങ്ങള് നടത്തി, വിവിധ മേഖലകളില് ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സി (AI) നു കൈ കീഴ്വഴക്കമാണ് ലക്ഷ്യമിടുന്നത് — ചോദ്യാനി തിരുത്തലില് നിന്നും, AI മോഡലുകള് അപ്ഡേറ്റ് ചെയ്യുന്നതുവരെ, വെയറ്ബിള് ടെക്നോളജി എന്നിവ വരെ.

ബിറ്റ്കോಿನ್ $111,000 കടപ്പുറം աճിക്കുന്നു: ബ്ലോക്ചെയ്ൻ ക്ലൗ…
ബിറ്റ്കോിങ് തങ്ങളുടെ ആദ്യത്തെ തുക $111,000 മുകളിലേക്ക് കടക്കുകയും, സ്ഥാപന നിക്ഷേപകർ, ജിയോപ്പലിറ്റിക്കൽ ധനകാര്യ ഗതാഗതങ്ങളിൽ മാറ്റങ്ങൾ, ഒപ്പം വീണ്ടെടുക്കപ്പെട്ട ക്രിപ്റ്റോ വളർച്ച എന്നിവ നിങ്ങളുടെ മുഴുവൻ ശ്രദ്ധയിൽപ്പെടുത്തി ഉയര്ത്തുകയും ചെയ്തു.

ബർथ്ഛൈർട്ട് സെറ്റിജന്ഷിപ്പ് കേസുകളിൽ എ.എ.ഐ എന്താണ് ചിന്തിക്…
ട്രംപ് ವಿರುದ್ಧ CASA യെ എഐ കുളംശല്യമാക്കുന്നത്: സുപ്രീം കോടതി അഭിപ്രായങ്ങൾ തിയ്യതി ചെയ്യുന്ന മാതൃക കഴിഞ്ഞ ആഴ്ച, സുപ്രീം കോടതി ട്രംപ്പ് v