lang icon En
May 24, 2025, 6:48 a.m.
3081

Kizazi cha Google Veo 3 AI Video Generator: Kuendana kwa Sauti na Picha kwa Uhalisia Unaovutia

Brief news summary

Google imetambulisha Veo 3, mfano wa maendeleo wa usanisi wa video wa AI unaoweza kuzalisha video za HD za sekunde nane zinazolingana zenye sauti, mazungumzo, na athari za sauti—kupita zana za awali zilizokuwa na uwezo wa kuonyesha vipande vya kimya au fupi sana. Wakati wa majaribio, Veo 3 iliweza kuunda simu ya kielelezo kwa kufananisha na mkono wa mwigizaji aliyeshinda tuzo ya Oscar, Will Smith, akiwa anakula spaghetti kutoka kwenye video yenye ubora mdogo wa mwaka wa 2023. Ingawa mfano huu ulifanikisha usawazishaji wa video na sauti kwa ufanisi, ulitoa sauti ya kipekee ya “kunguruma” wakati wa kipande cha spaghetti, huenda ikawa ni kwa sababu ya upendeleo wa data za mafunzo zinazosisitiza kelele za kucheka. Vichujio vya maudhui vinazuia maelekezo ya moja kwa moja "Will Smith", lakini maingizo yanayofanana bado husababisha matatizo ya sauti. Licha ya changamoto hizi, Veo 3 inastahili kuwa na nguvu katika kuzalisha mazungumzo ya coherently na muziki, ikihamasisha miradi ya ubunifu kama operetta ya vichekesho ya spaghetti. Maendeleo haya ni hatua muhimu kuelekea kwenye multimedia ya AI halisi, ingawa vizuizi vya kuiga sura za nyota vinabakia kuwa changamoto zinazohitaji suluhisho. Kuhudumiwa kwa Veo 3 kumewasha mijadala ya kidemokrasia kuhusu uhalisia wa video za AI na kuleta mwelekeo mpya kwa simulizi ya spaghetti ya "The Fresh Prince" wakati wa majaribio yanayoendelea.

Jumanne, Google ilizindua Veo 3, mfano mpya wa uundaji wa video kwa akili bandia unaoweza kufanikisha jambo ambalo hadi sasa hakuna mtengenezaji mkubwa wa video kwa AI ameliweza: kutengeneza nyimbo za sauti zinazolingana na video kwa pamoja. Kati ya mwaka 2022 na 2024, video za awali zilizotengenezwa kwa AI zilikuwa kimya na kwa ujumla zilikuwa fupi sana. Sasa, Veo 3 inatoa vipande vya sekunde nane vya video high-definition kamili na sauti, mazungumzo, na athari za sauti. Baada ya uzinduzi huo, watu walijitokeza mara moja kuuliza swali la msingi: Je, Veo 3 inaweza kuiga vema mchezaji wa Oscar Will Smith akiila spaghetti? Tukumbuke kwa kifupi: kipimo cha "spaghetti benchmark" katika uundaji wa video kwa AI kilianza machi 2023 kwa video ya awali, isiyotia matumaini, iliyotengenezwa kwa AI kwa kutumia mfano wa synthesis wa chanzo huria uitwao ModelScope. Mfano huu wa spaghetti uliweza ikavuma sana hivi kwamba Smith aliweka ucheshi juu yake takriban mwaka mmoja baadaye, Februari 2024. Hapa kuna kumbukumbu ya jinsi video ya awali iliyovuma sana ilivyokuwa: Kinachosahaulika mara nyingi ni kuwa wakati huo, ucheshi wa Smith haukutengenezwa kwa kutumia mtengenezaji bora wa video wa AI ulipatikana—mfano uitwao Gen-2 kutoka Runway ulikuwa tayari umetolewa matokeo bora zaidi, ingawa haukuweza kupatikana kwa umma bado. Hata hivyo, toleo la ModelScope lilikuwa la ajabu na lilikumbukwa vya kutosha kuwa kuwa alama ya mwongozo kuhusu mipaka ya mwanzo ya AI katika utengenezaji wa video wakati teknolojia ikisonga mbele. Mapema wiki hii, mtengenezaji wa programu za AI Javi Lopez alijibu mashabiki waliotaka kurudi kuangalia jaribio la spaghetti kwa kutumia Veo 3, akashiriki matokeo yake kwenye X. Hata hivyo, wakati wa kutazama matokeo, sauti ya nyimbo ilionekana ya ajabu: uongo wa Smith ulisikika kana kwamba alikuwa anakunywa spaghetti huku akilewa. Hitilafu hii inatokana na uwezo wa majaribio wa Veo 3 wa kuongeza athari za sauti, huenda kwa sababu data yake ya mafunzo ilijumuisha mifano mingi yauchu na sauti za kukunja. Miundo ya AI inayozalisha hufanya kazi kama mifumo ya utabiri wa kuoanisha mambo kwa kutumia data ya kutosha ya mafunzo kwa vyombo mbalimbali ili kutoa matokeo yanayoonekana ya kweli.

Wakati baadhi ya dhihirisho linaonekana kuzidi au kupunguzwa kwenye data hiyo, huleta matokeo ya kusebena kama haya. Pia, sisi tulitumia mwelekeo wenyewe kwenye Veo 3, lakini “Will Smith” alizuiwa na vichujio vya maudhui vya Google. Hata hivyo, kutumia mwelekeo wa “Mtu mweusi anakula spaghetti, ” kulizalisha athari sawa za sauti ya kukunja (Labda Lopez alikuwa na ufikiaji wa awali bila vichungi, au alitumia mabadiliko ya mwelekeo yaliyopita kupitia majaribio ya kuingiza maneno bila vichungi). Veo 3 inashangaza kwa uwezo wake wa kuzalisha mazungumzo yanayoendana na muziki, tayari ikiwa na mfano kadhaa wa kuvutia kwenye X. Hatukutaka kusimama kwenye video ya mtu akila noodles al dente sana tu, tulijaribu kuona iwapo anaweza kuimba na kulila kwa wakati mmoja kwa kuagiza: “Mtu akimimba opera ya ucheshi kwa Kiingereza kuhusu spaghetti akiwa mezani akila. ” Tumefanya maendeleo makubwa tangu 2023, na wazalishaji wa video kwa AI wataendelea kuboresha uhalisia na kazi zake. Lingekuwa jambo rahisi tukio la filiter ya mashuhuri wa Veo 3, kupiga video za Smith akiimba—au kufanya kitu kingine chochote—ambacho kinakazia wasiwasi juu ya teknolojia ya video kwa AI. Ubinafsi wa kitamaduni unakaribia kwa kasi. Kwa mfano huo, hivi karibuni tulifanya mfululizo wa majaribio makubwa ya kuundwa kwa video na Veo 3 na tutashiriki matokeo hayo hivi karibuni katika makala maalum. Kwa sasa, chukua hii kama taarifa fupi kuhusu Prince wa Noodles. Bon appétit!


Watch video about

Kizazi cha Google Veo 3 AI Video Generator: Kuendana kwa Sauti na Picha kwa Uhalisia Unaovutia

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Disney Imetuma Kuzuia na Kuamuru Google Kuhusu Ma…

Kampuni ya Walt Disney imeanzisha hatua kubwa za kisheria dhidi ya Google kwa kuwasilisha barua ya kuzuia na kuagiza na kufunga, ikimlaumu kampuni hiyo kubwa ya teknolojia kwa kuingilia kati maudhui yaliyohifadhiwa kwa haki za kiubunifu za Disney wakati wa mafunzo na maendeleo ya mifano ya akili bandia (AI) inayozalisha vitu bila kutoa malipo.

Dec. 12, 2025, 1:35 p.m.

AI na Mustakabali wa Uboreshaji wa Injini za Utaf…

Kadri ya akili bandia (AI) inavyosomea na kuingizwa kwa kiasi kikubwa katika uuzaji wa kidigitali, ushawishi wake kwenye uboreshaji wa injini za utafutaji (SEO) unakuwa mkubwa.

Dec. 12, 2025, 1:33 p.m.

Akili Bandia: MiniMax na Mpango wa Zhipu AI Wajum…

MiniMax na Zhipu AI, kampuni mbili zinazong’ara katika sekta ya akili bandia, zinaripotiwa kujiandaa kuingia soko la hisa la Hong Kong hivi karibuni Januari mwaka ujao.

Dec. 12, 2025, 1:31 p.m.

OpenAI wamemteua Mkurugenzi Mkuu wa Slack, Denise…

Denise Dresser, Mkurugenzi Mkuu wa Slack, anatarajiwa kuachia nafasi yake na kuwa Mkuu wa Mauzo wa OpenAI, kampuni inayoleta ChatGPT.

Dec. 12, 2025, 1:30 p.m.

Mbinu za Uzalishaji wa Video za AI Zaboreshaji Uf…

Sekta ya filamu inaonyesha mabadiliko makubwa wakati studios zinazoendelea kuingiza mbinu za uvumbuzi wa video wa akili bandia (AI) ili kuboresha mchakato wa kazi za baada ya utengenezaji.

Dec. 12, 2025, 1:24 p.m.

Vituo 19 Bora vya AI vya Mitandao ya Kijamii vya …

AI inabadilisha sana masoko ya mitandao ya kijamii kwa kutoa zana zinazorahisisha na kuboresha ushirikiano wa wasikilizaji.

Dec. 12, 2025, 9:42 a.m.

Waathiriwa wa AI kwenye Mitandao ya Kijamii: Furs…

Kuibuka kwa waonesha vya AI vinavyotengenezwa kwenye mitandao ya kijamii kunahesabu mabadiliko makubwa katika mazingira ya kidijitali, na kuibua mijadala pana kuhusu uhalali wa mawasiliano ya mtandaoni na masuala ya maadili yanayohusiana na wahusika hawa wa mitandaoni.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today