Jumanne, Google ilizindua Veo 3, mfano mpya wa uundaji wa video kwa akili bandia unaoweza kufanikisha jambo ambalo hadi sasa hakuna mtengenezaji mkubwa wa video kwa AI ameliweza: kutengeneza nyimbo za sauti zinazolingana na video kwa pamoja. Kati ya mwaka 2022 na 2024, video za awali zilizotengenezwa kwa AI zilikuwa kimya na kwa ujumla zilikuwa fupi sana. Sasa, Veo 3 inatoa vipande vya sekunde nane vya video high-definition kamili na sauti, mazungumzo, na athari za sauti. Baada ya uzinduzi huo, watu walijitokeza mara moja kuuliza swali la msingi: Je, Veo 3 inaweza kuiga vema mchezaji wa Oscar Will Smith akiila spaghetti? Tukumbuke kwa kifupi: kipimo cha "spaghetti benchmark" katika uundaji wa video kwa AI kilianza machi 2023 kwa video ya awali, isiyotia matumaini, iliyotengenezwa kwa AI kwa kutumia mfano wa synthesis wa chanzo huria uitwao ModelScope. Mfano huu wa spaghetti uliweza ikavuma sana hivi kwamba Smith aliweka ucheshi juu yake takriban mwaka mmoja baadaye, Februari 2024. Hapa kuna kumbukumbu ya jinsi video ya awali iliyovuma sana ilivyokuwa: Kinachosahaulika mara nyingi ni kuwa wakati huo, ucheshi wa Smith haukutengenezwa kwa kutumia mtengenezaji bora wa video wa AI ulipatikana—mfano uitwao Gen-2 kutoka Runway ulikuwa tayari umetolewa matokeo bora zaidi, ingawa haukuweza kupatikana kwa umma bado. Hata hivyo, toleo la ModelScope lilikuwa la ajabu na lilikumbukwa vya kutosha kuwa kuwa alama ya mwongozo kuhusu mipaka ya mwanzo ya AI katika utengenezaji wa video wakati teknolojia ikisonga mbele. Mapema wiki hii, mtengenezaji wa programu za AI Javi Lopez alijibu mashabiki waliotaka kurudi kuangalia jaribio la spaghetti kwa kutumia Veo 3, akashiriki matokeo yake kwenye X. Hata hivyo, wakati wa kutazama matokeo, sauti ya nyimbo ilionekana ya ajabu: uongo wa Smith ulisikika kana kwamba alikuwa anakunywa spaghetti huku akilewa. Hitilafu hii inatokana na uwezo wa majaribio wa Veo 3 wa kuongeza athari za sauti, huenda kwa sababu data yake ya mafunzo ilijumuisha mifano mingi yauchu na sauti za kukunja. Miundo ya AI inayozalisha hufanya kazi kama mifumo ya utabiri wa kuoanisha mambo kwa kutumia data ya kutosha ya mafunzo kwa vyombo mbalimbali ili kutoa matokeo yanayoonekana ya kweli.
Wakati baadhi ya dhihirisho linaonekana kuzidi au kupunguzwa kwenye data hiyo, huleta matokeo ya kusebena kama haya. Pia, sisi tulitumia mwelekeo wenyewe kwenye Veo 3, lakini “Will Smith” alizuiwa na vichujio vya maudhui vya Google. Hata hivyo, kutumia mwelekeo wa “Mtu mweusi anakula spaghetti, ” kulizalisha athari sawa za sauti ya kukunja (Labda Lopez alikuwa na ufikiaji wa awali bila vichungi, au alitumia mabadiliko ya mwelekeo yaliyopita kupitia majaribio ya kuingiza maneno bila vichungi). Veo 3 inashangaza kwa uwezo wake wa kuzalisha mazungumzo yanayoendana na muziki, tayari ikiwa na mfano kadhaa wa kuvutia kwenye X. Hatukutaka kusimama kwenye video ya mtu akila noodles al dente sana tu, tulijaribu kuona iwapo anaweza kuimba na kulila kwa wakati mmoja kwa kuagiza: “Mtu akimimba opera ya ucheshi kwa Kiingereza kuhusu spaghetti akiwa mezani akila. ” Tumefanya maendeleo makubwa tangu 2023, na wazalishaji wa video kwa AI wataendelea kuboresha uhalisia na kazi zake. Lingekuwa jambo rahisi tukio la filiter ya mashuhuri wa Veo 3, kupiga video za Smith akiimba—au kufanya kitu kingine chochote—ambacho kinakazia wasiwasi juu ya teknolojia ya video kwa AI. Ubinafsi wa kitamaduni unakaribia kwa kasi. Kwa mfano huo, hivi karibuni tulifanya mfululizo wa majaribio makubwa ya kuundwa kwa video na Veo 3 na tutashiriki matokeo hayo hivi karibuni katika makala maalum. Kwa sasa, chukua hii kama taarifa fupi kuhusu Prince wa Noodles. Bon appétit!
Kizazi cha Google Veo 3 AI Video Generator: Kuendana kwa Sauti na Picha kwa Uhalisia Unaovutia
Kampuni ya Walt Disney imeanzisha hatua kubwa za kisheria dhidi ya Google kwa kuwasilisha barua ya kuzuia na kuagiza na kufunga, ikimlaumu kampuni hiyo kubwa ya teknolojia kwa kuingilia kati maudhui yaliyohifadhiwa kwa haki za kiubunifu za Disney wakati wa mafunzo na maendeleo ya mifano ya akili bandia (AI) inayozalisha vitu bila kutoa malipo.
Kadri ya akili bandia (AI) inavyosomea na kuingizwa kwa kiasi kikubwa katika uuzaji wa kidigitali, ushawishi wake kwenye uboreshaji wa injini za utafutaji (SEO) unakuwa mkubwa.
MiniMax na Zhipu AI, kampuni mbili zinazong’ara katika sekta ya akili bandia, zinaripotiwa kujiandaa kuingia soko la hisa la Hong Kong hivi karibuni Januari mwaka ujao.
Denise Dresser, Mkurugenzi Mkuu wa Slack, anatarajiwa kuachia nafasi yake na kuwa Mkuu wa Mauzo wa OpenAI, kampuni inayoleta ChatGPT.
Sekta ya filamu inaonyesha mabadiliko makubwa wakati studios zinazoendelea kuingiza mbinu za uvumbuzi wa video wa akili bandia (AI) ili kuboresha mchakato wa kazi za baada ya utengenezaji.
AI inabadilisha sana masoko ya mitandao ya kijamii kwa kutoa zana zinazorahisisha na kuboresha ushirikiano wa wasikilizaji.
Kuibuka kwa waonesha vya AI vinavyotengenezwa kwenye mitandao ya kijamii kunahesabu mabadiliko makubwa katika mazingira ya kidijitali, na kuibua mijadala pana kuhusu uhalali wa mawasiliano ya mtandaoni na masuala ya maadili yanayohusiana na wahusika hawa wa mitandaoni.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today