Akili ya bandia inayounda (AI), ikiwa ni pamoja na mifano kama Stable Diffusion, Midjourney, na DALL-E, mara nyingi inapata shida katika kutengeneza picha zinazoambatana, hasa inapokuja kwa maelezo kama usawa wa uso na uwakilishaji sahihi wa vidole. Mifano hii kwa ujumla hutengeneza picha za mraba, na hivyo kusababisha shida wakati wa kuunda picha katika vipimo vya uwiano tofauti, na kusababisha dosari kama vidole vya ziada au maumbo yaliyopotoka. Ili kushughulikia matatizo haya, wanasayansi wa kompyuta katika Chuo Kikuu cha Rice wameunda ElasticDiffusion, mbinu mpya inayotumia mifano ya diffusion iliyofunzwa awali. Moayed Haji Ali, mwanafunzi wa udaktari katika Rice, aliwasilisha mbinu hii kwenye Mkutano wa IEEE 2024 wa Maono ya Kompyuta na Utambuzi wa Mifumo huko Seattle. Haji Ali alielezea kuwa mifano ya jadi ya diffusion inaweza tu kutoa picha kwa azimio maalum, ambayo ni matokeo ya kufunzishwa kupita kiasi, ambapo mfano wa AI hufanya vizuri kwenye data inayojulikana lakini hupambana na tofauti. ElasticDiffusion inaboresha mbinu kwa kutenganisha taarifa za ndani na za jumla wakati wa kuzalisha picha, badala ya kuziunganisha.
Utengano huu husaidia kuepusha kasoro za kuona zinazotokana na data inayorudia wakati wa kubadilisha kwenye picha zisizo za mraba. Haji Ali alibainisha kuwa mchakato unahusisha kwanza kupata alama ya jumla inayowakilisha muundo wa jumla wa picha, ikifuatiwa na kujaza maelezo ya kiwango cha pikseli kwa sehemu. Mbinu hii inawezesha kizazi cha picha zilizo wazi katika uwiano wa vipimo mbalimbali bila kuhitaji mafunzo ya ziada ya mfano. Ingawa ElasticDiffusion inatoa uthabiti na kubadilikabadilika katika kizazi cha picha, ina upungufu: kwa sasa inahitaji mara 6-9 zaidi kuunda picha ikilinganishwa na mifano ya kawaida ya diffusion. Haji Ali analenga kuboresha mbinu ili kufikia nyakati za utoaji sawa huku akibakiza uwezo wa kutoa picha za ubora wa juu bila kujali uwiano wa vipimo.
ElasticDiffusion: Kuboresha Utoaji wa Picha kwa AI katika Chuo Kikuu cha Rice
Vyanzo vya mitandao ya kijamii vinazidi kutumia akili bandia (AI) kuboresha usimamizi wao wa maudhui ya video, kukabiliana na kuongezeka kwa video kama njia kuu ya mawasiliano mtandaoni.
MABADILIKO YA SERA: Baada ya miaka ya kuimarisha vizuizi, uamuzi wa kuruhusu mauzo ya vidiwi vya Nvidia H200 kwa China umeibua upinzani kutoka kwa baadhi ya Wap Republican.
Kazi za kuacha kazi zinazohusishwa na akili bandia zimeashiria soko la Ajira la mwaka wa 2025, ambapo kampuni kubwa zimetangaza maelfu ya watu kuachishwa kazi kutokana na maendeleo ya AI.
RankOS™ Inaboresha Uonekano wa Aina na Chanjo kwenye Majukwaa ya Utafutaji wa Perplexity AI na Mengineyo Huduma za Shirika la SEO la Perplexity New York, NY, 19 Disemba 2025 (GLOBE NEWSWIRE) — NEWMEDIA
Toleo la makala hii asili lilitokea kwenye jarida la CNBC la Inside Wealth, liliandikwa na Robert Frank, linalohudumia kama rasilimali ya kila wiki kwa wawekezaji na watumiaji wenye mali nyingi.
Vichwa vya habari vimeelekeza kwenye uwekezaji wa Disney wa dola bilioni moja kwa OpenAI na kubashiri kwanini Disney ilichagua OpenAI kuliko Google, ambayo inamshitaki kwa dukuduku la hakimiliki.
Salesforce imetoa ripoti kamili kuhusu tukio la Ununuzi la Cyber Week la mwaka wa 2025, ikichambua data kutoka kwa zaidi ya waunuzi bilioni 1.5 duniani kote.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today