lang icon En
Sept. 15, 2024, 12:46 a.m.
2754

ElasticDiffusion: Kuboresha Utoaji wa Picha kwa AI katika Chuo Kikuu cha Rice

Brief news summary

Akili ya bandia inayozalisha, hasa mifano ya diffusion, mara nyingi inakabiliana na changamoto za kutoa picha zinazoambatana na za kina, hasa kudumisha vipengele vidogo kama usawa wa uso katika miundo isiyo ya mraba. Watafiti katika Chuo Kikuu cha Rice wameunda mbinu mpya inayoitwa ElasticDiffusion, kama ilivyowasilishwa na mwanafunzi wa udaktari Moayed Haji Ali kwenye Mkutano wa IEEE 2024 wa Maono ya Kompyuta na Utambuzi wa Mifumo huko Seattle. Tofauti na mifano ya awali kama Stable Diffusion na DALL-E, ambayo hufanya vizuri na picha za mraba lakini hupambana na kupotoka katika uwiano wa vipimo vingine, ElasticDiffusion inaboresha kizazi cha picha kwa kutofautisha maelezo ya pikseli za ndani kutoka kwa maumbo ya jumla. Maendeleo haya yanapunguza makosa katika picha zisizo za mraba huku ikihakikisha uwiano wa kuona, bila hitaji la mafunzo ya ziada. Hivi sasa, ElasticDiffusion inafanya kazi kwa kasi mara 6-9 polepole kuliko mifano ya kawaida; hata hivyo, watafiti wanaboresha utendaji wake ili ulingane na njia zilizopo, na hivyo kuwezesha matumizi yake katika uwiano mbalimbali wa vipimo.

Akili ya bandia inayounda (AI), ikiwa ni pamoja na mifano kama Stable Diffusion, Midjourney, na DALL-E, mara nyingi inapata shida katika kutengeneza picha zinazoambatana, hasa inapokuja kwa maelezo kama usawa wa uso na uwakilishaji sahihi wa vidole. Mifano hii kwa ujumla hutengeneza picha za mraba, na hivyo kusababisha shida wakati wa kuunda picha katika vipimo vya uwiano tofauti, na kusababisha dosari kama vidole vya ziada au maumbo yaliyopotoka. Ili kushughulikia matatizo haya, wanasayansi wa kompyuta katika Chuo Kikuu cha Rice wameunda ElasticDiffusion, mbinu mpya inayotumia mifano ya diffusion iliyofunzwa awali. Moayed Haji Ali, mwanafunzi wa udaktari katika Rice, aliwasilisha mbinu hii kwenye Mkutano wa IEEE 2024 wa Maono ya Kompyuta na Utambuzi wa Mifumo huko Seattle. Haji Ali alielezea kuwa mifano ya jadi ya diffusion inaweza tu kutoa picha kwa azimio maalum, ambayo ni matokeo ya kufunzishwa kupita kiasi, ambapo mfano wa AI hufanya vizuri kwenye data inayojulikana lakini hupambana na tofauti. ElasticDiffusion inaboresha mbinu kwa kutenganisha taarifa za ndani na za jumla wakati wa kuzalisha picha, badala ya kuziunganisha.

Utengano huu husaidia kuepusha kasoro za kuona zinazotokana na data inayorudia wakati wa kubadilisha kwenye picha zisizo za mraba. Haji Ali alibainisha kuwa mchakato unahusisha kwanza kupata alama ya jumla inayowakilisha muundo wa jumla wa picha, ikifuatiwa na kujaza maelezo ya kiwango cha pikseli kwa sehemu. Mbinu hii inawezesha kizazi cha picha zilizo wazi katika uwiano wa vipimo mbalimbali bila kuhitaji mafunzo ya ziada ya mfano. Ingawa ElasticDiffusion inatoa uthabiti na kubadilikabadilika katika kizazi cha picha, ina upungufu: kwa sasa inahitaji mara 6-9 zaidi kuunda picha ikilinganishwa na mifano ya kawaida ya diffusion. Haji Ali analenga kuboresha mbinu ili kufikia nyakati za utoaji sawa huku akibakiza uwezo wa kutoa picha za ubora wa juu bila kujali uwiano wa vipimo.


Watch video about

ElasticDiffusion: Kuboresha Utoaji wa Picha kwa AI katika Chuo Kikuu cha Rice

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Vifaa vya Uangalizi wa Maudhui ya Video vya AI Vi…

Vyanzo vya mitandao ya kijamii vinazidi kutumia akili bandia (AI) kuboresha usimamizi wao wa maudhui ya video, kukabiliana na kuongezeka kwa video kama njia kuu ya mawasiliano mtandaoni.

Dec. 21, 2025, 1:38 p.m.

US inarejelea tena vizuizi vyake vya uagizaji wa …

MABADILIKO YA SERA: Baada ya miaka ya kuimarisha vizuizi, uamuzi wa kuruhusu mauzo ya vidiwi vya Nvidia H200 kwa China umeibua upinzani kutoka kwa baadhi ya Wap Republican.

Dec. 21, 2025, 1:38 p.m.

AI ilikuwa nyuma ya motisha za kuachishwa kazi za…

Kazi za kuacha kazi zinazohusishwa na akili bandia zimeashiria soko la Ajira la mwaka wa 2025, ambapo kampuni kubwa zimetangaza maelfu ya watu kuachishwa kazi kutokana na maendeleo ya AI.

Dec. 21, 2025, 1:36 p.m.

Huduma za SEO za Perplexity Zianzwa – NEWMEDIA.CO…

RankOS™ Inaboresha Uonekano wa Aina na Chanjo kwenye Majukwaa ya Utafutaji wa Perplexity AI na Mengineyo Huduma za Shirika la SEO la Perplexity New York, NY, 19 Disemba 2025 (GLOBE NEWSWIRE) — NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

Ofisi ya familia ya Eric Schmidt inaan investment…

Toleo la makala hii asili lilitokea kwenye jarida la CNBC la Inside Wealth, liliandikwa na Robert Frank, linalohudumia kama rasilimali ya kila wiki kwa wawekezaji na watumiaji wenye mali nyingi.

Dec. 21, 2025, 1:21 p.m.

Mwandiko wa Mustakali wa Masoko: Kwa nini "tu vya…

Vichwa vya habari vimeelekeza kwenye uwekezaji wa Disney wa dola bilioni moja kwa OpenAI na kubashiri kwanini Disney ilichagua OpenAI kuliko Google, ambayo inamshitaki kwa dukuduku la hakimiliki.

Dec. 21, 2025, 9:34 a.m.

Data za Salesforce zinaonyesha kuwa AI na Maajent…

Salesforce imetoa ripoti kamili kuhusu tukio la Ununuzi la Cyber Week la mwaka wa 2025, ikichambua data kutoka kwa zaidi ya waunuzi bilioni 1.5 duniani kote.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today