lang icon English
Sept. 15, 2024, 12:46 a.m.
2380

ElasticDiffusion: Подобрување на создавањето слики со ИВ на Универзитетот Рајс

Brief news summary

Генеративната вештачка интелигенција, особено моделите на дифузија, често се соочува со предизвици при создавање конзистентни и детални слики, особено при одржување на фини карактеристики како симетријата на лицето во неквадратни формати. Истражувачи од Универзитетот Рајс развија нов пристап наречен ElasticDiffusion, кој го презентираше докторскиот студент Мојед Хаџи Али на IEEE 2024 Конференцијата за компјутерска визија и препознавање на патерни во Сиетл. За разлика од претходните модели како Stable Diffusion и DALL-E, кои работат добро со квадратни слики но се мачат со изобличување во други соодноси, ElasticDiffusion го подобрува создавањето на слики со разликување на локалните пикселни детали од глобалните форми. Ова унапредување ги минимизира грешките во неквадратни слики додека обезбедува визуелна кохеренција, без потреба од дополнително тренирање. Моментално, ElasticDiffusion работи со брзина која е 6-9 пати побавна од конвенционалните модели; сепак, истражувачите ја оптимизираат неговата изведба за да ја усогласат со постоечките методи, овозможувајќи му употреба во различни соодноси.

Генеративната вештачка интелигенција (ИВ), вклучувајќи модели како што се Stable Diffusion, Midjourney и DALL-E, често се соочува со проблеми при создавање конзистентни слики, особено кога станува збор за детали како што се симетријата на лицето и соодветното претставување на прстите. Овие модели генерално создаваат квадратни слики, што води до проблеми кога се задава задача за создавање слики во различни соодносни формати, резултирајќи во аномалии како дополнителни прсти или изобличени форми. За да ги адресираат овие проблеми, компјутерските научници од Универзитетот Рајс развиле ElasticDiffusion, нов метод кој искористува претходно обучени модели на дифузија. Мојед Хаџи Али, докторски студент на Универзитетот Рајс, го претстави овој метод на IEEE 2024 Конференцијата за компјутерска визија и препознавање на патерни во Сиетл. Хаџи Али објасни дека традиционалните модели на дифузија можат да генерираат слики само на одредена резолуција, што е последица на преголемо прилагодување, каде што моделот на ИВ работи добро со познати податоци, но се мачи со варијации. ElasticDiffusion го подобрува пристапот со разделување на локалната и глобалната информација за време на создавањето на сликите, наместо да ги комбинира.

Ова разделување помага да се избегнат визуелни несаканости кои ariseираат од повторливите податоци при прилагодување на неквадратни слики. Хаџи Али забележа дека процесот вклучува првично добивање глобален резултат кој ја капсулира целосната структура на сликата, по што следи пополнување на пикселните детали во секциите. Овој метод овозможува генерирање на појасни слики во различни соодноси без потреба од дополнително тренирање на моделот. Додека ElasticDiffusion нуди подобрена конзистентност и адаптибилност во создавањето на слики, тој доаѓа со компромис: моментално му потребно 6-9 пати подолго за да создаде слики во споредба со конвенционалните дифузни модели. Хаџи Али цели да го оптимизира методот за да постигне еквивалентно време за инференција, додека ја задржува способноста за генерирање висококвалитетни слики без оглед на соодносот.


Watch video about

ElasticDiffusion: Подобрување на создавањето слики со ИВ на Универзитетот Рајс

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 3, 2025, 1:26 p.m.

Иницијативите за вештачка интелигенција на Амазон…

Амазон извести нето приходи во трето тримесечје од 180,2 милијарди долари, што претставува зголемување од 13 проценти во споредба со претходната година, во голема мера поттикнато од иницијативите за вештачка интелигенција низ операциите во Сијетл.

Nov. 3, 2025, 1:22 p.m.

Геостар претставува GEO како традиционалното SEO …

Летом минатата година на Олимписките игри во Париз, Мек МакКонел сфати дека пребарувањето значително се измени кога неговите родители independently користеа ChatGPT за планирање на нивниот ден, при што AI препорачуваше одредени туристички агенции, ресторани и атракции — бизниси кои добија невидена видливост.

Nov. 3, 2025, 1:21 p.m.

AI во маркетингот на социјалните мрежи: можности …

Интеграцијата на вештачката интелигенција (ВИ) во маркетингот на социјалните медиуми (МСМ) брзо ја преобразува дигиталната реклама и ангажманот на корисниците, поттикната од напредокот во компјутерската визија, обработката на природен јазик (НОЈ) и предвидувачката аналитика.

Nov. 3, 2025, 1:17 p.m.

Мета Платформс инвестира над 10 милијарди долари …

Мета Платформс Инк.

Nov. 3, 2025, 1:11 p.m.

Револуција во содржината со вештачка интелигенциј…

Во последните години, вештачката интелигенција (ВИ) револуционизираше маркетингот, овозможувајќи на големите компании да оптимизираат стратегии и да остварат импресивни резултати од инвестициите.

Nov. 3, 2025, 1:10 p.m.

Проектите со вештачка интелигенција мора да произ…

ХИМСС-ИЗ Роб Хавази и КАрла Еидем од PMI нагласуваат дека здравствените организации треба да постават добро дефинирани цели и цврста управување со податоци пред да развијат алатки за вештачка интелигенција.

Nov. 3, 2025, 9:18 a.m.

Преглед на видливоста на Wix AI: Нов алатка за пр…

Wix, водечкиот платформа за создавање и управување со веб-страници, лансираше иновативна функција наречена AI Visibility Overview, наменета да им помогне на сопствениците на веб-страници подобро да ја разберат нивната присутност во резултатите од пребарувања генерирани од вештачка интелигенција.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today