lang icon En
Sept. 15, 2024, 12:46 a.m.
2756

ElasticDiffusion: بهبود تولید تصویر با هوش مصنوعی در دانشگاه رایس

Brief news summary

هوش مصنوعی مولد، به‌خصوص مدل‌های انتشار، اغلب با تولید تصاویر یکنواخت و دقیق مشکل دارد، به‌ویژه در حفظ ویژگی‌های دقیق مانند تقارن صورت در فرمت‌های غیر مربعی. محققان دانشگاه رایس روش جدیدی به نام ElasticDiffusion را توسعه داده‌اند که توسط دانشجوی دکترای مواید حاجی علی در کنفرانس IEEE 2024 در زمینه تشخیص الگو و بینایی کامپیوتر در سیاتل ارائه شد. برخلاف مدل‌های قبلی مانند Stable Diffusion و DALL-E که با تصاویر مربعی خوب عمل می‌کنند اما در نسبت‌های دیگر دچار تحریف می‌شوند، ElasticDiffusion تولید تصویر را با تفکیک جزئیات پیکسلی محلی از اشکال جهانی بهبود می‌بخشد. این پیشرفت خطاهای موجود در تصاویر غیر مربعی را به حداقل می‌رساند در حالی که انسجام بصری حفظ می‌شود، بدون نیاز به آموزش اضافی. در حال حاضر، ElasticDiffusion با سرعتی حدود ۶-۹ برابر کندتر از مدل‌های معمول عمل می‌کند؛ با این حال، محققان در حال بهینه‌سازی عملکرد آن هستند تا با روش‌های موجود هماهنگ شود، امکان استفاده از آن در نسبت‌های مختلف فراهم شود.

هوش مصنوعی مولد، شامل مدل‌هایی مانند Stable Diffusion، Midjourney و DALL-E، اغلب با تولید تصاویر یکنواخت مشکل دارد، به‌خصوص زمانی که به جزئیات مانند تقارن صورت و نمایش مناسب انگشت‌ها می‌پردازد. این مدل‌ها عموماً تصاویر مربعی تولید می‌کنند و در نتیجه هنگامی که موظف به ایجاد تصاویر در نسبت‌های متفاوت می‌شوند، باعث ایجاد ناهنجاری‌هایی مانند انگشت‌های اضافی یا شکل‌های تحریف‌شده می‌شوند. برای حل این مشکلات، دانشمندان کامپیوتر در دانشگاه رایس روش جدیدی به نام ElasticDiffusion توسعه داده‌اند که از مدل‌های انتشار پیش‌آموزش‌یافته بهره می‌برد. مواید حاجی علی، دانشجوی دکتری در دانشگاه رایس، این روش را در کنفرانس بین‌المللی IEEE 2024 در زمینه تشخیص الگو و بینایی کامپیوتر در سیاتل ارائه کرد. حاجی علی توضیح داد که مدل‌های انتشار سنتی تنها می‌توانند تصاویر را در وضوح خاصی تولید کنند، که این نتیجه هم‌پوشانی بیش از حد است، جایی که مدل هوش مصنوعی بر روی داده‌های آشنا به خوبی عمل می‌کند اما با تنوع‌ها مشکل دارد. ElasticDiffusion رویکرد را با جدا کردن اطلاعات محلی و جهانی در طول تولید تصویر بهبود می‌بخشد، به‌جای ترکیب آن‌ها.

این جدایش کمک می‌کند از نقص‌های بصری ناشی از داده‌های تکراری هنگام سازگاری با تصاویر غیر مربعی اجتناب شود. حاجی علی اشاره کرد که این فرآیند شامل ابتدا دریافت امتیاز جهانی که ساختار کلی تصویر را در بر می‌گیرد، و سپس پر کردن جزئیات در سطح پیکسل در بخش‌ها است. این روش امکان تولید تصاویر روشن‌تر را در نسبت‌های متفاوت فراهم می‌کند بدون نیاز به آموزش مدل اضافی. در حالی که ElasticDiffusion یکنواختی و انعطاف‌پذیری بیشتری در تولید تصاویر ارائه می‌دهد، با یک تبادل همراه است: در حال حاضر برای ایجاد تصاویر به مدت ۶-۹ برابر بیشتر نسبت به مدل‌های انتشار معمول زمان می‌برد. حاجی علی هدف دارد تا این روش را بهینه کند تا زمان استنباط معادل دستیابی شود در حالی که توانایی تولید تصاویر با کیفیت بالا بدون توجه به نسبت ابعاد حفظ شود.


Watch video about

ElasticDiffusion: بهبود تولید تصویر با هوش مصنوعی در دانشگاه رایس

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

ابزارهای مدیریت محتوای ویدیویی هوش مصنوعی مقابله …

پلتفرم‌های شبکه‌های اجتماعی به طور فزاینده‌ای از هوش مصنوعی (AI) برای بهبود نظارت بر محتوای ویدیویی خود بهره می‌برند و این اقدام باعث مقابله با افزایش حجم ویدیوها به عنوان شکل غالب ارتباطات آنلاین شده است.

Dec. 21, 2025, 1:38 p.m.

ایالات متحده مجدداً محدودیت‌های صادراتی خود بر روی…

بازگشت سیاست: پس از سال‌ها محدودیت‌زدایی، تصمیم به اجازه فروش تراشه‌های H200 ساخت انویدیا به چین، اعتراضاتی از سوی برخی جمهوری‌خواهان به همراه داشته است.

Dec. 21, 2025, 1:38 p.m.

هوش مصنوعی در سال ۲۰۲۵ بیش از ۵۰ هزار نفر را اخرا…

اخراج نیروی کار بر اثر هوش مصنوعی در بازار کار سال ۲۰۲۵ موجی از کاهش نیرو را رقم زده است، به طوری که شرکت‌های بزرگ اعلام کردند هزاران شغل به دلیل پیشرفت‌های هوش مصنوعی حذف شده است.

Dec. 21, 2025, 1:36 p.m.

خدمات سئو پرپلیسیتی راه‌اندازی شد – NEWMEDIA.COM،…

رتک‌او‌اس™ قابلیت دید برند و ارجاعات را در پلتفرم‌های جستجوگر پاسخ‌گو مانند پرسپلکتکس AI و سایر موتورهای پاسخ‌دهی تقویت می‌کند خدمات آژانس سئو پرسپلکتکس نیویورک، NY، ۱۹ دسامبر ۲۰۲۵ (GLOBE NEWSWIRE) — امروز، نیو مدیا دات کام رویدادی رونمایی کرد به نام رتک‌او‌اس™، که چارچوبی اختصاصی است و هدف آن افزایش دیده‌شدن سازمان‌ها در پرسپلکتکس AI و سایر پلتفرم‌های پاسخ‌دهی نوظهور است که از بازیابی اطلاعات در لحظه و سنتز مولد بهره می‌برند

Dec. 21, 2025, 1:22 p.m.

دفتر خانوادگیِ اریک اشمیت در ۲۲ استارتاپ هوش مصنوع…

نسخه اصلی این مقاله در خبرنامه Inside Wealth شرکت CNBC، نوشته رابرت فرانک منتشر شده است که به عنوان منبع هفتگی برای سرمایه‌گذاران و مصرف‌کنندگانی با ثروت بالا خدمت می‌کند.

Dec. 21, 2025, 1:21 p.m.

مروری بر آینده بازاریابی: چرا «فقط کافی بودن» بزر…

عناوین بر تمرکز بر سرمایه‌گذاری میلیارد دلاری دیزنی در OpenAI تأکید دارند و فرضیه‌هایی درباره چرایی ترجیح دیزنی OpenAI به جای گوگل، که در حال حاضر درباره نقض ادعایی حق نشر با آن در دادگاه است، مطرح می‌کنند.

Dec. 21, 2025, 9:34 a.m.

داده‌های Salesforce نشان می‌دهد هوش مصنوعی و عوام…

شرکت Salesforce گزارشی جامع در مورد رویداد خرید در هفته سایبر ۲۰۲۵ منتشر کرده است که داده‌های بیش از ۱.۵ میلیارد خریدار جهانی را تحلیل می‌کند.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today