ElasticDiffusion: রাইস বিশ্ববিদ্যালয়ে AI দ্বারা চিত্র উৎপাদন উন্নতি
Brief news summary
জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা, বিশেষত ডিফিউশন মডেলগুলি, প্রায়ই প্রতিসম এবং বিস্তারিত ছবির উৎপাদনে সমস্যা সম্মুখীন হয়, বিশেষত অ-বর্গাকার ফরম্যাটে মুখের সমানতা বজায় রাখার ক্ষেত্রে। রাইস বিশ্ববিদ্যালয়ের গবেষকরা একটি নতুন পদ্ধতি উদ্ভাবন করেছেন, যার নাম ElasticDiffusion, যা রাইসের ডক্টরাল ছাত্র মোয়াইয়াদ হাজি আলী সিয়াটলে IEEE 2024 কনফারেন্স অন কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশনে উপস্থাপন করেছেন। পূর্বের মডেলগুলির মতো স্টেবল ডিফিউশন এবং DALL-E, যা বর্গাকার ছবির ক্ষেত্রে ভালো কাজ করে কিন্তু অন্যান্য অনুপাতের পুনর্গঠনের ক্ষেত্রে সংগ্রাম করে, তার তুলনায় ElasticDiffusion স্থানীয় পিক্সেল বিবরণকে বৈশ্বিক আকৃতির থেকে পৃথক করে ছবি উৎপাদনে উন্নতি আনে। এই উন্নয়নটি অ-বর্গাকার ছবিগুলিতে ত্রুটি কমায় এবং দৃশ্যগত সামঞ্জস্য নিশ্চিত করে, অতিরিক্ত প্রশিক্ষণের প্রয়োজন ছাড়াই। বর্তমানে, ElasticDiffusion প্রচলিত মডেলগুলির তুলনায় ৬-৯ গুণ ধীর গতিতে কাজ করে; তবে গবেষকরা এর কর্মদক্ষতাকে প্রচলিত পদ্ধতির সাথে সামঞ্জস্য করতে কাজ করছেন, যা বিভিন্ন অনুপাতের ফরম্যাটে ব্যবহারিকার্য্য সক্ষম করে।জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা (AI), যার মধ্যে স্টেবল ডিফিউশন, মিডজার্নি এবং DALL-E মডেলগুলি অন্তর্ভুক্ত রয়েছে, তা প্রায়ই সামঞ্জস্যপূর্ণ ছবি উৎপাদনে লড়াই করে, বিশেষত বিশদগুলির ক্ষেত্রে যেমন মুখের অসামঞ্জস্যতা এবং উপযুক্ত আঙুলের উপস্থাপনা। এই মডেলগুলি সাধারণত বর্গাকার ছবি উৎপন্ন করে, যা বিভিন্ন অনুপাতের ছবির ক্ষেত্রে সমস্যা তৈরি করে, যেমন অতিরিক্ত আঙুল বা বিকৃত আকৃতির অস্বাভাবিকতাগুলি। এই সমস্যাগুলি সমাধানের জন্য, রাইস বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানী ElasticDiffusion নামে একটি নতুন উপায় উদ্ভাবন করেছেন যা পূর্ব প্রশিক্ষিত ডিফিউশন মডেলগুলিকে ব্যবহার করে। রাইসের ডক্টরাল ছাত্র মোয়াইয়াদ হাজি আলী এই পদ্ধতিটি সিয়াটলে IEEE 2024 কনফারেন্স অন কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশনে উপস্থাপন করেছেন। হাজি আলী ব্যাখ্যা করেছেন যে প্রচলিত ডিফিউশন মডেলগুলি শুধুমাত্র একটি নির্দিষ্ট রেজোলিউশনে ছবি তৈরি করতে পারে, যা একটি ওভারফিটিং ফলাফল, যেখানে একটি AI মডেল পরিচিত ডেটায় ভাল কাজ করে কিন্তু পরিবর্তনের সাথে লড়াই করে। ElasticDiffusion স্থানীয় এবং বৈশ্বিক তথ্যগুলিকে আলাদা করে ছবি উৎপাদনের পদ্ধতিকে উন্নত করে, তাদেরকে একত্রিত করার বদলে। এই পৃথকীকরণটি অস্বচ্ছতা এড়াতে সহায়ক যেখানে পূর্ববর্তী ডেটার পুনরাবৃত্তির কারণে অস্বচ্ছ দৃশ্য তৈরি হয়। হাজি আলী বলেছেন যে প্রক্রিয়াটি শুরুতে একটি বৈশ্বিক স্কোর প্রাপ্ত করে যা ছবিটির সামগ্রিক কাঠামোকে সন্নিবেশ করে, তারপরে সেকশনে পিক্সেল স্তরের বিস্তারিতগুলি পূরণ করে। এই পদ্ধতিটি বিভিন্ন অনুপাতের স্পষ্ট ছবি তৈরির সক্ষমতা প্রদান করে, অতিরিক্ত মডেল প্রশিক্ষণের প্রয়োজন ছাড়াই। যদিও ElasticDiffusion ছবি উৎপাদনে বর্ধিত সামঞ্জস্যতা এবং অভিযোজন ক্ষমতা প্রদান করে, এতে একটি বিনিময় রয়েছে: বর্তমানেও এটি প্রচলিত ডিফিউশন মডেলের তুলনায় ছবি তৈরি করতে ৬-৯ গুণ বেশি সময় লাগে। হাজি আলী পদ্ধতিটির অনুকূলিতকরণের লক্ষ্য রাখছেন যাতে এটি সমান পূর্বানুমানের সময়কালে পৌঁছায় এবং বিভিন্ন অনুপাতের উচ্চ মানের ছবি তৈরি করতে সক্ষম হয়।
Watch video about
ElasticDiffusion: রাইস বিশ্ববিদ্যালয়ে AI দ্বারা চিত্র উৎপাদন উন্নতি
Try our premium solution and start getting clients — at no cost to you