A generatív mesterséges intelligencia (AI), beleértve a Stable Diffusion, Midjourney és DALL-E modelleket, gyakran küzd a következetes képek létrehozásával, különösen az arc szimmetriájának és az ujjak megfelelő ábrázolásának részleteivel kapcsolatban. Ezek a modellek általában négyzet alakú képeket generálnak, ami problémákat okoz, amikor különböző képarányú képek létrehozására kérik őket, ami anomáliákhoz vezet, például extra ujjakhoz vagy torz alakokhoz. E problémák megoldása érdekében a Rice Egyetem számítástechnikusai kifejlesztették az ElasticDiffusion nevű módszert, amely előre betanított diffúziós modelleket alkalmaz. Moayed Haji Ali, a Rice egyetem doktorandusza, bemutatta ezt a módszert a 2024-es IEEE Konferencián a Számítógépes Látásról és Képizről Seattle-ben. Haji Ali elmagyarázta, hogy a hagyományos diffúziós modellek csak egy adott felbontású képeket képesek generálni, ami a túltanulás következménye, amikor egy AI modell jól teljesít az ismerős adatokkal, de nehézségei vannak a változatokkal. Az ElasticDiffusion javítja a megközelítést azáltal, hogy a képgenerálás során szétválasztja a helyi és globális információkat, ahelyett, hogy kombinálná őket.
Ez a szétválasztás segít elkerülni a vizuális hibákat, amelyek a nem négyzet alakú képekhez való alkalmazkodás során ismétlődő adatokból adódnak. Haji Ali megjegyezte, hogy a folyamat kezdetben egy globális pontszám megszerzésével kezdődik, amely magában foglalja a kép általános szerkezetét, majd a részleteket pixelenként adja hozzá szakaszokban. Ez a módszer lehetővé teszi, hogy különféle képarányok esetén is tisztább képek jöjjenek létre további modellbetanítás nélkül. Bár az ElasticDiffusion fokozott következetességet és alkalmazkodóképességet kínál a képgenerálásban, ez egy kompromisszummal jár: jelenleg 6-9-szer hosszabb időt igényel a képek létrehozása a hagyományos diffúziós modellekhez képest. Haji Ali célja a módszer optimalizálása, hogy az ugyanannyi idő alatt végezzen, miközben megőrzi a nagy felbontású képek generálásának képességét bármilyen képarányban.
ElasticDiffusion: Az AI képgenerálás fejlesztése a Rice Egyetemen
Az Orange megyei vállalkozások folyamatosan keresik az új módszereket a versenyelőny megszerzésére, és az Orange County Keresőoptimalizálási (SEO) szolgáltatások pontosan erre lettek tervezve.
Az AI által generált videók gyors növekedése a közösségi médiában globális trendmé vált, melyet az elmúlt években elért jelentős fejlődések az műalkotás-technológiában hajtanak előre.
Az OpenAI jelentős vállalásáról adott hírt, mely szerint létrehoznak egy 50 millió dolláros alapot a felelősségteljes mesterséges intelligencia fejlesztése érdekében, non-profit szervezetek és közösségi csoportok támogatására.
A Meta Platforms Inc.
San Francisco, Kalifornia—(Newsfile Corp.
Az Oracle bemutatta új mesterséges intelligencia (AI) képességek integrációját az Oracle Fusion Cloud Customer Experience (CX) csomagjában.
A filmipar átformáló változáson megy keresztül, mivel egyre több stúdió alkalmazza a mesterséges intelligencia (MI) videógenerálási technológiát a gyártási folyamataikban.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today