„Flux“ DI vaizdų generatorius pranoksta „Midjourney“ struktūroje ir fonuose

„Flux“ DI vaizdų generatorius, kurį išleido „Black Forest Labs“, greitai išpopuliarėjo ir dabar yra vienas iš galingiausių įrankių savo kategorijoje. Skirtingai nei jo konkurentas „Midjourney“, kuris yra uždara ir mokama paslauga, „Flux“ yra atviro kodo modelis, kurį galima atsisiųsti ir naudoti skirtingose platformose. Siekiant palyginti „Flux“ ir „Midjourney“ tikroviškumą ir tikslumą, autorius sukūrė penkis aprašomuosius pranešimus ir paleido juos abiejuose generatoriuose. Pirmasis pranešimas buvo skirtas sukurti vaizdą virėjaus profesionalioje virtuvėje. „Midjourney“ laimėjo šį turą dėl savo tikroviškos odos tekstūros ir pagrindinio veikėjo atvaizdo. Tačiau autorius pastebėjo, kad jam labiau patiko „Flux“ vaizdo dinamika. Antrasis pranešimas reikalavo, kad generatoriai sukurtų gatvės muzikanto, atliekančio pasirodymą užimtame mieste, vaizdą. „Midjourney“ vėl laimėjo dėl savo tikroviškumo ir tekstūros kokybės.
Vaizdas taip pat išsiskyrė savo struktūra, išdėstymu ir fonu. Trečiasis pranešimas buvo skirtas sukurti senyvos moters, besirūpinančios augalais sodo ant stogo, vaizdą. „Midjourney“ laimėjo dėl savo pranašesnės tekstūros kokybės, nors abu generatoriai susidūrė su tam tikrais pranešimo aspektais. Ketvirtasis pranešimas iššūkį metė generatoriams, kad jie vaizduotų paramediką, skubantį į greitosios pagalbos automobilį lietingoje dienoje. Nei vienas generatorius nelaimėjo šio turo, nes abu susidūrė su sunkumais fiksuojant tamsesnę aplinką. Tačiau „Midjourney“ šiek tiek pranoko „Flux“ pagal atitikimą scenos aprašymui. Paskutinis pranešimas reikalavo parodyti išėjusį į pensiją astronautą, duodantį pristatymą apie kosmosą. „Flux“ iškilo kaip nugalėtojas dėl savo odos tekstūros, žmogaus tikroviškumo ir geresnės bendros vaizdo struktūros, įskaitant tikrovišką foną. Apibendrinant galima teigti, kad „Midjourney“ turėjo pranašumą odos tekstūros atkūrime, tačiau „Flux“ dažnai pranoko pagal vaizdo struktūrą ir fonus. Šis palyginimas parodė, kad net ir DI vaizdų generavimo priekyje yra ypatybių, kurios gali išduoti vaizdus kaip DI sugeneruotus.
Brief news summary
„Flux“, „Black Forest Labs“ sukurtas DI vaizdų generatorius, yra stiprus varžovas rinkos lyderiui „Midjourney“. Skirtingai nei „Midjourney“, „Flux“ yra atviro kodo modelis, kurį galima naudoti įvairiose platformose. Siekiant palyginti jų galimybes, buvo atlikta serija bandymų naudojant penkis aprašomuosius pranešimus. „Midjourney“ buvo pamėgtas už tikrovišką virėjaus vaizdą, o „Flux“ vaizdas buvo giriamas už dinamiškumą. „Midjourney“ taip pat puikiai pasirodė su gatvės muzikanto užduotimi, parodydamas pranašumą tekstūros ir vaizdo struktūros klausimais. Tačiau „Flux“ laimėjo pranešimą su vyresniu asmeniu, parodydamas geresnę odos tekstūrą ir fono tikroviškumą. Nei vienas modelis tiksliai nesužadino tamsesnės aplinkos paramediko pranešime. Apibendrinant, „Midjourney“ turėjo pranašumą odos tekstūros atkūrime, tačiau „Flux“ parodė stiprybę vaizdo struktūros ir fono atvaizdavime. Bandymuose taip pat buvo pabrėžti skirtumai tarp DI sugeneruotų ir tikrų vaizdų.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

„„Apple“ sveikina į metinį renginį apimtas netiks…
2025 m.

Ripple ir JETRO remiama Web3 salono iniciatyva st…
Ripple paskelbė apie strateginį bendradarbiavimą su Web3 Salon, blockchain iniciatyva, remiama Japonijos Užsienio prekybos organizacijos (JETRO), siekiant stiprinti Japonijos Web3 ekosistemą.

Atsargiai su šiomis lygiais, jei Bitcoin kaina vė…
Bitcoin kaina per birželio mėnesį neparodė tokio pat smarkumo kaip pradžioje praėjusią mėnesį.

Įmonės įstringa AI pilotų prakeiksmui, sako Chatt…
Interviu Prieš ai įsitvirtinant plačiau įmonėse, verslo vadovai privalo įsipareigoti nuolatiniam saugumo testavimo režimui, pritaikytam prie AI modelių specifinių niuansų

Meta svarsto apie 10 milijardų dolerių investicij…
Meta Platforms, anotacija teigiama, nagrinėja investuoti daugiau nei 10 milijardų dolerių į dirbtinio intelekto startuolį Scale AI, praneša Bloomberg News.

Deutsche Bank tirinėja stabiliojo pobūdžio moneta…
Deutsche Bank aktyviai tiria stabilcoino ir tokenizuotų indėlių galimybes kaip dalį savo augančios skaitmeninių išteklių strategijos, atspindėdama vis didėjantį susidomėjimą blokų grandinės pagrindu veikiančia finansine infrastruktūra tarp pasaulinių bankų institucijų.

„Apple” pastangos atnaujinti „Siri“ sukelia inves…
„„„Apple susiduria su dideliais iššūkiais atnaujindama savo balso asistentą Siri pažangiausiomis dirbtinio intelekto (DI) galimybėmis, keliančiomis investuotojų susirūpinimą dėl bendros DI strategijos ir konkurencingumo sparčiai besikeičiančioje technologijų srityje.