lang icon En
March 21, 2025, 8:28 a.m.
1852

MIT i NVIDIA predstavljaju HART: Revolucionarna metoda generisanja slika

Brief news summary

Potrebna je visoko kvalitetna slika u razvoju realističnih virtuelnih okruženja, posebno za obuku i obezbeđivanje sigurnosti u autonomnim vozilima. Tradicionalne generativne AI tehnike, poput difuzionih modela, nude odličan vizuelni kvalitet, ali su spore i zahtevne za resurse. S druge strane, autogenerativni modeli, kao što je ChatGPT, omogućavaju brzu generaciju slika, ali često nedostaju u detaljima. Da bi se rešili ovi problemi, MIT i NVIDIA su predstavili HART (Hibridni Autogenerativni Transformer), revolucionarni alat za generaciju slika koji kombinuje prednosti oba pristupa. HART koristi autogenerativni model za brzu generaciju slika, koji se potom usavršava malim difuzionim modelom za poboljšane detalje. Ovaj hibridni pristup omogućava HART-u da proizvodi slike koje se takmiče sa najboljim difuzionim modelima, postizući rezultate devet puta brže uz smanjene računske zahteve. HART-ova sposobnost generisanja visokokvalitetnih slika iz unosa prirodnog jezika na lako dostupnim uređajima otvara nove mogućnosti u oblastima poput robotike i dizajna video igara. Budući razvoj može uključivati povezivanje HART-a sa jedinstvenim modelima vizije i jezika, što predstavlja značajan napredak u AI-unapređenoj kreaciji vizuelnog sadržaja.

Brza generacija slika viskog kvaliteta je bitna za kreiranje realističnih simuliranih okruženja, koja pomažu u obuci autonomnih vozila da sigurno navigiraju nepredvidivim opasnostima. Međutim, trenutne generativne AI tehnike, posebno difuzni modeli, često su preslowi i zahtevaju velike računske resurse. Iako autogenerativni modeli, poput onih koji pokreću LLM-ove kao što je ChatGPT, rade mnogo brže, obično proizvode slike nižeg kvaliteta koje su ispunjene greškama. Istraživači sa MIT-a i NVIDIA-e su predstavili HART (Hibridni Autogenerativni Transformer), novu metodu generacije slika koja kombinuje prednosti oba pristupa. HART koristi autogenerativni model da brzo ocrta glavne karakteristike slike, a zatim koristi manji difuzni model da precizira te detalje. Ovaj inovativni alat generiše slike koje se takmiče ili čak nadmašuju kvalitet najsavremenijih difuznih modela, ali deluje otprilike devet puta brže i sa manjom potrošnjom računske snage, omogućavajući rad na običnim laptopovima i pametnim telefonima. Primene HART-a uključuju pomoć istraživačima u obuci robota za složene zadatke i pomoć dizajnerima u kreiranju privlačnih scena za video igre.

“Baš kao što precizno oslikavanje grube slike poboljšava njen kvalitet, HART kombinuje široku generaciju slika sa pažljivim radom na detaljima, ” kaže Haotian Tang, jedan od glavnih autora istraživanja. Difuzni modeli, koji zahtevaju više koraka da otklone šum sa slika, mogu proizvoditi veoma detaljne vizuale, ali su spori i zahtevaju mnogo resursa. Nasuprot tome, autogenerativni modeli generišu slike brže, kreirajući delove sekvencijalno, ali pate od gubitka informacija što vodi ka nižem kvalitetu. HART prevazilazi ova ograničenja predviđajući diskretne tokene slike sa autogenerativnim modelom, a zatim koristi difuzni model da vrati sve nedostajuće detalje, omogućavajući brzu i kvalitetnu generaciju slika sa samo osam koraka. Tokom razvoja, istraživači su se suočili sa izazovima integracije, ali su poboljšali kvalitet HART-a primenjujući difuzni model isključivo za predikciju preostalih tokena. Njihov konačni dizajn koristi autogenerativni model sa 700 miliona parametara zajedno sa difuznim modelom od 37 miliona parametara, postizajući kvalitet slike uporediv sa većim difuznim modelima (do 2 milijarde parametara) uz potrošnju 31% manje računske snage. Gledajući unapred, tim planira da izgradi na HART arhitekturi kako bi razvio modele vizija-i-jezika i istražio primene u generaciji video sadržaja i predikciji zvuka, potencijalno revolucionirajući interakcije sa generativnim modelima. Ovo istraživanje podržale su razne organizacije, uključujući MIT-IBM Watson AI Lab i NVIDIA, koje su obezbedile GPU resurse za obuku modela.


Watch video about

MIT i NVIDIA predstavljaju HART: Revolucionarna metoda generisanja slika

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Alatke za moderaciju video sadržaja pomoću veštač…

Platforme društvenih mreža sve više koriste veštačku inteligenciju (VI) za poboljšanje moderacije video sadržaja, suočavajući se sa porastom broja videa kao dominantnog oblika online komunikacije.

Dec. 21, 2025, 1:38 p.m.

SAD ponovo razmatra svoje ograničenja na izvoz či…

REVERSAL POLITIKE: Nakon godina pooštravanja restrikcija, odluka da se dozvoli prodaja Nvidia H200 čipova Kini izazvala je prigovore od strane nekih republikanaca.

Dec. 21, 2025, 1:38 p.m.

AI je bio razlog za više od 50.000 otkaza u 2025.…

Otpuštanja radnika izazvana veštačkom inteligencijom obeležila su tržište rada 2025.

Dec. 21, 2025, 1:36 p.m.

Perplexity SEO usluge pokrenute – NEWMEDIA.COM vo…

RankOS™ unapređuje vidljivost brenda i citiranje na Perplexity AI i drugim platformama za pretraživanje zasnovanim na odgovorima Usluge SEO agencije Perplexity Njujork, NY, 19

Dec. 21, 2025, 1:22 p.m.

Porodična firma Erika Schmidta ulaže u 22 startap…

Originalni tekst je objavljen u newsletter-u CNBC Inside Wealth, kojeg piše Robert Frank, a koji služi kao nedeljni resurs za investitore i potrošače sa visokim neto vrednostima.

Dec. 21, 2025, 1:21 p.m.

Budućnost marketinga - Kratki pregled: Zašto je "…

Naslovi su fokusirali pažnju na Disney-jev milijardni ulagački poduhvat u OpenAI i spekulacije o tome zašto je Disney izabrao OpenAI umesto Google-a, sa kojim tuži zbog navodnog kršenja autorskih prava.

Dec. 21, 2025, 9:34 a.m.

Podaci Salesforcea otkrivaju da veštačka intelige…

Salesforce je objavio detaljno izveštavanje o događaju kupovine tokom Cyber Week 2025, analizirajući podatke sa više od 1,5 milijardi globalnih potrošača.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today