News
>
MIT a NVIDIA představily HART: revoluční metodu generování obrazů.

March 21, 2025, 8:28 a.m.

MIT a NVIDIA představily HART: revoluční metodu generování obrazů.

Brief news summary

Potřeba vysoce kvalitních obrazů je v zásadě důležitá pro vývoj realistických virtuálních prostředí, zejména pro školení a zajištění bezpečnosti v autonomních vozidlech. Tradiční generativní AI techniky, jako jsou difuzní modely, nabízejí vynikající vizuální kvalitu, ale jsou pomalé a náročné na zdroje. Naopak autoregresivní modely, jako je ChatGPT, poskytují rychlou generaci obrazů, ale často postrádají detaily. Abychom tyto problémy vyřešili, MIT a NVIDIA představily HART (Hybrid Autoregressive Transformer), špičkový nástroj pro generaci obrazů, který kombinuje výhody obou metod. HART používá autoregresivní model pro rychlou generaci obrazů, které jsou následně dolaďovány malým difuzním modelem pro zvýšení detailu. Tento hybridní přístup umožňuje HART vytvářet obrazy, které konkurují nejlepším difuzním modelům, přičemž dosahuje výsledků devětkrát rychleji s nižšími výpočetními nároky. HARTova schopnost generovat vysoce kvalitní obrazy z přirozeně jazykových vstupů na snadno dostupných zařízeních otvírá nové možnosti v oblastech, jako je robotika a design videoher. Budoucí vývoj může zahrnovat propojení HART s jednotnými modely vizuálního a jazykového zpracování, což představuje významný krok vpřed v oblasti AI vylepšené tvorby vizuálního obsahu.

Rychlá generace vysoce kvalitních obrazů je nezbytná pro vytváření realistických simulovaných prostředí, která pomáhají trénovat autonomní vozidla, aby bezpečně navigovala nepředvídatelnými překážkami. Současné techniky generativní AI, zejména difúzní modely, jsou však často příliš pomalé a výpočetně náročné. Naproti tomu autoregresivní modely, jako jsou ty, které pohánějí jazykové modely jako ChatGPT, fungují mnohem rychleji, ale zpravidla produkují nižší kvalitu obrazů plných chyb. Výzkumníci z MIT a NVIDIA představili HART (Hybrid Autoregressive Transformer), novou metodu generování obrazů, která kombinuje sílu obou přístupů. HART využívá autoregresivní model k rychlému načrtnutí hlavních rysů obrazu a poté používá menší difúzní model k vylepšení těchto detailů. Tento inovativní nástroj generuje obrazy, které rivalizují nebo překonávají kvalitu špičkových difúzních modelů, přičemž funguje přibližně devětkrát rychleji a s menšími nároky na výpočetní zdroje, což umožňuje provoz na běžných noteboocích a chytrých telefonech. Aplikace HART zahrnují pomoc výzkumníkům při trénování robotů pro složité úkoly a usnadnění návrhářům vytváření fascinujících scén pro videohry.

„Stejně jako zušlechťování hrubého malování podrobnými tahy štětce zlepšuje jeho kvalitu, HART kombinuje širokou generaci obrazů s pečlivou prací na detailech, “ říká Haotian Tang, jeden z hlavních autorů výzkumu. Difúzní modely, které vyžadují několik kroků k odstranění šumu z obrazů, mohou produkovat velmi detailní vizuály, ale jsou pomalé a náročné na zdroje. Naopak autoregresivní modely generují obrazy rychleji tím, že vytváří segmenty postupně, ale trpí ztrátou informací, což vede k nižší kvalitě. HART tyto omezení překonává tím, že nejprve předpovídá diskrétní tokeny obrazu pomocí autoregresivního modelu a poté používá difúzní model k doplnění chybějících detailů, což umožňuje rychlé a kvalitní obrazy s pouhými osmi kroky. Během vývoje čelili výzkumníci integračním výzvám, ale zlepšili kvalitu HART tím, že aplikovali difúzní model výhradně pro předpovídání zbytkových tokenů. jejich konečný design využívá autoregresivní model s 700 miliony parametrů spolu s difúzním modelem s 37 miliony parametry, přičemž dosahuje kvality obrazů srovnatelné s většími difúzními modely (až 2 miliardy parametrů) při spotřebě o 31 % méně výpočetní energie. Do budoucna tým plánuje také rozšířit architekturu HART k vývoji modelů pro vidění a jazyk a prozkoumat aplikace v generování videa a predikci zvuku, což by mohlo revolučně změnit interakce s generativními modely. Tento výzkum podporovaly různé organizace, včetně MIT-IBM Watson AI Lab a NVIDIA, která poskytla GPU zdroje pro trénink modelu.

News source

Watch video about

MIT a NVIDIA představily HART: revoluční metodu generování obrazů.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 způsobů, jak se prodej tento rok změnil v éře …

V posledních 18 měsíců se tým SaaStr ponořil do AI a prodeje, přičemž od června 2025 došlo k zásadní akceleraci.

Dec. 23, 2025, 1:23 p.m.

OpenAI GPT-5: Co zatím víme

OpenAI se připravuje na uvedení GPT-5, dalšího významného pokroku ve své řadě velkých jazykových modelů, s očekávaným vydáním na začátku roku 2026.

Dec. 23, 2025, 1:20 p.m.

AI v SEO: Proměna tvorby a optimalizace obsahu

Umělá inteligence (AI) rychle proměňuje oblast tvorby a optimalizace obsahu v rámci optimalizace pro vyhledávače (SEO).

Dec. 23, 2025, 1:20 p.m.

Řešení pro videokonference založená na umělé inte…

Přechod na práci na dálku zdůraznil klíčovou potřebu efektivních komunikačních nástrojů, což vedlo k vzestupu řešení videokonferencí poháněných umělou inteligencí, které umožňují bezproblémovou spolupráci na dálku.

Dec. 23, 2025, 1:17 p.m.

Velikost trhu AI v medicíně, podíl, růst | CAGR 2…

Přehled Celkový trh s umělou inteligencí v medicíně se odhaduje na přibližně 156,8 miliard USD do roku 2033, což je nárůst z 13,7 miliard USD v roce 2023, s pevnou CAGR 27,6 % od roku 2024 do roku 2033

Dec. 23, 2025, 9:30 a.m.

Danny Sullivan a John Mueller od Google o SEO pro…

John Mueller z Googlu hostil Dannyho Sullivana, také z Googlu, v podcastu Search Off the Record, aby diskutovali o "Názorech na SEO a SEO pro umělou inteligenci".

Dec. 23, 2025, 9:26 a.m.

Lexus testuje generativní umělou inteligenci v no…

Krátký přehled: Lexus zahájil vánoční marketingovou kampaň vytvořenou pomocí generativní umělé inteligence, uvedlo tiskové prohlášení

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today

MIT a NVIDIA představily HART: revoluční metodu generování obrazů.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Jak umělá inteligence revolučně mění prodej: Klíčové změny a jistoty pro rok 2026 | SaaStr Insights

Očekává se spuštění OpenAI GPT-5 na začátku roku 2026 s pokročilým porozuměním kontextu

Jak umělá inteligence mění tvorbu obsahu a SEO optimalizaci

The Best for your Business

Hot news

15 způsobů, jak se prodej tento rok změnil v éře …

OpenAI GPT-5: Co zatím víme

AI v SEO: Proměna tvorby a optimalizace obsahu

Řešení pro videokonference založená na umělé inte…

Velikost trhu AI v medicíně, podíl, růst | CAGR 2…

Danny Sullivan a John Mueller od Google o SEO pro…

Lexus testuje generativní umělou inteligenci v no…

AI Company

Sales

Marketing

MIT a NVIDIA představily HART: revoluční metodu generování obrazů.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Jak umělá inteligence revolučně mění prodej: Klíčové změny a jistoty pro rok 2026 | SaaStr Insights

Očekává se spuštění OpenAI GPT-5 na začátku roku 2026 s pokročilým porozuměním kontextu

Jak umělá inteligence mění tvorbu obsahu a SEO optimalizaci

The Best for your Business

Hot news

15 způsobů, jak se prodej tento rok změnil v éře …

OpenAI GPT-5: Co zatím víme

AI v SEO: Proměna tvorby a optimalizace obsahu

Řešení pro videokonference založená na umělé inte…

Velikost trhu AI v medicíně, podíl, růst | CAGR 2…

Danny Sullivan a John Mueller od Google o SEO pro…

Lexus testuje generativní umělou inteligenci v no…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?