lang icon En
March 21, 2025, 8:28 a.m.
1883

MIT dan NVIDIA Perkenalkan HART: Kaedah Penjanaan Imej yang Revolusioner

Brief news summary

Keperluan untuk gambar berkualiti tinggi adalah penting dalam membangunkan persekitaran maya yang realistik, terutamanya untuk latihan dan memastikan keselamatan dalam kereta memandu sendiri. Teknik AI generatif tradisional, seperti model penyebaran, menawarkan kualiti visual yang sangat baik tetapi perlahan dan memerlukan banyak sumber. Sebaliknya, model autoregresif, seperti ChatGPT, menyediakan penjanaan gambar yang cepat tetapi sering kali kekurangan detail. Untuk menangani isu ini, MIT dan NVIDIA telah memperkenalkan HART (Hybrid Autoregressive Transformer), alat penjanaan gambar termaju yang menggabungkan kelebihan kedua-dua kaedah. HART menggunakan model autoregresif untuk penjanaan gambar yang pantas, yang kemudiannya diperhalusi oleh model penyebaran kecil untuk detail yang lebih baik. Pendekatan hibrid ini membolehkan HART menghasilkan gambar yang setanding dengan model penyebaran terbaik, mencapai hasil sembilan kali lebih pantas dengan keperluan pengiraan yang lebih rendah. Keupayaan HART untuk menghasilkan gambar berkualiti tinggi daripada input bahasa semula jadi pada peranti yang mudah diakses membuka kemungkinan baru dalam bidang seperti robotik dan reka bentuk permainan video. Pembangunan masa depan mungkin termasuk menghubungkan HART kepada model visi-bahasa yang bersatu, yang mewakili lompatan besar ke hadapan dalam penciptaan kandungan visual yang diperkasakan oleh AI.

Penghasilan imej berkualiti tinggi dengan cepat adalah penting untuk mencipta persekitaran simulasi yang realistik, yang membantu melatih kereta pemanduan sendiri untuk menavigasi bahaya yang tidak dapat diramalkan dengan selamat. Namun, teknik AI generatif semasa, terutamanya model difusi, sering kali terlalu lambat dan memerlukan banyak pengiraan. Walaupun model autoregresif, seperti yang menyokong LLM seperti ChatGPT, beroperasi dengan lebih cepat, mereka biasanya menghasilkan imej berkualiti lebih rendah yang dipenuhi dengan kesilapan. Penyelidik dari MIT dan NVIDIA telah memperkenalkan HART (Hybrid Autoregressive Transformer), kaedah penghasilan imej baru yang menggabungkan kekuatan kedua-dua pendekatan. HART menggunakan model autoregresif untuk menggambarkan ciri-ciri utama imej dengan cepat dan kemudian menggunakan model difusi yang lebih kecil untuk memperhalusi butiran ini. Alat inovatif ini menghasilkan imej yang setanding atau melebihi kualiti model difusi terkini tetapi beroperasi kira-kira sembilan kali lebih cepat dan dengan penggunaan sumber pengiraan yang lebih rendah, membolehkan operasi pada komputer riba dan telefon pintar biasa. Aplikasi untuk HART termasuk membantu penyelidik melatih robot untuk tugas-tugas kompleks dan membantu pereka mencipta adegan menarik untuk permainan video.

"Sama seperti memperhalusi lukisan kasar dengan sapuan berus terperinci meningkatkan kualitinya, HART menggabungkan penghasilan imej yang luas dengan kerja perincian yang teliti, " kata Haotian Tang, salah seorang pengarang utama penyelidikan ini. Model difusi, yang memerlukan beberapa langkah untuk menghilangkan bunyi imej, dapat menghasilkan visual yang sangat terperinci tetapi lambat dan memakan sumber. Sebaliknya, model autoregresif menghasilkan imej dengan lebih pantas dengan mencipta petak secara berurutan tetapi mengalami kehilangan maklumat yang membawa kepada kualiti yang lebih rendah. HART mengatasi had ini dengan terlebih dahulu meramalkan token imej diskret menggunakan model autoregresif, diikuti dengan menggunakan model difusi untuk menambah semula sebarang butiran yang hilang, membolehkan penghasilan imej yang pantas dan berkualiti tinggi dengan hanya lapan langkah. Semasa pembangunan, penyelidik menghadapi cabaran pengintegrasian tetapi meningkatkan kualiti HART dengan menggunakan model difusi hanya untuk meramalkan token baki. Reka bentuk akhir mereka menggunakan model autoregresif dengan 700 juta parameter di samping model difusi dengan 37 juta parameter, mencapai kualiti imej yang sejajar dengan model difusi yang lebih besar (hingga 2 bilion parameter) sambil menggunakan 31% kurang kuasa pengiraan. Melangkah ke hadapan, pasukan merancang untuk membangunkan model visi-bahasa berdasarkan seni bina HART dan meneroka aplikasi dalam penghasilan video dan ramalan audio, yang berpotensi untuk merevolusikan interaksi dengan model generatif. Penyelidikan ini disokong oleh pelbagai organisasi, termasuk MIT-IBM Watson AI Lab dan NVIDIA, yang menyediakan sumber GPU untuk melatih model tersebut.


Watch video about

MIT dan NVIDIA Perkenalkan HART: Kaedah Penjanaan Imej yang Revolusioner

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 28, 2025, 9:32 a.m.

Aspirasi AI yang berprasangka kini menjadi satu p…

Video palsu berisi unsur perkauman yang dijana oleh AI kini muncul sebagai fenomena yang membimbangkan dan berbahaya, yang merubah wacana politik serta mengukuhkan stereotaip yang merosakkan, terutamanya menyasarkan komuniti Melayu dan lain-lain kaum minoriti.

Dec. 28, 2025, 9:24 a.m.

AI dan SEO: Menavigasi Pertimbangan Etika dalam P…

Integration kecerdasan buatan (AI) ke dalam pengoptimuman enjin carian (SEO) sedang membentuk semula cara pemasar mendekati pemasaran digital, meningkatkan keberkesanan, ketepatan, dan maklumat yang diperoleh.

Dec. 28, 2025, 9:23 a.m.

Microsoft Tangguhkan Kekhuatiran Pertumbuhan Jual…

Microsoft menghadapi tekanan selepas satu laporan mendedahkan bahawa beberapa pasukan jualan gagal mencapai sasaran pertumbuhan untuk Azure Foundry, satu produk utama AI perusahaan.

Dec. 28, 2025, 9:23 a.m.

Kepimpinan Pemikiran Tahunan: Trend pemasaran AI …

Kebangkitan dan perkembangan kecerdasan buatan dalam pemasaran dan pengiklanan telah menjadi topik hangat dalam industri, mencetuskan pendapat yang berpolar di kalangan pemimpin.

Dec. 28, 2025, 9:14 a.m.

OpenAI Membeli Syarikat Perkakasan AI io dengan n…

OpenAI, peneraju dalam penyelidikan kecerdasan buatan, telah membuat pengambilalihan strategik utama untuk memperkukuhkan keupayaan perkakasan mereka dengan membeli io, sebuah syarikat permulaan perkakasan AI, dengan nilai $6.5 bilion.

Dec. 28, 2025, 5:34 a.m.

AI dan Kematian Proses Jualan 2021

Teknik jualan klasik—kerja keras, pengetahuan mendalam tentang produk, dan kehadiran—masih mempunyai nilai.

Dec. 28, 2025, 5:30 a.m.

Pakar Pemasaran NYC Augustus Kirby Amaran tentang…

NEW YORK, NY, 27 Disember 2025 /24-7PressRelease/ -- Ketika kecerdasan buatan mengubah pemasaran moden, perniagaan menghadapi paradoks yang semakin meningkat: walaupun automasi menawarkan kecekapan dan skala, perubahan algoritma yang cepat dan sistem AI yang tidak telus menyebabkan ketidakstabilan di seluruh saluran digital.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today