lang icon English
Dec. 4, 2024, 8:13 a.m.
1934

M-I-T-i revolutsiooniline 3D-kujude loomise tehnika generatiivses tehisintellektis

Brief news summary

MIT teadlased, keda juhib magistrant Artem Lukoianov, on välja töötanud meetodi kvaliteetsete 3D-kujude genereerimiseks, kasutades generatiivseid tehisintellektimudeleid. See murranguline tehnika ületab skoori destilleerimise matemaatilised raskused, eemaldades vajaduse ümberõppe ja keerulise järelprotsessimise järele, parandades seeläbi oluliselt 3D-mudelite realismi. Koostöös Oxfordi Ülikooli, MIT-IBM Watsoni tehisintellekti labori, Toyota Uuringute Instituudi ja Metaga on meeskonna töö parandanud 3D-kujude täpsust ja kvaliteeti, pakkudes disaineritele märkimisväärset kasu. Erinevalt sellistest mudelitest nagu DALL-E, millel on andmete piirangute tõttu raskusi 3D genereerimisega, kasutab see uus lähenemisviis lähendustehnikaid kujude täpsustamiseks ning optimeerib renderdamise lahutusvõimet ja mudelite parameetreid. Kuigi see põhineb etteõpetatud difusioonimudelitel, millel on omased eelarvamused ja piirangud, pakub see uurimus lootust piltiöötlustehnoloogiate tulevikule. Erinevate organisatsioonide toetusel jätkatakse jõupingutusi nende põhimudelite täiustamiseks laiemateks rakendusteks.

Mõned meetodid lahendavad generatiivsete tehisintellekti mudelite 3D-kujundite kvaliteediprobleeme ümberõppe või täiendava häälestamise kaudu, mis võivad olla kulukad ja ajamahukad. Kuid MITi teadlased on arendanud uue tehnika, mis vastab nendel meetoditel olevale kvaliteedile või ületab seda, ilma lisakoolituste või keerulise järeltöötluseta. Probleemi allika täpsustamisega on nad parandanud skooridistillatsiooni ja nendega seotud meetodite matemaatilist mõistmist, luues parema jõudluse võimalusi. "Meie uurimistöö suunab meid tõhusate, kiirete ja kvaliteetsete lahenduste suunas, mis võivad aidata disaineritel luua realistlikke 3D-kujusid, " ütleb peamine autor Artem Lukoianov, MITi EECS magistrant. Kaasautorite hulka kuuluvad Haitz Sáez de Ocáriz Borde Oxfordi Ülikoolist, Kristjan Greenewald MIT-IBM Watson AI Labist, Vitor Campagnolo Guizilini Toyota Teadusinstituudist, Timur Bagautdinov Metast ning vanemad autorid Vincent Sitzmann ja Justin Solomon MITi CSAIList. Generatiivsed tehisintellekti mudelid nagu DALL-E kasutavad difusioonimudeleid, et luua 2D-pilte mürast. Piiratud 3D-koolitusandmete tõttu on neil raskusi 3D-kujundite loomisega. 2022.

aastal välja töötatud tehnika, skooridistillatsiooni proovivõtt (SDS), kasutab eelnevalt koolitatud mudeleid, et muuta 2D-pildid 3D-kujudeks müra manipuleerimise kaudu. Siiski on need kujundid sageli udused või liiga intensiivsed, probleemi, mida pole seni lahendatud. MITi meeskond tuvastas SDSis olulise valemi ebakõla, mis tekitas müra ja kaasa tõi kehvad 3D-kujud. Selle asemel, et lahendada valem täpselt, kasutasid nad lähendustehnikaid puuduvate termide tuletamiseks, mille tulemuseks olid teravad ja realistlikud 3D-kujud. Nad parandasid ka pildiresolutsiooni ja kohandasid mudeli parameetreid, et kvaliteeti veelgi tõsta. Kasutades olemasolevaid eelnevalt koolitatud difusioonimudeleid, saavutasid nad kõrgekvaliteedilisi 3D-kujusid ilma kalli ümberõppeta. Kuigi see meetod pärib eelarvamused ja piirangud baasilt mudelilt, võiks aluseks oleva mudeli parandamine tulemusi täiustada. Tulevane töö võib uurida neid tehnikaid pilditöötluse täiustamiseks. See uurimus sai rahastust sellistelt üksustelt nagu Toyota Teadusinstituut, USA Riiklik Teadusfond ja teised.


Watch video about

M-I-T-i revolutsiooniline 3D-kujude loomise tehnika generatiivses tehisintellektis

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 11, 2025, 1:23 p.m.

Public Citizen nõuab, et OpenAI kaotab Sora tehis…

Public Citizen, tuntud kodanikuühing, mis pühendub avaliku huvi kaitsmisele, on kutsunud OpenAI-d viivitamatult tagasi tõmbama oma tehisintellekti toega videoäpi Sora 2, viidates märkimisväärsetele riskidele, mida tekitab deepfake-tehnoloogia.

Nov. 11, 2025, 1:18 p.m.

Kolle SEO-st GEO-deni: Kuidas LLM-id Muudavad Brä…

Selle Marketing AI SparkCast'i episoodi külaliseks on Aby Varma, Spark Novus'i asutaja, strateegiline partner, kes aitab turundusjuhtidel vastutustundlikult AI-d kasutusele võtta.

Nov. 11, 2025, 1:13 p.m.

Nüüd kasutab 100% tulu meeskondadest GenAI; 51% ü…

Allego 2025.

Nov. 11, 2025, 1:13 p.m.

IPG ületab kolmanda kvartali ootused tehisintelle…

Interpublic Group (IPG), juhtiv globaalne turundus- ja reklaamifirma, teatas kolmanda kvartali tulemustest, mis ületasid ootusi, peamiselt tugeva reklaamitarbimise tõttu meedia ja tervishoiu sektorites.

Nov. 11, 2025, 1:13 p.m.

Dappier käivitab tehisintellekti andmeturu ja int…

Dappier, innovatiivne Ameerika tarkvarafirma, mille peakontor asub Austinis, Teksases, teeb märkimisväärseid edusamme tehisintellekti vallas, pakkudes arenenud tarkvaralahendusi tarbijaliideste loomseks.

Nov. 11, 2025, 9:49 a.m.

Oracle’i tehisintellektiga jõuavad pilveteenused …

Oracleti tehisintellekti toel põhinevad pilveteenused saavad kiiresti populaarsust, kuna ettevõtted püüavad kasutada täiustatud tehisintellekti tehnoloogiaid, et parandada andmeanalüüsi ja otsuste tegemist.

Nov. 11, 2025, 9:20 a.m.

TSMC teatab aeglasema kasvuga 18 kuu jooksul tehi…

Taiwani Tehnoloogia Kaubandus- ja Tootmisselts (TSMC) teatas oma aeglaseimast kuu- aastast ajast müügi kasvust, mis süvendab muresid, et tehisintellekti (AI) aktsiate tõus ei pruugi olla täielikult ettevõtlusfaktorite toel.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today