lang icon English
Dec. 4, 2024, 8:13 a.m.
1644

MIT's revolutionerende 3D-formgenereringsteknik i generativ AI

Nogle metoder håndterer kvalitetsproblemer med 3D-former i generative AI-modeller gennem genuddannelse eller finjustering, hvilket kan være dyrt og tidskrævende. Men MIT-forskere har udviklet en ny teknik, der matcher eller overgår disse metoder i kvalitet uden behov for yderligere træning eller kompleks efterbehandling. Ved at identificere problemets kilde har de forbedret den matematiske forståelse af Score Distillation og relaterede metoder, hvilket baner vejen for forbedret ydeevne. "Vores forskning leder os mod effektive, hurtige og høj-kvalitets løsninger, hvilket potentielt hjælper designere med at skabe realistiske 3D-former, " siger Artem Lukoianov, hovedforfatter og EECS-studerende på MIT. Hans medforfattere inkluderer Haitz Sáez de Ocáriz Borde fra Oxford University, Kristjan Greenewald fra MIT-IBM Watson AI Lab, Vitor Campagnolo Guizilini fra Toyota Research Institute, Timur Bagautdinov fra Meta, og seniorforfatterne Vincent Sitzmann og Justin Solomon fra MIT's CSAIL. Generative AI-modeller som DALL-E bruger diffusionsmodeller til at skabe 2D-billeder ud fra støj. På grund af begrænset 3D-træningsdata kæmper de med at generere 3D-former. En teknik fra 2022, Score Distillation Sampling (SDS), anvender foruddannede modeller til at konvertere 2D-billeder til 3D-former gennem støjmanipulation.

Dog ser disse former ofte slørede eller overstaturerede ud, et problem, der hidtil ikke er blevet løst. MIT-teamet identificerede en afgørende formel-mismatch i SDS, som introducerede støj og førte til dårlige 3D-former. I stedet for at løse formlen præcist brugte de approximationsteknikker til at inferere manglende termer, hvilket resulterede i skarpe, realistiske 3D-former. De forbedrede også billedopløsningen og justerede modelparametrene for yderligere at forbedre kvaliteten. Ved at bruge eksisterende foruddannede diffusionsmodeller opnåede de 3D-former af høj kvalitet uden dyr genuddannelse. Selvom denne metode arver skævheder og begrænsninger fra basis-modellen, kan forbedring af den underliggende model forbedre resultaterne. Fremtidigt arbejde kan udforske disse teknikker til at forbedre billedredigering. Denne forskning modtog finansiering fra blandt andet Toyota Research Institute, U. S. National Science Foundation og andre.



Brief news summary

MIT-forskere, under ledelse af studerende Artem Lukoianov, har udviklet en metode til at generere 3D-figurer af høj kvalitet ved hjælp af generative AI-modeller. Denne banebrydende teknik overvinder de matematiske udfordringer ved Score Distillation, hvilket eliminerer behovet for retræning og komplekse efterbehandlinger, og forbedrer dermed realismen af 3D-modeller betydeligt. I samarbejde med Oxford University, MIT-IBM Watson AI Lab, Toyota Research Institute og Meta har teamets arbejde forbedret nøjagtigheden og kvaliteten af 3D-figurer, til stor fordel for designere. I modsætning til modeller som DALL-E, der har udfordringer med 3D-generering på grund af databegrænsninger, anvender denne nye tilgang approksimationsteknikker til at forfine former og optimerer gengivelsesopløsninger samt modelparametre. Selvom den er baseret på foruddannede diffusionsmodeller, som har iboende fordomme og begrænsninger, er forskningen lovende for fremtiden inden for billedredigeringsteknologier. Støttet af forskellige organisationer fortsætter indsatsen med at forbedre disse grundlæggende modeller til bredere anvendelser.

Watch video about

MIT's revolutionerende 3D-formgenereringsteknik i generativ AI

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Oct. 11, 2025, 2:15 p.m.

AI ødelægger SEO. Rangering kræver nu Answer Engi…

AI-svarmotorer ændrer ikke blot den måde, folk søger online på; de omdefinerer fundamentalt virksomheders synlighed i den digitale æra.

Oct. 11, 2025, 2:14 p.m.

De hyperrealistiske videoer, du ser, kan være fal…

I en kort video reagerer en influencer lidenskabeligt på en nyhedsberetning fra Californien med tilsyneladende autentiske visuals, herunder en nyhedsanker, der opfordrer seerne til at handle, ofre og et CNN-logo.

Oct. 11, 2025, 2:13 p.m.

Fremmer hele AI-økosystemet – AMD og OpenAI annon…

AMD og OpenAI har afsløret et banebrydende partnerskab, der er sat til at omdanne AI-infrastrukturen markant.

Oct. 11, 2025, 2:09 p.m.

GM åbner motorhjelmen på sin AI-markedsføringstra…

Molly Peck, som dengang var CMO for Buick og GMC, havde for nylig overtaget stillingen som chief transformation officer med ansvaret for at gennemgå GMs indholdsstrategi og samarbejder med bureauer.

Oct. 11, 2025, 10:26 a.m.

Hvad foregår der med de angivelige Taylor Swift A…

Som ved enhver udgivelse af et Taylor Swift-album blev alle elementer til *The Life of a Showgirl* omhyggeligt planlagt og gennemført siden sidste uge – fra teaservideoer til udgivelsesarrangementer og optrædener i talkshows.

Oct. 11, 2025, 10:21 a.m.

Google's AI-tilstandssøgning udvider sig til nye …

Google har annonceret en større udvidelse af deres AI-drevne søgefunktion, 'AI-tilstand', som nu understøtter fem nye sprog: Hindi, Indonesisk, Japansk, Koreansk og Brasiliansk portugisisk.

Oct. 11, 2025, 10:14 a.m.

Vxceed opbygger den perfekte salgspræsentation ti…

Dette opslag, skrevet i samarbejde med Cyril Ovely fra Vxceed, adresserer en presserende udfordring for forbrugsvarerindustrien (CPG) i vækstøkonomier: effektivt at fastholde indtægter og øge kundeloyaliteten i større skala.

All news

AI team for your Business

Automate Marketing, Sales, SMM & SEO

and get clients on autopilot — from social media and search engines. No ads needed

and get clients today