Nogle metoder håndterer kvalitetsproblemer med 3D-former i generative AI-modeller gennem genuddannelse eller finjustering, hvilket kan være dyrt og tidskrævende. Men MIT-forskere har udviklet en ny teknik, der matcher eller overgår disse metoder i kvalitet uden behov for yderligere træning eller kompleks efterbehandling. Ved at identificere problemets kilde har de forbedret den matematiske forståelse af Score Distillation og relaterede metoder, hvilket baner vejen for forbedret ydeevne. "Vores forskning leder os mod effektive, hurtige og høj-kvalitets løsninger, hvilket potentielt hjælper designere med at skabe realistiske 3D-former, " siger Artem Lukoianov, hovedforfatter og EECS-studerende på MIT. Hans medforfattere inkluderer Haitz Sáez de Ocáriz Borde fra Oxford University, Kristjan Greenewald fra MIT-IBM Watson AI Lab, Vitor Campagnolo Guizilini fra Toyota Research Institute, Timur Bagautdinov fra Meta, og seniorforfatterne Vincent Sitzmann og Justin Solomon fra MIT's CSAIL. Generative AI-modeller som DALL-E bruger diffusionsmodeller til at skabe 2D-billeder ud fra støj. På grund af begrænset 3D-træningsdata kæmper de med at generere 3D-former. En teknik fra 2022, Score Distillation Sampling (SDS), anvender foruddannede modeller til at konvertere 2D-billeder til 3D-former gennem støjmanipulation.
Dog ser disse former ofte slørede eller overstaturerede ud, et problem, der hidtil ikke er blevet løst. MIT-teamet identificerede en afgørende formel-mismatch i SDS, som introducerede støj og førte til dårlige 3D-former. I stedet for at løse formlen præcist brugte de approximationsteknikker til at inferere manglende termer, hvilket resulterede i skarpe, realistiske 3D-former. De forbedrede også billedopløsningen og justerede modelparametrene for yderligere at forbedre kvaliteten. Ved at bruge eksisterende foruddannede diffusionsmodeller opnåede de 3D-former af høj kvalitet uden dyr genuddannelse. Selvom denne metode arver skævheder og begrænsninger fra basis-modellen, kan forbedring af den underliggende model forbedre resultaterne. Fremtidigt arbejde kan udforske disse teknikker til at forbedre billedredigering. Denne forskning modtog finansiering fra blandt andet Toyota Research Institute, U. S. National Science Foundation og andre.
MIT's revolutionerende 3D-formgenereringsteknik i generativ AI
AI-svarmotorer ændrer ikke blot den måde, folk søger online på; de omdefinerer fundamentalt virksomheders synlighed i den digitale æra.
I en kort video reagerer en influencer lidenskabeligt på en nyhedsberetning fra Californien med tilsyneladende autentiske visuals, herunder en nyhedsanker, der opfordrer seerne til at handle, ofre og et CNN-logo.
AMD og OpenAI har afsløret et banebrydende partnerskab, der er sat til at omdanne AI-infrastrukturen markant.
Molly Peck, som dengang var CMO for Buick og GMC, havde for nylig overtaget stillingen som chief transformation officer med ansvaret for at gennemgå GMs indholdsstrategi og samarbejder med bureauer.
Som ved enhver udgivelse af et Taylor Swift-album blev alle elementer til *The Life of a Showgirl* omhyggeligt planlagt og gennemført siden sidste uge – fra teaservideoer til udgivelsesarrangementer og optrædener i talkshows.
Google har annonceret en større udvidelse af deres AI-drevne søgefunktion, 'AI-tilstand', som nu understøtter fem nye sprog: Hindi, Indonesisk, Japansk, Koreansk og Brasiliansk portugisisk.
Dette opslag, skrevet i samarbejde med Cyril Ovely fra Vxceed, adresserer en presserende udfordring for forbrugsvarerindustrien (CPG) i vækstøkonomier: effektivt at fastholde indtægter og øge kundeloyaliteten i større skala.
Automate Marketing, Sales, SMM & SEO
and get clients on autopilot — from social media and search engines. No ads needed
and get clients today