Inceptions revolusjonerende AI-modell: En blanding av diffusjon og språkteknologi

Inception, et nystartet selskap i Palo Alto, initiert av Stanford datavitenskapsprofessor Stefano Ermon, påstår å ha skapt en banebrytende AI-modell som bruker "diffusjon" teknologi. Denne innovative modellen omtales som en diffusjonsbasert stor språkmodell, eller "DLM" for kort. Per nå kan de generative AI-modellene som får mest oppmerksomhet kategoriseres i to hovedtyper: store språkmodeller (LLMs) og diffusjonsmodeller. LLM-er, som er designet på transformerarkitektur, spesialiserer seg på tekstgenerering. På den annen side fokuserer diffusjonsmodeller, teknologien bak AI-plattformer som Midjourney og OpenAIs Sora, hovedsakelig på å generere bilder, video og lyd. Ifølge Inception kombinerer modellen deres evnene til konvensjonelle LLM-er—som kodegenerering og spørsmål-svar—med betydelig forbedret hastighet og lavere datakostnader. Ermon delte med TechCrunch at han lenge har utforsket bruken av diffusjonsmodeller for tekstgenerering i forskningslaboratoriet sitt ved Stanford. Arbeidet hans oppsto fra observasjonen av at tradisjonelle LLM-er opererer med en tregere hastighet sammenlignet med diffusjonsteknologier. Med LLM-er forklarte Ermon, “kan du ikke generere det andre ordet før du har produsert det første, og det tredje ordet kan ikke genereres før de to første er fullført. ” Ermon bemerket at i motsetning til LLM-er som opererer sekvensielt, begynner diffusjonsmodeller med en grov tilnærming av utfallet (for eksempel et bilde) og raffinerer dataene grundig i ett trinn. Ermon teoretiserte at det å generere og modifisere store tekstblokker parallelt kunne være mulig ved hjelp av diffusjonsmodeller.
Etter flere års forskning oppnådde han og en av studentene hans et betydelig gjennombrudd, som de dokumenterte i en forskningsartikkel publisert i fjor. For å anerkjenne potensialet i denne fremgangen opprettet Ermon Inception i fjor sommer, og hentet inn tidligere studenter Aditya Grover, professor ved UCLA, og Volodymyr Kuleshov fra Cornell University for å lede satsingen sammen. Selv om Ermon valgte å ikke avsløre spesifikke detaljert om finansieringen av Inception, har TechCrunch fått vite at Mayfield Fund er blant investorene. Inception har allerede sikret kontrakter med ulike kunder, inkludert anonyme Fortune 100-selskaper, ved å imøtekomme deres presserende krav om lavere AI-latens og høyere hastighet, ifølge Ermon. “Modellene våre kan utnytte GPU-er betydelig mer effektivt, ” hevdet Ermon, og refererte til grafiske prosesseringsenheter som vanligvis brukes til å kjøre produksjonsmodeller. “Jeg tror dette er transformativt og vil endre hvordan språkmodeller utvikles. ” Selskapet tilbyr en API sammen med alternativer for distribusjon på stedet og kant-enheter, støtte for modelltilpasning, og en rekke klare DLM-er skreddersydd for ulike applikasjoner. Inception påstår at DLM-ene deres kan operere opptil 10 ganger raskere enn tradisjonelle LLM-er, samtidig som de har kostnader som også er 10 ganger lavere. En selskapsrepresentant informerte TechCrunch: “Vår 'lille' kode-modell er lik ytelsen til [OpenAIs] GPT-4o mini, men opererer mer enn 10 ganger raskere. Vår 'mini' modell overgår små open-source alternativer som [Metas] Llama 3. 1 8B, og oppnår mer enn 1 000 tokens per sekund. ”
Brief news summary
Inception, en oppstart lansert av Stanford-professor Stefano Ermon i Palo Alto, har avduket en innovativ diffusjonsbasert stor språkmodell (DLM). Denne modellen integrerer styrkene fra konvensjonelle store språkmodeller (LLMs) med de raske behandlingskapasitetene til diffusjonsmodeller, kjent for sin dyktighet i å generere multimediainnhold som bilder, videoer og lyd. Ermon forklarer at tradisjonelle LLM-er genererer tekst sekvensielt, noe som fører til tregere utdata, mens diffusjonsmodeller utnytter omfattende datadimensjoner for å legge til rette for parallell behandlingskapasitet. Dette akselererer tekstproduksjonen betydelig, et gjennombrudd oppnådd gjennom omfattende forskning av Ermon og hans student. Utviklingen har tiltrukket seg interesse fra Fortune 100-selskaper som er ivrige etter å forbedre AI-ytelsen ved å redusere ventetid og optimalisere bruken av GPU-er. Inception tilbyr en API og ulike distribusjonsløsninger, og hevder at deres DLM-er kan levere resultater opptil ti ganger raskere enn dagens LLM-er samtidig som driftskostnadene reduseres. Med et sterkt fokus på effektivitet søker Inception å etablere seg som en ledende aktør i det dynamiske AI-landskapet.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nytt Cardano-blokkjedeprodukt støtter UNHCR
Kryptovalutautvikler og deres partnere tror at produktstrukturen kan brukes til å finansiere andre sektorer knyttet til innvirkning.

OpenAI risikerer å bli underkjøpt av billigere ko…
Mary Meeker, en ledende teknologiinvestor og analytiker, har utstedt en kritisk advarsel om konkurransedynamikken innenfor den amerikanske kunstig intelligens-sektoren (AI).

Blockchain-økosystemet legger til rette for at 4 …
0xFútbol søker å forene det globale fotballfellesskapet ved å integrere blockchain-teknologi, slik at fans aktivt kan delta, påvirke og få eierskap innen sporten.

Bak scenen: Den store sammensmeltingen
Den pågående sammenslåingen mellom den amerikanske regjeringen og ledende teknologiselskaper signaliserer et transformativt skifte innen kunstig intelligens (AI) og romteknologi.

Hvorfor personvern i blockchain må starte med åpe…
Tradisjonelt ble tillit plassert i sentraliserte institusjoner som banker, betalingsnettverk og oppgjørssentre—lukkede systemer der brukere stolte på eksterne revisjoner, myndighetsreguleringer og lange historikker med etterlevelse for å føle seg trygge.

Kunstig intelligens i autonome kjøretøy: Navigere…
Kunstig intelligens (KI) står i sentrum for den raskt voksende autonome kjøretøyindustrien, og driver store endringer i hvordan kjøretøy fungerer og samhandler med omgivelsene.

Bergen fylke lanserer blockchain-pilot for å mode…
Bergen County har inngått et femårig partnerskap med blockchain-oppstarten Balcony for å digitalisere og sikre 370 000 eiendomsdokumenter, som representerer omtrent 240 milliarder dollar i eiendomsverdi.