lang icon English
Dec. 27, 2024, 10:02 p.m.
3288

OpenAIs O3-modell oppnår milepæl i AI-testing

Brief news summary

OpenAIs nyeste språkmodell, "o3," har gjort betydelige fremskritt innen AI-utvikling ved å oppnå en score på 76 % på "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI)-testen, og dermed overgå den menneskelige gjennomsnittet som ligger like over 75 %. Dette markerer en historisk prestasjon, da det er første gang en AI skårer på dette nivået, noe som representerer et bemerkelsesverdig fremskritt innen problemløsning og tilpasningsevne. François Chollet, skaperen av ARC-AGI-testen og Google AI-forsker, betegnet dette som et "ekte gjennombrudd," noe som gjenspeiler AIs økende evne til å utføre menneskelignende oppgaver. Likevel bemerket Chollet at dette ikke betyr at o3 har nådd Kunstig Generell Intelligens (AGI), fordi den fortsatt sliter med enklere oppgaver. Han foreslo at arkitektoniske innovasjoner, muligens lik Monte Carlo-tresøk, kan ha bidratt til o3s prestasjon. Selv om o3 er et stort skritt fremover, har den ennå ikke nådd nivået av universell menneskelig intelligens, og fremtidige ARC-AGI-iterasjoner kan innebære nye utfordringer for AI-modeller.

OpenAIs nyeste store språkmodell, kjent som "o3, " er ennå ikke bredt lansert, men foreløpige tester antyder dens evner. Modellen ble kort introdusert via en promofilm, med få detaljer om dens kapasitet. Merkverdig er at o3 ble testet med "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI), en referansetest laget for å måle en modells evne til å tilpasse seg nye situasjoner. I denne testen oppnådde o3 en nøyaktighet på 76%, som overgikk menneskelige resultater registrert av Mechanical Turk-arbeidere, og markerte det som noen anser som et gjennombrudd i AIs evne til å takle nye oppgaver. François Chollet, som utviklet ARC-AGI, fremhever at o3s score viser et betydelig sprang i AI-kapasitet, og antyder at o3 snart kunne konkurrere med menneskelig arbeid. Selv om Chollet tidligere har vært skeptisk til at AI når menneskelig intelligensnivå, anerkjenner han denne utviklingen som et skifte.

ARC-AGI-testen innebærer å løse visuelle oppgaver som ikke er avhengige av språk, og utfordrer modeller som o3 på nye måter. Til tross for dens suksesser, forblir o3s metoder uklare på grunn av dens lukket kildekode. Chollet spekulerer i at modellens arkitektur avviker betydelig fra dens forgjengere, ved å bruke en testtids-søk-tilnærming lik den som brukes av Googles AlphaZero. Likevel bemerker Chollet at OpenAI ikke har offentliggjort ressursforbruket for å oppnå ARC-AGI-resultater, noe som kunne påvirke den oppfattede effektiviteten. Spørsmål om o3s generelle tilpasningsevne gjenstår, siden den spesifikt ble trent for ARC-AGI-testen. Chollet understreker at mens o3 viser potensial, feiler den fortsatt på noen enkle oppgaver, noe som antyder at den ennå ikke er på AGI-nivå (kunstig generell intelligens). Han planlegger å gi ut en oppdatert versjon av ARC-AGI for ytterligere å utfordre modeller som o3, noe som indikerer at ekte AGI fortsatt er utenfor rekkevidde for nå.


Watch video about

OpenAIs O3-modell oppnår milepæl i AI-testing

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 12, 2025, 1:31 p.m.

Coca-Colas AI-julespotkaster utløser reaksjoner

Coca-Cola, som i lang tid har blitt feiret for sine ikoniske juleannonser, har møtt betydelig motstand med sin julekampanje for 2025 som tungt bruker generativ AI.

Nov. 12, 2025, 1:26 p.m.

SMM Pilot tilbyr AI-drevet vekstplattform for små…

SMM Pilot er en avansert vekstplattform drevet av kunstig intelligens som revolusjonerer hvordan små og mellomstore bedrifter (SMB) innen e-handel og affiliate-markedsføring forbedrer sin tilstedeværelse på sosiale medier og sine digitale markedsføringsstrategier.

Nov. 12, 2025, 1:23 p.m.

3 måter markedsføringsledere kan bruke kunstig in…

AI er i ferd med å gå fra å være et lovende konsept til å bli en integrert del av markedsføringsdriften.

Nov. 12, 2025, 1:18 p.m.

Kling AI: Kinas tekst-til-video-modell

Kling AI, utviklet av det kinesiske teknologiselskapet Kuaishou og lansert i juni 2024, er et betydelig gjennombrudd innen AI-drevet innholdsproduksjon, med spesialisering i å konvertere naturlige språktekster til videoer av høy kvalitet.

Nov. 12, 2025, 1:17 p.m.

AI-forbedret SEO-analyse: Gir dypere innsikt for …

Kunstig intelligens er grunnleggende i ferd med å reforme feltet innen SEO-analyse, og baner vei for en ny æra av data-drevne markedsføringsstrategier.

Nov. 12, 2025, 1:11 p.m.

CoreWeave's verdsettelse skyter i været i takt me…

CoreWeave, en ledende leverandør av AI-infrastruktur, har opplevd en betydelig verdsettelsesøkning ettersom selskapet utvider innen den raskt voksende AI-sektoren.

Nov. 12, 2025, 9:24 a.m.

Mennesker tilbake til markedsføring?

De siste årene har kunstig intelligens (KI) endret mange bransjer, spesielt reklame, ved å muliggjøre rask og storstilte innholdsskaping.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today