lang icon English
Dec. 20, 2024, 11:02 p.m.
2501

OpenAIs o3-modell: Fremgang mot AGI med suksess i ARC-utfordringen

Brief news summary

OpenAIs o3-modell har fått betydelig oppmerksomhet for å utmerke seg i ARC Challenge, som vurderer AI-resonneringsevner. Den oppnådde en score på 75,7 % på den "semiprivate" testen, men eksperter oppfordrer til forsiktighet, og påpeker at dette ikke tilsvarer et gjennombrudd mot generell kunstig intelligens (AGI). Modellen møtte utfordringer på den "private" testen på grunn av begrensede beregningsressurser, men oppnådde en uoffisiell score på 87,5 % når den fikk forbedret beregningskraft. AI-eksperter som Melanie Mitchell og François Chollet understreker at disse resultatene ikke representerer AGI. Utfordringens fokus på resonnering fremfor rå beregningskraft fremhever forskjellen. Chollet nevner at ekte AGI bør mestre oppgaver som er enkle for mennesker, men utfordrende for maskiner. Selv om o3-modellens prestasjon indikerer fremgang i AI, er det nødvendig med videre forskning for å forstå dens fulle potensial. ARC Challenge-organisatorene har som mål å introdusere mer krevende vurderinger innen 2025 for å fortsette å utforske AI-fremgang. ARC-prisen forblir åpen til en modell vinner hovedprisen og offentlig deler sin løsning.

OpenAIs o3 kunstige intelligensmodell har oppnådd en betydelig poengsum på ARC Challenge, en test for AI-resonneringsferdigheter, noe som har fått noen entusiaster til å lure på om den har nådd kunstig generell intelligens (AGI). Imidlertid presiserer arrangørene av ARC Challenge at selv om o3 nådde en milepæl, har den ikke vunnet konkurransens hovedpremie og har ennå ikke oppnådd AGI, som innebærer menneskelignende intelligens. O3-modellen, en etterfølger av store språkmodeller som ChatGPT, presterte i oppgaver designet for å teste generell intelligens gjennom mønstergjenkjenning i fargede rutenett. ARC Challenge krever begrensninger på datakraft for å forhindre at gåtene løses ved brute force. OpenAIs modell scoret 75, 7% offisielt, i samsvar med konkurransens kostnadsgrense, men oppfylte ikke de strengere private testkriteriene, som avgjør vinnerne av hovedpremien. Uoffisielt oppnådde o3 en poengsum på 87, 5% ved å bruke mye mer datakraft, med kostnader opp til tusenvis per oppgave—mye høyere enn konkurransen tillater. Til tross for å ha overgått den typiske menneskelige poengsum på 84%, har AGI ikke blitt oppnådd, ifølge utfordringens arrangører og AI-eksperter. Modellen hadde også vanskeligheter med å løse over 100 oppgaver selv med betydelig datakraft. AI-forskere, som François Chollet fra Google, påpeker at løsninger av oppgaver gjennom ren beregning undergraver intensjonen om å indikere AGI.

Chollet og andre eksperter peker på at ekte AGI ville eliminere utfordringen med å lage oppgaver som er enkle for mennesker, men vanskelige for AI. Akkurat nå indikerer o3s prestasjon fremgang, men ikke AGI. Teknologibransjen fortsetter å kjempe med den nylige avmatningen i AI-fremskritt sammenlignet med tidligere eksplosive utviklinger. Muligheten for at AI-modeller snart kan slå konkurransens kriterier gjenstår, med noen som allerede scorer over 81% i evalueringer. Fremtidige skritt inkluderer et annet, vanskeligere testsett som forventes i 2025. Det endelige målet er at noen oppnår og frigir en åpen kildekode-løsning som vinner hovedprisen.


Watch video about

OpenAIs o3-modell: Fremgang mot AGI med suksess i ARC-utfordringen

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 11, 2025, 1:23 p.m.

Public Citizen krever at OpenAI trekker tilbake A…

Public Citizen, en en fremtredende observatørorganisasjon dedikert til å beskytte offentlige interesser, har oppfordret OpenAI til å umiddelbart trekke tilbake sin AI-drevne videobutikkapp, Sora 2, på grunn av betydelige risikoer forbundet med deepfake-teknologi.

Nov. 11, 2025, 1:18 p.m.

Fra SEO til GEO: Hvordan LLM-er endrer merkevareo…

Denne episoden av Marketing AI SparkCast features Aby Varma, grunnlegger av Spark Novus, en strategisk partner som hjelper markedsføringsledere med å ta i bruk AI på en ansvarlig måte.

Nov. 11, 2025, 1:13 p.m.

100 % av inntektsteamene bruker nå GenAI; 51 % si…

Allegos AI i inntektsmuligheter-rapport for 2025 avdekker en banebrytende innsikt i bruken av kunstig intelligens på tvers av inntektsteam globalt.

Nov. 11, 2025, 1:13 p.m.

IPG overstiger Q3-estimatene med AI-integrasjon

Interpublic Group (IPG), et ledende globalt markedsførings- og reklamebyrå, rapporterte resultater for tredje kvartal som overgikk forventningene, hovedsakelig drevet av sterk reklameutgifter innen media og helsesektoren.

Nov. 11, 2025, 1:13 p.m.

Dappier lanserer AI-datasmarked og interaktive an…

Dappier, et innovativt amerikansk programvareselskap med hovedkontor i Austin, Texas, gjør bemerkelsesverdige fremskritt innen kunstig intelligens ved å tilby avanserte programvareløsninger designet for å utvikle AI-grensesnitt som er rettet mot forbrukere.

Nov. 11, 2025, 9:49 a.m.

Oracles AI-drevne skytjenester får fotfeste

Oracles skybaserte tjenester drevet av kunstig intelligens (AI) vinner raskt popularitet ettersom bedrifter søker å utnytte avansert AI-teknologi for å forbedre dataanalyse og beslutningstaking.

Nov. 11, 2025, 9:20 a.m.

TSMC registrerer sin svakeste vekst på 18 måneder…

Taiwan Semiconductor Manufacturing Co.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today