OpenAI's o3 AI-model opnår menneskelige score på ARC-AGI

Et nyt kunstig intelligens (AI) model af OpenAI, kendt som o3, har for nylig opnået menneskelignende resultater på ARC-AGI-benchmarken, en test, der måler "generel intelligens". Den scorede 85%, hvilket markant overgår tidligere AI-bedrifter og er sammenlignelig med den gennemsnitlige menneskelige score. Skabelsen af kunstig generel intelligens (AGI) er et primært mål for store AI-forskningslaboratorier, og dette resultat antyder fremskridt mod det mål. ARC-AGI-testen vurderer en AI's "prøveeffektivitet"—dens evne til at tilpasse sig nye situationer med minimal data. Eksisterende AI, som GPT-4, kræver omfattende data for at udføre opgaver og kæmper med sjældnere scenarier på grund af begrænsede eksempler. For at AI skal kunne håndtere varierede, uforudsigelige opgaver, skal det generalisere fra få datapunkter—et centralt element af intelligens. OpenAI's o3 havde succes ved at mestre gittermønstre, løse gåder med begrænsede eksempler meget lig menneskelige IQ tests. Selvom detaljerne om o3's funktionalitet er uklare, er dens tilpasningsevne tydelig. Den identificerer de "svageste" regler, der dækker nye situationer med minimale antagelser, hvilket muliggør større tilpasningsevne.
Denne proces minder om Googles AlphaGo AI, der anvendte "tankekæder" til at løse opgaver. Hver kæde repræsenterer en potentiel løsning, der vurderes ved hjælp af en heuristik, eller en vejledende regel, for at vælge den mest passende. På trods af de lovende testresultater, er det usikkert, om o3 virkelig bringer AGI tættere på menneskelignende intelligens. Dens succes kan muligvis ikke indikere en iboende forbedring i forhold til tidligere modeller, men kunne være et resultat af specialiseret træning for ARC-AGI. OpenAI har ikke fuldt ud offentliggjort detaljer om o3, så dens sande potentiale forbliver spekulativt. Forståelse af o3 vil kræve grundig evaluering og kunne afsløre dens evne til at matche menneskelig tilpasningsevne. Hvis det er tilfældet, kan det revolutionere økonomier og teknologi og åbne for nye overvejelser om AGI-styring. Hvis ikke, selvom det stadig er imponerende, vil det efterlade hverdagen stort set uændret.
Brief news summary
OpenAI har lanceret AI-modellen o3, som opnår en score på 85% på ARC-AGI-benchmarken, et bemærkelsesværdigt skridt i AI-forskning til vurdering af generel intelligens og evnen til at lære fra minimalt data. Denne fremgang er essentiel for skabelsen af kunstig generel intelligens (AGI), selvom konceptet med sand AGI forbliver kontroversielt. ARC-AGI-benchmarken involverer gitterbaserede opgaver, der minder om IQ-tests, og udfordrer AI til at udlede regler med begrænsede eksempler. Mens de specifikke strategier for o3-modellen ikke er tilgængelige, kan de være lig de metoder, som Googles AlphaGo bruger, der anvender sofistikerede problemløsningsmetoder. OpenAI har endnu ikke frigivet detaljeret information om modellens indre funktioner. Der er en løbende diskussion om o3-systemets indflydelse på AGI-udvikling, da opnåelse af menneskelignende tilpasningsevne kunne transformere industrier gennem selvforbedring. OpenAI agter at give flere indsigter, efterhånden som evalueringerne skrider frem, med henblik på bedre at forklare modellens kapaciteter og fremtidige rolle i fremme af AI.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Hvordan centralbanker tester pengepolitik baseret…
Hvorfor undersøger centralbankerne blockchain-teknologi?

OnePlus lancerer AI-drevne funktioner med Plus-ta…
OnePlus, en førende smartphoneproducent, har annonceret et nyt strategisk fokus på integration af kunstig intelligens (AI) for at forbedre brugeroplevelsen på tværs af sine enheder.

En tysk milliardær var medstifter af Steroid-OL. …
© 2025 Fortune Media IP Limited.

Salesforce vil opkøbe Informatica for 8 milliarde…
Salesforce, en førende skybaseret CRM-sofwarevirksomhed, har annonceret en strategisk opkøb af Informatica for 8 milliarder dollars.

Adam Back-støttede The Blockchain Group sikrer 71…
Blockchain Group rejser 71,9 millioner dollar for at udvide Bitcoin-beholdningen Denne strategiske finansiering styrker bitcoin-treasure-assets og øger investorernes tillid

Fremgang i brugen af AI til snyd vækker bekymring…
De seneste måneder har der været en mærkbar stigning i brugen af generative kunstige intelligensværktøjer (AI) til snyderi på gymnasier og universiteter i hele USA, hvilket har skabt bekymring blandt undervisere og akademiske ledere.

Sleepagotchi Lite lanceres på Sonys Soneium-block…
Soneium, Ethereum Layer-2 blockchain udviklet i samarbejde mellem Sony Block Solutions Labs (SBSL) og Startale Group, har annonceret lanceringen af Sleepagotchi Lite på Line Mini-appen.