lang icon English
Dec. 24, 2024, 5:49 p.m.
4650

Пробив на OpenAI моделот o3 на ARC-AGI бенчмаркот: Чекор кон напредна вештачка интелигенција

Brief news summary

Моделот o3 на OpenAI претставува значаен напредок во областа на вештачката интелигенција, постигнувајќи резултат од 75,7% на ARC-AGI тестот, додека неговата варијанта со висока пресметувалност досега достигнува импресивни 87,5%. ARC-AGI ја оценува способноста на вештачката интелигенција за справување со нови и сложени визуелни задачи, истакнувајќи ја адаптивната интелигенција. И покрај овој напредок, o3 сè уште не се квалификува како вистинска вештачка генерализирана интелигенција (AGI), бидејќи сеуште има проблеми со едноставни задачи и бара човечко водство за расудување. Претходно, највисокиот резултат на ARC-AGI беше 53%, постигнат со мешавина од модели и генетски алгоритми. Франсоа Шоле, авторот на ARC, го смета o3 за значаен скок во адаптивната вештачка интелигенција, надминувајќи само постепени напредоци. Иако o3 бара значителна пресметувална моќ, предвидувањата се дека овие барања ќе се намалат со текот на времето. Успехот на моделот можеби е поврзан со "синтеза на програми," која вклучува креирање мали програми за решавање задачи. Постојат тековни дискусии за вклучување на засилено учење и стратегии за пребарување во моделот, иако деталите за архитектурата остануваат необјавени. И покрај извонредните достигнувања на o3 во ARC-AGI, тие не се еднакви на AGI. Експертите, меѓу кои и Шоле, нагласуваат дека извонредноста во ARC-AGI не е синоним за постигнување AGI. Се развиваат нови предизвици за подобро оценување на AI моделите, особено нивната адаптивност надвор од почетните сценарија за обука. Овие напори сугерираат промена во обуката и оценувањето на AI, индицирајќи напредок кон AGI, иако конечната цел сè уште не е достигната.

Моделот o3 на OpenAI постигна изненадувачки напредок во областа на вештачката интелигенција со 75. 7% резултат на ARC-AGI бенчмаркот, а подобрената верзија достигна 87. 5%. Иако импресивно, ова не значи дека е постигната вештачка општа интелигенција (АГИ). ARC-AGI бенчмаркот, вкоренет во Корпусот за Апстрактно Заклучување, ги тестира способностите на вештачката интелигенција во сложени, нови задачи со визуелни загатки. Тој е тежок поради својата дизајн, кој избегнува решенија со едноставно учење од податоци. Бенчмаркот вклучува јавен тренинг сет од 400 примери и поизазовни евалуациски сетови. Приватните и полу-приватните тест сетови дополнително осигуруваат непристрасна евалуација без претходно знаење на ИИ. Претходно, o1 моделот на OpenAI постигна само 32% на ARC-AGI, а методот на истражувачот Џереми Берман 53%. Франоа Шоле, креаторот на ARC, го опишува постигнувањето на o3 како голем скок во вештачката интелигенција, покажувајќи адаптивност претходно невидена во GPT моделите. И покрај значителното внимание околу o3, тој не е значајно поголем од претходните модели, што го одбележува како вистинско квалитативно подобрување, а не само постепен напредок.

Сепак, тоа има високи трошоци: 17 до 20 долари и 33 милиони токени по загатка за ниски компјутски ресурси, кое се зголемува значително за високи ресурси. Шоле истакнува “синтеза на програми” за решавање на нови проблеми, со учество на мали, комбинирани програми. Иако постојат малку детали за механиката на o3, се претпоставува дека се користи резонирање со низите на помисли, механизми за пребарување и зајакнато учење за подобрување на решенијата, иако меѓу експерите има мешани мислења околу ова. И покрај името, ARC-AGI не е тест за АГИ. Шоле изјавува дека иако o3 има напредни способности, тој не е АГИ затоа што сè уште не успева во едноставни задачи и не може автономно да учи без надворешен влез. Независна верификација го доведе во прашање резултатите на OpenAI, сугерирајќи дека o3 бил дополнително обучен на ARC тренинг податоците. Истражувачите предложуваат тестирање на овие системи во нови средини надвор од ARC за да ги потврдат нивните способности за апстракција и заклучување. Тимот на Шоле развива нов бенчмарк предизвикувачки за o3, при што луѓето би можеле лесно да ги решат повеќето загатки, укажувајќи на јазот помеѓу сегашната вештачка интелигенција и вистинската АГИ.


Watch video about

Пробив на OpenAI моделот o3 на ARC-AGI бенчмаркот: Чекор кон напредна вештачка интелигенција

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 15, 2025, 1:22 p.m.

Маркетинг револуцијата на генеративната вештачка …

Во брзо менувачкиот свет на дигиталниот маркетинг, генеративната вештачка интелигенција прерасна од novитет во потреба.

Nov. 15, 2025, 1:18 p.m.

Антропик и Микрософт ја најавуваат новите проекти…

На 12 ноември 2025 година, индустријата за вештачка интелигенција забележа големи инвестиции и раст кога Антропик и Мајкрософт најавија амбициозни планови за изградба на нова инфраструктура за вештачка интелигенција во САД.

Nov. 15, 2025, 1:17 p.m.

Како персонализацијата заснована на вештачка инте…

За неколку години, врвните продавачи на хотели имале една клучна вештина: интуитивно читање на своите гости.

Nov. 15, 2025, 1:12 p.m.

АИ алатки за видео конференции ја олеснуваат сора…

Брзото префрлање на работата од далечина значително го забрза усвојувањето на платформи за видеоконференции опремени со вештачка интелигенција во голем број индустрии.

Nov. 15, 2025, 1:11 p.m.

ИИ и SEO: Навигација низ иднината на оптимизација…

Поработката на вештачката интелигенција (ВИ) го трансформира оптимизацијата за моторите за пребарување (СЕО) длабоко, променувајќи го начинот на кој маркетерите пристапуваат кон онлајн видливоста и стратегиите за содржина.

Nov. 15, 2025, 9:31 a.m.

Алатки за автоматско сумирање видеа со вештачка и…

Со брзото зголемување на обемот на онлајн видеосодржина, потребата за ефикасни методи за консумирање и разбирање на овие информации никогаш не била поактуелна.

Nov. 15, 2025, 9:22 a.m.

Azure AI платформата на Microsoft се развива со н…

Мајкрософт најави големо проширување на својата платформата Azure AI, претставувајќи низа нови алатки дизајнирани да ја унапредат машинската интелигенција и анализа на податоци.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today