lang icon English
Dec. 27, 2024, 10:02 p.m.
3302

O3 моделот на OpenAI постигнува значаен успех во тестирањето на вештачката интелигенција.

Brief news summary

Најновиот јазичен модел на OpenAI, „o3“, направи значителен напредок во развојот на вештачката интелигенција постигнувајќи оценка од 76% на тестот „Корпус за апстракција и резонирање за вештачка општа интелигенција“ (ARC-AGI), надминувајќи го човечкиот просек од малку над 75%. Ова претставува историско достигнување, бидејќи е прв пат вештачка интелигенција да постигне вакво ниво, што претставува значаен напредок во решавање на проблеми и адаптирање. Франсоа Шоле, создавач на ARC-AGI тестот и научник во Google AI, го нарече ова „вистински пробив“, одразувајќи ја растечката способност на вештачката интелигенција да извршува задачи слични на човечките. Сепак, Шоле истакна дека ова не значи дека o3 постигнал Вештачка Општа Интелигенција (AGI), бидејќи сè уште се соочува со тешкотии со полесни задачи. Тој предложи дека архитектонските иновации, можеби слични на пребарувањето со Монте Карло дрво, можеби придонеле за успехот на o3. Иако o3 претставува значаен чекор напред, тој сè уште не го достигнал нивото на универзална човечка интелигенција, и идните итерации на ARC-AGI може да постават нови предизвици за AI моделите.

Најновиот голем јазичен модел на OpenAI, познат како "o3, " сè уште не е широко објавен, но прелиминарните тестови сугерираат на неговите способности. Моделот беше кратко презентиран преку промотивно видео, со малку детали за неговите можности. Важно е да се спомене дека o3 беше тестиран со "Корпус за апстракција и резонирање за вештачка општа интелигенција" (ARC-AGI), критериум дизајниран за мерење на способноста на моделот да се прилагоди на нови ситуации. Во овој тест, o3 постигна точност од 76%, надминувајќи ги човечките резултати забележани од работници на Mechanical Turk, означувајќи што некои го сметаат за пробив во способноста на вештачката интелигенција да се справува со нови задачи. Франсуа Шоле, кој го разви ARC-AGI, истакнува дека резултатот на o3 претставува значителен скок во способностите на вештачката интелигенција, сугерирајќи дека o3 може наскоро да се натпреварува со човековата работа. Иако Шоле претходно бил скептичен за тоа дека вештачката интелигенција ќе достигне човечко ниво на интелигенција, тој го признава ова развојство како промена.

Тестот ARC-AGI вклучува решавање на визуелни сложувалки кои не се потпираат на јазик, предизвикувајќи модели како o3 на нови начини. И покрај своите успеси, методите на o3 остануваат нејасни поради неговата затворена природа. Шоле шпекулира дека архитектурата на моделот значително се разликува од неговите претходници, применувајќи пристап за пребарување за време на тестирање сличен на оној користен од Google's AlphaZero. Сепак, Шоле забележува дека OpenAI не ги објавил средствата потрошени за постигнување на резултатите на ARC-AGI, што би можело да влијае на перцепирањето на ефикасноста. Прашањата за општата адаптивност на o3 остануваат, бидејќи тој беше специјално обучен за тестот ARC-AGI. Шоле нагласува дека иако o3 покажува потенцијал, тој сè уште се потфрла на некои едноставни задачи, што сугерира дека сè уште не е на ниво на општа вештачка интелигенција (AGI). Тој планира да објави ажурирана верзија на ARC-AGI за понатамошно предизвикување на модели како o3, означувајќи дека вистинската AGI е сè уште недостапна засега.


Watch video about

O3 моделот на OpenAI постигнува значаен успех во тестирањето на вештачката интелигенција.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 16, 2025, 1:28 p.m.

AI видео аналитика ја подобрува искуството од спо…

Светските спортски пренесувачи брзо ги прифаќаат видео-анализите со вештачка интелигенција (ВИ) за трансформирање на живите преноси на натпревари.

Nov. 16, 2025, 1:17 p.m.

ServiceNow дава силен перспективи за приходите, г…

ServiceNow Inc., водечкиот провајдер на платформи и решенија базирани на облак, објави силни пресметки за раст на приходите за претстојното трето тримесечје, што укажува на цврст деловен импулс и позитивен прием на пазарот.

Nov. 16, 2025, 1:14 p.m.

PR Newswire е лидер во SEO и AI пребарување, како…

ХОНГ КОНГ, 13 ноември 2025 /PRNewswire/ -- PR Newswire објави независни податоци кои демонстрираат лидерство во областа на SEO, можности за AI пребарување, онлајн видливост и медиа покриеност.

Nov. 16, 2025, 1:14 p.m.

Гугл објави проект за дата центар во Тексас вреде…

Клучни информации Примете Forbes Обновувања преку текстуални сигнали: Ги воведуваме известувањата преку пораки за да останете информирани за најважните случувања што ја движат дневната треска

Nov. 16, 2025, 1:13 p.m.

АИ маркетинг компанијата Алеамбик обезбедува 145 …

Последниот инвестициски круг, Серис Б, ја процени компанијата Alembic на 645 милиони долари.

Nov. 16, 2025, 9:21 a.m.

ИС ја убива маркетингот како што го знаеме — па ш…

Марк Andreessen во 2011 година изјави дека „софверот я јаде светот“, што особено се одрази во маркетингот, достигнувајќи врв неодамна на фестивалот Кан е Лајонс, каде технолошките гиганти како Амазон, Гугл, Мета, Мајкрософт, Нетфликс, Пинтерест, Reddit, Спотифи и Salesforce ги преземаа традиционалните агенции за маркетинг.

Nov. 16, 2025, 9:19 a.m.

Модот за вештачка интелигенција на Google сега мо…

Гугл е нетърпелив да користите неговиот вештачки интелект за да ви помогне при пазарувањето за празниците и сега овозможи AI Mode и Gemini да ве директно поврзуваат со производи.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today