lang icon En
Jan. 26, 2025, 8:30 a.m.
2344

Последният изпит на човечеството: Ново предизвикателство за напредналите системи с изкуствен интелект

Brief news summary

Докато възможностите на изкуствения интелект (И.И.) предизвикват притеснения, експерти се сблъскват с предизвикателството да създадат тестове, които И.И. не може лесно да премине. Исторически, напредъкът в И.И. се оценяваше чрез стандартизирани оценки, подобни на S.A.T., които оценяваха умения в математика, науки и логика. Обаче с усъвършенстването на И.И. моделите, те успяха да се справят отлично с тези тестове, което доведе до разработването на по-трудни оценки, наподобяващи тестовете за висше образование. Последните модели от компании като OpenAI, Google и Anthropic показаха изключително добри резултати на тези напреднали тестове, което подчертава недостатъчността на настоящите методи за оценка. В светлината на този проблем, изследователи от Центъра за безопасност на И.И. и Scale AI стартират "Последния изпит на човечеството", описан като най-предизвикателния тест за И.И. системи досега. Тази инициатива, водена от експерта по безопасност на И.И. Дън Хендрикс, се стреми да отговори на спешния въпрос: Дали И.И. системите вече са твърде интелигентни за нас, за да можем точно да оценим?

Ако търсите нова причина да се чувствате неудобно относно изкуствения интелект, помислете за следното: някои от най-ярките умове в света изпитват затруднения да създадат тестове, които системите с И. А. не могат да преминат. В продължение на години системите с И. А. са оценявани с помощта на различни стандартизирани тестове. Много от тези тестове съдържаха предизвикателни въпроси на ниво SAT по предмети като математика, наука и логика. Проследяването на резултатите на тези модели с времето предоставяше груба индикация за напредъка в И. А. Въпреки това, системите с И. А. в крайна сметка се справиха отлично с тези оценки, което доведе до разработването на по-трудни тестове, които често включваха въпроси, с които студентите в магистратурата могат да се сблъскат на своите изпити. За съжаление, тези тестове също не дават добри резултати. Новите модели от компании като OpenAI, Google и Anthropic постигат високи резултати на много предизвикателства на ниво Ph. D. , което намалява ефективността на тестовете и повдига притеснителен въпрос: стават ли системите с И. А.

твърде интелигентни, за да ги оценим? Тази седмица изследователи от Центъра за безопасност на И. А. и Scale AI са готови да предложат потенциален отговор: нова оценка, наречена "Последният изпит на човечеството", която те твърдят, че е най-предизвикателният тест, който някога е даван на системи с И. А. "Последният изпит на човечеството" е замислен от Дан Хендрйкс, забележителен изследовател по безопасност на И. А. и директор на Центъра за безопасност на И. А. (Първоначалното заглавие на теста, "Последната защита на човечеството", е било abandonirano поради прекалена театралност. ) Благодаря ви за разбирането, докато потвърдяваме достъпа. Ако сте в режим на четене, моля, излезте и влезте в акаунта си в Times, или се абонирайте за пълен достъп до The Times. Благодаря ви за разбирането по време на процеса на проверка. Вече сте абонат?Влезте. Искате пълен достъп до The Times?Абонирайте се.


Watch video about

Последният изпит на човечеството: Ново предизвикателство за напредналите системи с изкуствен интелект

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 9:32 a.m.

Брифинг за пазара: Как търговците на Amazon преос…

Обществените насоки на Amazon относно оптимизацията на споменаванията на продукти за Rufus, неговия AI базиран асистент за пазаруване, остават непроменени, като не са предоставени нови съвети за продавачите.

Dec. 19, 2025, 9:25 a.m.

Adobe си партнира с Runway, за да въведе генерира…

Adobe разкриха многогодишно сътрудничество с Runway, което интегрира възможности за генериране на видео чрез изкуствен интелект директно в Adobe Firefly и постепенно по-дълбоко в Creative Cloud.

Dec. 19, 2025, 9:21 a.m.

Антропик се стреми да овладее изкуствения интелек…

Антропик, виден лидер в развитието на изкуствения интелект, стартира нови инструменти, насочени към помагане на бизнеса да интегрира безпроблемно AI в работните си среда.

Dec. 19, 2025, 9:14 a.m.

Insightly интегрира изкуствен интелект в платформ…

Insightly, водеща платформа за управление на взаимоотношения с клиентите (CRM), въведе "Copilot" – чатбот с изкуствен интелект, който интегрира генеративен изкуствен интелект в системата си, за да повиши продуктивността на потребителите и да улесни управлението на CRM.

Dec. 19, 2025, 9:14 a.m.

Qwen стартира нова функция за изкуствен интелект …

Qwen, пионерски лидер в технологията за изкуствен интелект, представи новата си функция AI Mini-Theater, която отбелязва значителен напредък в потребителския опит, базиран на изкуствен интелект.

Dec. 19, 2025, 5:37 a.m.

Видеа с дийпфейк, генерирани от изкуствен интелек…

Бързият напредък на изкуствения интелект доведе до забележителни иновации, особено технологията за дийпфейк.

Dec. 19, 2025, 5:28 a.m.

Йан ЛьоКун от Meta се стреми към оценка от 3,5 ми…

Йан Лекун, известен изследовател в областта на изкуствения интелект и бъдещ бивш главен учен-специалист по ИИ в Meta, стартира революционна стартъп компания в тази сфера.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today