lang icon En
Jan. 26, 2025, 8:30 a.m.
2384

Хүний сүүлчийн шалгалт: Д avanzed AI системүүдэд зориулсан шинэ сорилт

Brief news summary

Хиймэл оюун ухаан (ХОУ) чадваруудын асуудал гарч ирснээр, мэргэжилтнүүд ХОУ-г амархан давж гарахгүй тестийг бий болгох сорилттой нүүр тулж байна. Түүхэн хувьд, ХОУ-г дэвшил гаргах явцад С.А.Т. адил стандартчилсан үнэлгээгээр математик, шинжлэх ухаан, логикийн ур чадварыг үнэлж ирсэн. Гэвч ХОУ моделууд сайжирснаар эдгээр тестүүдэд амжилттай таарч, магистрын түвшний шалгалттай төстэй илүү хүнд үнэлгээг хөгжүүлэхэд хүргэсэн. OpenAI, Google, Anthropic зэрэг компаниудын сүүлийн үеийн моделууд эдгээр дэвшилтэт тестүүдэд маш сайн амжилт үзүүлж, одоогийн үнэлгээний арга барилын хүрээгүй байдлыг онцлон харуулж байна. Энэхүү асуудлын дүнд, AI аюулгүй байдлын төв болон Scale AI-ийн судлаачид ХОУ системүүдийн одоогоор хамгийн хүнд шалгалтыг «Хүний сүүлчийн шалгалт» хэмээн нэрлэж, эхлүүлж байна. Энэ санаачилга нь ХОУ аюулгүй байдлын мэргэжилтэн Дэн Хендриксийн удирдлагаар явагдаж байгаа бөгөөд, биднийг үнэн зөв үнэлэхэд ХОУ системүүд одоо хэт ухаантай болсон уу гэдэг хариултыг шийдвэрлэхийг зорьж байна.

Хиймэл оюун ухаан (A. I. ) -ын талаар сэтгэл зовох шинэ шалтгаан хайж байгаа бол энэ асуудалд анхаарлаа хандуулаарай: дэлхийн хамгийн шилдэг ухаантнууд A. I. системүүдийг давж гарч чадахгүйгээр шалгалт гаргахад хүндрэлтэй болоод байна. Сүүлийн жилүүдэд A. I. системүүдийг олон төрлийн стандартжуулсан шалгуур тестүүдээр үнэлж ирсэн. Эдгээр тестүүдээс олон нь математикууд, шинжлэх ухаан, логик зэрэг сэдвүүдийн SAT түвшний хүнд асуултуудыг агуулсан. Эдгээр загваруудын онооны хяналт нь A. I. -ийн дэвшлийг тодорхойлоход тусалдаг. Гэсэн ч, A. I. системүүд эдгээр үнэлгээнд амжилт гаргах болсон тул илүү төвөгтэй тестүүдийг боловсруулах шаардлагатай болсон—ялангуяа магистрант оюутнууд шинжлэх ухаан болон бусад шалгалтуудаа оролцуулахад тулгардаг асуултуудыг багтасан тестүүдийг. Харамсалтай нь, эдгээр тестүүд ч гэсэн сайн ажиллахгүй байна. OpenAI, Google, Anthropic зэрэг компаниудын шинэ загварууд олон Ph. D. -ийн түвшний сорилтод өндөр оноо авсан нь эдгээр тестүүдийн үр дүнг бууруулж, сэтгэл зовоосон асуулт гарч ирж байна: A. I. системүүд биднийг үнэлэхэд хэт ухаантай болж байна уу? Энэ долоо хоногт A. I. Аюулгүй байдал төвийн судлаачид “Хүний сүүлийн шалгалт” гэж нэрлэгдсэн шинэ үнэлгээг санал болгох гэж байна.

Энэ нь A. I. системүүдэд өгсөн хамгийн хүнд тест гэж тэд өгүүлж байна. “Хүний сүүлийн шалгалт” нь A. I. аюулгүй байдлын судлаач Дан Хендрикийн санаачилсан бөгөөд A. I. Аюулгүй байдлын төвийн захирал юм. (Энэ тестийн анхны нэр “Хүний сүүлийн зогсоол” гэдэг байсан боловч хэт драматик байдлаас шалтгаалж орхигдсон. ) Таны ойлгож байгаад баярлалаа, бид нэвтрэх эрхийг баталгаажуулж байна. Хэрэв та уншигчийн горимд байгаа бол гарч, Times дансандаа нэвтэрч ороорой, эсвэл The Times-д бүрэн нэвтрэх эрх авахын тулд подписдолгоо аваарай. Баталгаажуулалтын явцад таны ойлгож байгаад баярлалаа. Та аль хэдийн подписдолсон уу?Нэвтэрч ороорой. The Times-д бүрэн нэвтрэхийг хүсч байна уу?Подписдолгоо аваарай.


Watch video about

Хүний сүүлчийн шалгалт: Д avanzed AI системүүдэд зориулсан шинэ сорилт

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 24, 2025, 1:29 p.m.

Кейс судалгаа: Хүний хиймэл оюун ухаан ашигласан …

Энэхүү судалгааны ажил нь хиймэл оюун ухааны (ХО) нь өргөжиж буй бизнесүүдийн хайлтын системийн оновчтой байдал (SEO)-д үзүүлэх хувь нэмрийг илтгэн харуулж байна.

Dec. 24, 2025, 1:20 p.m.

AI үүсгэсэн видеоны контент маркетингийн кампанит…

Хиймэл оюун ухаан (ХОУ) түргэн хурдацтайгаар маркетингийн салбарыг өөрчилж байна, ялангуяа ХОУ-ээр үүсгэсэн видео контентыг ашиглан брэндүүд өөрсдийн үзэгчдтэй илүү гүнзгий холбоо тогтоох боломжийг олгож байна.

Dec. 24, 2025, 1:18 p.m.

2024 онд зориулсан Топ 51 хиймэл оюун ухаан марке…

хиймэл оюун ухаан (AI) олон салбарт гүнзгий нөлөөлж байна, ялангуяа маркетингийн салбарт.

Dec. 24, 2025, 1:16 p.m.

Маш сайн мэддэг SEO яагаад хиймэл оюун ухааны төл…

Би агентлаг SEO-н өсөлтөд нягт нягт анхаарал тавьж, Ирээдүйн хэдэн жилийн дотор хиймэл оюун ухааны чадамжууд хөгжихийн хэрээр агентууд салбарыг гүнзгий өөрчлөх эсэхэд итгэлтэй байна.

Dec. 24, 2025, 1:16 p.m.

HTC ухаалаг нүдний шилийн борлуулалтыг нэмэгдүүлэ…

Тайванийн HTC компани зах зээлд хурдтай өргөжиж буй ухаалаг шилний секторд өөрийн нээлттэй платформын бодлого дээр тулгуурлан эзлэх байр сууриа өргөжүүлэхийг зорьж байна.

Dec. 24, 2025, 1:14 p.m.

Таамаг: Энэ 3 Хиймэл Оюун Ухаан (ХОУ) хувьцаа 202…

Хиймэл оюун ухаан (ХОУ) хөрөнгө оруулалтын хувьцаанууд 2024 оноос авч үзвэл 2025 онд ч хүчтэй амжилтаа хадгалж, өсөлтөө үргэлжлүүлэв.

Dec. 24, 2025, 9:26 a.m.

Видео анализ дахь хиймэл оюун ухаан: Үзэмжийн өгө…

Сүүлийн жилүүдэд олон салбарт хиймэл оюун ухаан ашигласан видео аналитикийг хүчирхэг тусламж хэрэгсэл болгон хэрэглэж эхэлсэн бөгөөд энэ нь их хэмжээний дүрс мэдээллээс үнэн мөнийг гаргаж авахад тусалдаг.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today