lang icon En
Jan. 19, 2025, 4:20 p.m.
2269

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Brief news summary

Epoch AI, një organizatë jo fitimprurëse e dedikuar për vendosjen e standardeve në matematikë për AI, u përball me kritika pas shpalljes së mbështetjes financiare nga OpenAI më 20 Dhjetor. Ky mbështetje financiare ka për qëllim krijimin e FrontierMath, një mjet të dizajnuar për të vlerësuar aftësitë matematikore të AI, veçanërisht në lidhje me modelin e ardhshëm o3. U ngritën shqetësime për mundësinë e paragjykimeve dhe transparencës, pasi shumë kontribues thuhet se nuk ishin në dijeni të kësaj mbështetjeje. Kritika, përfshirë kontraktorin "Meemi" nga LessWrong, shprehën skepticizëm në lidhje me paanshmërinë e standardeve, duke përmendur qasjen e mëparshme të OpenAI në materialet e testimit. Në mbrojtje të iniciativës, Tamay Besiroglu, drejtori asoci i Epoch AI, pranoi problemet e transparencës, por mbështeti fort integritetin e FrontierMath. Ai shpjegoi se kufizimet ligjore kishin ndikuar në shpërndarjen e informacioneve në kohë dhe theksoi nevojën për përmirësimin e komunikimit me kontribuesit. Besiroglu gjithashtu theksoi një marrëveshje informale që ndalon OpenAI të përdorë të dhënat e standardeve për qëllime trajnimi. Ellot Glazer, matematiciani kryesor i Epoch AI, pranoi se rezultatet e FrontierMath nuk kishin pasur një validim të pavarur nga OpenAI, por shprehu optimizëm për besueshmërinë e tyre.

Një organizatë jofitimprurëse që punon mbi benchmark-et matematikore për Inteligjencën Artificiale ka rënë në fokusin e kritikave për moszbulimin e mbështetjes financiare nga OpenAI deri tani, duke nxitur akuzat për papërshtatshmëri brenda komunitetit të AI. Epoch AI, një organizatë jofitimprurëse e mbështetur kryesisht nga Open Philanthropy— një fondacion kërkimor dhe dhëniesh— njoftoi më 20 Dhjetor se OpenAI financoi zhvillimin e FrontierMath. Ky test benchmark ofron probleme në nivel ekspert për të vlerësuar aftësitë matematikore të një AI dhe u përdor nga OpenAI për të demonstruar Inteligjencën e tij të ardhshme kryesore, o3. Në një postim në forumin LessWrong, një kontraktor i Epoch AI me emrin e përdoruesit "Meemi" pretendoi se shumë kontribues në benchmark-un FrontierMath nuk ishin në dijeni të përfshirjes së OpenAI deri sa u publikua informacioni. “Komunikimi në lidhje me këtë ka qenë joshqiptar, ” tha Meemi. “Në mendimin tim, Epoch AI duhej të kishte zbuluar financimin e OpenAI, dhe kontribuesit duhet të kishin informacion të qartë rreth implikimeve të mundshme të punës së tyre përpara se të vendosnin të merrnin pjesë në një benchmark. " Disa përdorues në rrjetet sociale shprehën shqetësime që mungesa e transparencës mund të dëmtojë statusin e FrontierMath si një benchmark neutral. Përveç financimit të FrontierMath, OpenAI kishte akses në shumë probleme dhe zgjidhje brenda benchmark-ut— një detaj të cilin Epoch AI nuk e ndau para 20 Dhjetorit, ditën kur u njoftua o3. Në përgjigje të komenteve të Meemi-t, Tamay Besiroglu, drejtoresha e asociuar e Epoch AI dhe një nga bashkëthemeluesit e saj, mbajti që integriteti i FrontierMath nuk ishte prekur, por pranoi se Epoch AI "kishte gabuar" duke mos qenë më e hapur. “Ne ishim të kufizuar nga kufizimet për zbulimin e partneritetit deri rreth lançimit të o3, dhe me retrospektivë, duhej të kishim insistuar për të qenë më transparentë me kontribuesit e benchmark-ut sa më shpejt të ishte e mundur, ” shkroi Besiroglu.

“Matematikanët tanë meritonin të dinin kush mund të kishte akses në kontributet e tyre. Edhe me kufizimet kontraktuale në zbulimet tona, duhej të kishim prioritizuar transparencën me kontribuesit tanë në marrëveshjen tonë me OpenAI. ” Besiroglu sqaroi se, ndonëse OpenAI ka akses në FrontierMath, ekziston një "marrëveshje verbale" që e parandalon atë të përdorë setin e problemeve për të trajnuar AI-në e saj— në thelb duke shmangur "mësimin për testin. " Për më tepër, Epoch AI mban një "set të veçantë mbajtës" për të siguruar verifikimin e pavarur të rezultateve të benchmark-ut FrontierMath, shpjegoi Besiroglu. “OpenAI ka …mbështetur plotësisht zgjedhjen tonë për të mbajtur një set mbajtës të veçantë, të padukshëm, ” shtoi ai. Megjithatë, situata u komplikuar kur matematikani kryesor i Epoch AI, Ellot Glazer, vuri në dukje në një postim në Reddit se Epoch AI nuk ka arritur ende të verifikojë në mënyrë të pavarur rezultatet e FrontierMath nga OpenAI për o3. “Në mendimin tim, [rezultati i OpenAI-s] është e vërtetë (dm. th. , ata nuk kanë trajnuar mbi dataset-in), dhe ata nuk kanë asnjë motiv për të keqinformuar performancat e tyre të benchmark-ut të brendshëm, ” tha Glazer. “Megjithatë, ne nuk mund të ofrojmë konfirmim deri sa vlerësimi ynë i pavarur të përfundojë. ”


Watch video about

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

Aplikacioni SaaStr AI i Javës: Kintsugi — AI-ja q…

Cdo javë, ne theksojmë një aplikacion të drejtuar nga AI që zgjidh probleme të vërteta për kompani B2B dhe Cloud.

Dec. 16, 2025, 1:24 p.m.

Roli i Inteligjencës Artificiale në Strategjitë L…

Inteligjenca artificiale (IA) po ndikojnë gjithnjë e më shumë në strategjitë lokale të optimizimit të motorëve të kërkimit (SEO).

Dec. 16, 2025, 1:22 p.m.

IND Technology siguron 33 milionë dollarë për të …

IND Technology, një kompani Australiane që specializohet në monitorimin e infrastrukturës për shërbimet publike, ka siguruar 33 milionë dollarë financim për rritje për të forcuar përpjekjet e saj të bazuara në inteligjencën artificiale për të parandaluar zjarret dhe ndërprerjet e energjisë.

Dec. 16, 2025, 1:21 p.m.

Zbatimet e inteligjencës artificiale bëhen të kom…

Gjatë javëve të fundit, një numër në rritje botuesish dhe markash kanë përjetuar reagime të ashpra ndërsa eksperimentojnë me inteligjencën artificiale (IA) në proceset e prodhimit të përmbajtjes së tyre.

Dec. 16, 2025, 1:17 p.m.

Google Labs dhe DeepMind Fillojnë Pomelli: Vegël …

Google Labs, në partneritet me Google DeepMind, ka prezantuar Pomelli, një eksperimenti të fuqizuar nga AI që synon të ndihmojë bizneset e vogla dhe të mesme të zhvillojnë fushata marketingu në përputhje me markën.

Dec. 16, 2025, 1:15 p.m.

Një njohje video me inteligjencë artificiale përm…

Në peizazhin digjital që po zgjerohet shpejt sot, kompanitë e mediave sociale po adoptojnë gjithnjë e më shumë teknologji të avancuara për të mbrojtur komunitetet e tyre online.

Dec. 16, 2025, 9:37 a.m.

Pse viti 2026 mund të jetë viti i marketingut kun…

Një version i kësaj historie u shfaq në buletinin Nightcap të CNN Business.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today