News
>
Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Jan. 19, 2025, 4:20 p.m.

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Brief news summary

Epoch AI, një organizatë jo fitimprurëse e dedikuar për vendosjen e standardeve në matematikë për AI, u përball me kritika pas shpalljes së mbështetjes financiare nga OpenAI më 20 Dhjetor. Ky mbështetje financiare ka për qëllim krijimin e FrontierMath, një mjet të dizajnuar për të vlerësuar aftësitë matematikore të AI, veçanërisht në lidhje me modelin e ardhshëm o3. U ngritën shqetësime për mundësinë e paragjykimeve dhe transparencës, pasi shumë kontribues thuhet se nuk ishin në dijeni të kësaj mbështetjeje. Kritika, përfshirë kontraktorin "Meemi" nga LessWrong, shprehën skepticizëm në lidhje me paanshmërinë e standardeve, duke përmendur qasjen e mëparshme të OpenAI në materialet e testimit. Në mbrojtje të iniciativës, Tamay Besiroglu, drejtori asoci i Epoch AI, pranoi problemet e transparencës, por mbështeti fort integritetin e FrontierMath. Ai shpjegoi se kufizimet ligjore kishin ndikuar në shpërndarjen e informacioneve në kohë dhe theksoi nevojën për përmirësimin e komunikimit me kontribuesit. Besiroglu gjithashtu theksoi një marrëveshje informale që ndalon OpenAI të përdorë të dhënat e standardeve për qëllime trajnimi. Ellot Glazer, matematiciani kryesor i Epoch AI, pranoi se rezultatet e FrontierMath nuk kishin pasur një validim të pavarur nga OpenAI, por shprehu optimizëm për besueshmërinë e tyre.

Një organizatë jofitimprurëse që punon mbi benchmark-et matematikore për Inteligjencën Artificiale ka rënë në fokusin e kritikave për moszbulimin e mbështetjes financiare nga OpenAI deri tani, duke nxitur akuzat për papërshtatshmëri brenda komunitetit të AI. Epoch AI, një organizatë jofitimprurëse e mbështetur kryesisht nga Open Philanthropy— një fondacion kërkimor dhe dhëniesh— njoftoi më 20 Dhjetor se OpenAI financoi zhvillimin e FrontierMath. Ky test benchmark ofron probleme në nivel ekspert për të vlerësuar aftësitë matematikore të një AI dhe u përdor nga OpenAI për të demonstruar Inteligjencën e tij të ardhshme kryesore, o3. Në një postim në forumin LessWrong, një kontraktor i Epoch AI me emrin e përdoruesit "Meemi" pretendoi se shumë kontribues në benchmark-un FrontierMath nuk ishin në dijeni të përfshirjes së OpenAI deri sa u publikua informacioni. “Komunikimi në lidhje me këtë ka qenë joshqiptar, ” tha Meemi. “Në mendimin tim, Epoch AI duhej të kishte zbuluar financimin e OpenAI, dhe kontribuesit duhet të kishin informacion të qartë rreth implikimeve të mundshme të punës së tyre përpara se të vendosnin të merrnin pjesë në një benchmark. " Disa përdorues në rrjetet sociale shprehën shqetësime që mungesa e transparencës mund të dëmtojë statusin e FrontierMath si një benchmark neutral. Përveç financimit të FrontierMath, OpenAI kishte akses në shumë probleme dhe zgjidhje brenda benchmark-ut— një detaj të cilin Epoch AI nuk e ndau para 20 Dhjetorit, ditën kur u njoftua o3. Në përgjigje të komenteve të Meemi-t, Tamay Besiroglu, drejtoresha e asociuar e Epoch AI dhe një nga bashkëthemeluesit e saj, mbajti që integriteti i FrontierMath nuk ishte prekur, por pranoi se Epoch AI "kishte gabuar" duke mos qenë më e hapur. “Ne ishim të kufizuar nga kufizimet për zbulimin e partneritetit deri rreth lançimit të o3, dhe me retrospektivë, duhej të kishim insistuar për të qenë më transparentë me kontribuesit e benchmark-ut sa më shpejt të ishte e mundur, ” shkroi Besiroglu.

“Matematikanët tanë meritonin të dinin kush mund të kishte akses në kontributet e tyre. Edhe me kufizimet kontraktuale në zbulimet tona, duhej të kishim prioritizuar transparencën me kontribuesit tanë në marrëveshjen tonë me OpenAI. ” Besiroglu sqaroi se, ndonëse OpenAI ka akses në FrontierMath, ekziston një "marrëveshje verbale" që e parandalon atë të përdorë setin e problemeve për të trajnuar AI-në e saj— në thelb duke shmangur "mësimin për testin. " Për më tepër, Epoch AI mban një "set të veçantë mbajtës" për të siguruar verifikimin e pavarur të rezultateve të benchmark-ut FrontierMath, shpjegoi Besiroglu. “OpenAI ka …mbështetur plotësisht zgjedhjen tonë për të mbajtur një set mbajtës të veçantë, të padukshëm, ” shtoi ai. Megjithatë, situata u komplikuar kur matematikani kryesor i Epoch AI, Ellot Glazer, vuri në dukje në një postim në Reddit se Epoch AI nuk ka arritur ende të verifikojë në mënyrë të pavarur rezultatet e FrontierMath nga OpenAI për o3. “Në mendimin tim, [rezultati i OpenAI-s] është e vërtetë (dm. th. , ata nuk kanë trajnuar mbi dataset-in), dhe ata nuk kanë asnjë motiv për të keqinformuar performancat e tyre të benchmark-ut të brendshëm, ” tha Glazer. “Megjithatë, ne nuk mund të ofrojmë konfirmim deri sa vlerësimi ynë i pavarur të përfundojë. ”

News source

Watch video about

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

Aplikacioni SaaStr AI i Javës: Kintsugi — AI-ja q…

Cdo javë, ne theksojmë një aplikacion të drejtuar nga AI që zgjidh probleme të vërteta për kompani B2B dhe Cloud.

Dec. 16, 2025, 1:24 p.m.

Roli i Inteligjencës Artificiale në Strategjitë L…

Inteligjenca artificiale (IA) po ndikojnë gjithnjë e më shumë në strategjitë lokale të optimizimit të motorëve të kërkimit (SEO).

Dec. 16, 2025, 1:22 p.m.

IND Technology siguron 33 milionë dollarë për të …

IND Technology, një kompani Australiane që specializohet në monitorimin e infrastrukturës për shërbimet publike, ka siguruar 33 milionë dollarë financim për rritje për të forcuar përpjekjet e saj të bazuara në inteligjencën artificiale për të parandaluar zjarret dhe ndërprerjet e energjisë.

Dec. 16, 2025, 1:21 p.m.

Zbatimet e inteligjencës artificiale bëhen të kom…

Gjatë javëve të fundit, një numër në rritje botuesish dhe markash kanë përjetuar reagime të ashpra ndërsa eksperimentojnë me inteligjencën artificiale (IA) në proceset e prodhimit të përmbajtjes së tyre.

Dec. 16, 2025, 1:17 p.m.

Google Labs dhe DeepMind Fillojnë Pomelli: Vegël …

Google Labs, në partneritet me Google DeepMind, ka prezantuar Pomelli, një eksperimenti të fuqizuar nga AI që synon të ndihmojë bizneset e vogla dhe të mesme të zhvillojnë fushata marketingu në përputhje me markën.

Dec. 16, 2025, 1:15 p.m.

Një njohje video me inteligjencë artificiale përm…

Në peizazhin digjital që po zgjerohet shpejt sot, kompanitë e mediave sociale po adoptojnë gjithnjë e më shumë teknologji të avancuara për të mbrojtur komunitetet e tyre online.

Dec. 16, 2025, 9:37 a.m.

Pse viti 2026 mund të jetë viti i marketingut kun…

Një version i kësaj historie u shfaq në buletinin Nightcap të CNN Business.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Kintsugi: Zgjidhje për përputhshmëri me taksat në shitje e fuqizuar nga AI për kompani B2B dhe SaaS

Si Rrjetet e Inteligjencës Artificiale po Revolucionojnë Strategjitë lokale të SEO për Bizneset

IND Technology siguron 33 milionë dollarë për avancimin e parandalimit të zjarreve nga AI dhe monitorimin e rrjetit elektrik

The Best for your Business

Hot news

Aplikacioni SaaStr AI i Javës: Kintsugi — AI-ja q…

Roli i Inteligjencës Artificiale në Strategjitë L…

IND Technology siguron 33 milionë dollarë për të …

Zbatimet e inteligjencës artificiale bëhen të kom…

Google Labs dhe DeepMind Fillojnë Pomelli: Vegël …

Një njohje video me inteligjencë artificiale përm…

Pse viti 2026 mund të jetë viti i marketingut kun…

AI Company

Sales

Marketing

Epoch AI është shqyrtuar për zbuluar financimin nga OpenAI pas publikimit të FrontierMath.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Kintsugi: Zgjidhje për përputhshmëri me taksat në shitje e fuqizuar nga AI për kompani B2B dhe SaaS

Si Rrjetet e Inteligjencës Artificiale po Revolucionojnë Strategjitë lokale të SEO për Bizneset

IND Technology siguron 33 milionë dollarë për avancimin e parandalimit të zjarreve nga AI dhe monitorimin e rrjetit elektrik

The Best for your Business

Hot news

Aplikacioni SaaStr AI i Javës: Kintsugi — AI-ja q…

Roli i Inteligjencës Artificiale në Strategjitë L…

IND Technology siguron 33 milionë dollarë për të …

Zbatimet e inteligjencës artificiale bëhen të kom…

Google Labs dhe DeepMind Fillojnë Pomelli: Vegël …

Një njohje video me inteligjencë artificiale përm…

Pse viti 2026 mund të jetë viti i marketingut kun…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?