lang icon En
Jan. 19, 2025, 4:20 p.m.
2306

Epoch AI je podrobena zkoumání za to, že zveřejnila financování od OpenAI po uvolnění FrontierMath.

Brief news summary

Epoch AI, nezisková organizace zaměřená na stanovení matematických standardů pro AI, čelila kritice poté, co 20. prosince odhalila financování od OpenAI. Tato finanční podpora je určena na vytvoření nástroje FrontierMath, navrženého k hodnocení matematických schopností AI, zejména ve vztahu k nadcházejícímu modelu o3. Obavy se objevily ohledně potenciální zaujatosti a transparentnosti, protože mnoho přispěvatelů údajně o tomto financování nevědělo. Kritici, včetně dodavatele "Meemi" z LessWrong, vyjádřili skepticismus ohledně nestrannosti standardů a poukázali na předchozí přístup OpenAI k testovacím materiálům. Na obranu iniciativy Tamay Besiroglu, zástupce ředitele Epoch AI, uznal problémy s transparentností, ale rozhodně podpořil integritu FrontierMath. Vysvětlil, že právní omezení ovlivnila včasné zveřejnění informací a zdůraznil zlepšenou komunikaci s přispěvateli. Besiroglu také poukázal na neformální dohodu, která brání OpenAI v použití dat z benchmarků pro účely trénování. Ellot Glazer, hlavní matematik Epoch AI, přijal, že výsledky FrontierMath nebyly nezávisle ověřeny OpenAI, ale vyjádřil optimismus ohledně jejich spolehlivosti.

Nezisková organizace pracující na matematických standardech pro umělou inteligenci se v poslední době dostala pod přímé zkoumání kvůli tomu, že dosud nezveřejnila své finanční zázemí od OpenAI, což vedlo k obviněním z nepřístojnosti uvnitř AI komunity. Epoch AI, neziskovka primárně podporovaná Open Philanthropy - výzkumnou a grantovou nadací - oznámila 20. prosince, že OpenAI financovala vývoj FrontierMath. Tento test v oblasti benchmarkingu zahrnuje úkoly na odborné úrovni, aby vyhodnotil matematické schopnosti AI a byl využit OpenAI k demonstraci jejího nadcházejícího vlajkového AI, o3. V příspěvku na fóru LessWrong tvrdil dodavatel pro Epoch AI používající uživatelské jméno "Meemi", že mnozí přispěvatelé do benchmarku FrontierMath nebyli až do veřejného odhalení vědomi zapojení OpenAI. „Komunikace ohledně toho byla neprůhledná, “ uvedl Meemi. „Podle mého názoru měla Epoch AI zveřejnit financování od OpenAI, a přispěvatelé by měli mít jasné informace o možných důsledcích své práce, než se rozhodnou účastnit se benchmarku. “ Někteří uživatelé na sociálních sítích vyjádřili obavy, že nedostatek transparentnosti by mohl poškodit postavení FrontierMath jako nestranného benchmarku. Kromě financování FrontierMath měla OpenAI přístup k mnoha problémům a řešením v rámci benchmarku - což Epoch AI nesdělila až do 20. prosince, dne, kdy byl o3 oznámen. V reakci na Meemiho komentáře udržoval Tamay Besiroglu, místopředseda Epoch AI a jeden z jejích spoluzakladatelů, že integrita FrontierMath byla nedotčena, ale uznal, že Epoch AI „chyba“ v tom, že nebyla otevřenější. „Byli jsme vázáni omezeními ohledně zveřejnění partnerství až do doby kolem uvedení o3, a zpětně bychom měli trvat na větší transparentnosti s přispěvateli benchmarku hned jak to bylo možné, “ napsal Besiroglu.

„Naši matematici si zasloužili vědět, kdo by mohl mít přístup k jejich příspěvkům. I s kontraktními omezeními ohledně našich zveřejnění jsme měli prioritizovat transparentnost s našimi přispěvateli v rámci naší dohody s OpenAI. “ Besiroglu upřesnil, že zatímco OpenAI má přístup k FrontierMath, existuje „ústní dohoda“, která mu brání používat soubor problémů k trénování své AI - v podstatě se tak vyhýbá „učení se na zkoušku“. Kromě toho Epoch AI udržuje „oddělenou kontrolní sadu“, aby zajistila nezávislé ověření výsledků benchmarku FrontierMath, vysvětlil Besiroglu. „OpenAI. . . plně podpořila naše rozhodnutí zachovat oddělenou, neviditelnou kontrolní sadu, “ dodal. Situaci však komplikoval, když hlavní matematik Epoch AI, Ellot Glazer, poznamenal v příspěvku na Redditu, že Epoch AI dosud nebyla schopna nezávisle ověřit výsledky OpenAI v rámci FrontierMath pro o3. „Podle mě je [skóre OpenAI] autentické (tj. netrénovali na daném datovém souboru) a nemají motivaci zkreslovat výkony v jejich interních benchmarkech, “ uvedl Glazer. „Nicméně nemůžeme poskytnout potvrzení, dokud naše nezávislé hodnocení neskončí. “


Watch video about

Epoch AI je podrobena zkoumání za to, že zveřejnila financování od OpenAI po uvolnění FrontierMath.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Nástroje pro moderaci videí s umělou inteligencí …

Sociální média stále více využívají umělou inteligenci (AI) ke zlepšení svého moderování videí, čelí tak narůstajícímu množství videí jako dominantnímu formátu online komunikace.

Dec. 21, 2025, 1:38 p.m.

USA znovu přehodnocuje své exportní omezení na či…

Změna politiky: Po letech zpřísňování omezení vyvolalo rozhodnutí povolit prodej čipů Nvidia H200 Číně námitky od některých republikánů.

Dec. 21, 2025, 1:38 p.m.

AI byl zodpovědný za více než 50 000 propouštění …

Propouštění způsobená umělou inteligencí poznamenala pracovní trh v roce 2025, kdy velké společnosti oznámily tisíce propouštění přičítaných pokrokům v AI.

Dec. 21, 2025, 1:36 p.m.

Spuštění služeb Perplexity SEO – přední agentura …

RankOS™ posiluje viditelnost značky a citace na platformách Perplexity AI a dalších vyhledávacích systémech založených na odpovědích Služby SEO agentury Perplexity New York, NY, 19

Dec. 21, 2025, 1:22 p.m.

Rodinná kancelář Erica Schmidta investuje do 22 s…

Originální verze tohoto článku se objevila v newsletteru CNBC Inside Wealth, který napsal Robert Frank a který slouží jako týdenní zdroj informací pro investory a spotřebitele s vysokou čistou hodnotou.

Dec. 21, 2025, 1:21 p.m.

Budoucnost marketingu - Přehled: Proč je "jen dob…

Tituly se zaměřily na Disneyho miliardovou investici do OpenAI a spekulovaly, proč si Disney vybralo OpenAI před Googlem, s nímž žalobu vede kvůli údajnému porušení copyrightu.

Dec. 21, 2025, 9:34 a.m.

Data z Salesforce odhalují, že AI a agenti táhnou…

Salesforce vydal podrobnou zprávu o nákupní události Cyber Week 2025, analyzující data od více než 1,5 miliardy globálních nakupujících.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today