lang icon En
Jan. 19, 2025, 4:20 p.m.
2300

Epoch AI sotmès a escrutini per haver revelat el finançament d'OpenAI després de la publicació de FrontierMath.

Brief news summary

Epoch AI, una organització sense ànim de lucre dedicada a establir referents matemàtics per a la IA, va enfrontar reaccions negatives després de revelar el finançament d'OpenAI el 20 de desembre. Aquest suport financer està destinat a la creació de FrontierMath, una eina dissenyada per avaluar les habilitats matemàtiques de la IA, especialment en relació amb el proper model o3. Van sorgir preocupacions sobre un possible biaix i transparència, ja que molts col·laboradors no eren conscients d’aquest suport. Crítics, incloent el contractista "Meemi" de LessWrong, van expressar escepticisme sobre la imparcialitat dels referents, citant l'accés previ d'OpenAI als materials de prova. En defensa de la iniciativa, Tamay Besiroglu, director associat d'Epoch AI, va reconèixer els problemes de transparència però va defensar amb fermesa la integritat de FrontierMath. Va explicar que les restriccions legals havien afectat les divulgacions a temps i va emfatitzar la millora de la comunicació amb els col·laboradors. Besiroglu també va assenyalar un acord informal que impedeix a OpenAI utilitzar dades de referència per a finalitats d'entrenament. Ellot Glazer, cap matemàtic d'Epoch AI, va acceptar que els resultats de FrontierMath no havien estat validats de manera independent per OpenAI però va expressar optimisme sobre la seva fiabilitat.

Una organització sense ànim de lucre que treballa en referències matemàtiques per a la IA ha estat recentment sota el focus de l'atenció per no haver desconegut el seu suport financer d'OpenAI fins ara, cosa que ha provocat acusacions d'impropietat dins la comunitat de la IA. Epoch AI, una organització sense ànim de lucre principalment recolzada per Open Philanthropy—una fundació d'investigació i concessió de subvencions—va anunciar el 20 de desembre que OpenAI havia finançat el desenvolupament de FrontierMath. Aquesta prova de referència presenta problemes a nivell d'experts per avaluar les capacitats matemàtiques d'una IA i va ser utilitzada per OpenAI per mostrar la seva imminent IA bandera, o3. En una publicació al fòrum LessWrong, un contractista d'Epoch AI que utilitzava el nom d'usuari "Meemi" va afirmar que molts dels col·laboradors de la referència FrontierMath no eren conscients de la implicació d'OpenAI fins que es va fer públic. "La comunicació sobre això ha estat no transparent", va declarar Meemi. "En la meva opinió, Epoch AI hauria d'haver desconegut el finançament d'OpenAI, i els col·laboradors haurien d'haver tingut informació clara sobre les possibles implicacions del seu treball abans de decidir participar en una referència. " Alguns usuaris a les xarxes socials van expressar preocupacions que la manca de transparència podria perjudicar la posició de FrontierMath com a referència imparcial. Juntament amb el finançament de FrontierMath, OpenAI va tenir accés a nombrosos problemes i solucions dins la referència—un detall que Epoch AI no va compartir abans del 20 de desembre, el dia en què es va anunciar o3. En resposta als comentaris de Meemi, Tamay Besiroglu, el director associat d'Epoch AI i un dels seus cofundadors, va mantenir que la integritat de FrontierMath no es va veure afectada però va reconèixer que Epoch AI "va cometre un error" en no ser més clar. "Érem subjectes a restriccions sobre la divulgació de la seva associació fins aproximadament al llançament d'o3, i en retrospectiva, hauríem d'haver insistit a ser més transparents amb els col·laboradors de la referència tan aviat com fos possible", va escriure Besiroglu.

"Els nostres matemàtics mereixien saber qui podria tenir accés a les seves contribucions. Fins i tot amb limitacions contractuals sobre les nostres divulgacions, hauríem d'haver prioritzat la transparència amb els nostres col·laboradors en el nostre acord amb OpenAI. " Besiroglu va aclarir que, mentre que OpenAI té accés a FrontierMath, hi ha un "acord verbal" que li impedeix utilitzar el conjunt de problemes per entrenar la seva IA—essencialment evitant "ensenyar per fer la prova. " A més, Epoch AI manté un "conjunt de retenció separat" per garantir la verificació independent dels resultats de la referència FrontierMath, va explicar Besiroglu. "OpenAI ha …donat total suport a la nostra decisió de mantenir un conjunt de retenció separat i no vist, " va afegir. Tanmateix, la situació es va complicar quan el líder matemàtic d'Epoch AI, Ellot Glazer, va assenyalar en una publicació a Reddit que Epoch AI encara no havia pogut verificar de manera independent els resultats de FrontierMath d'OpenAI per a o3. "En la meva opinió, [la puntuació d'OpenAI] és genuïna (és a dir, no han entrenat en el conjunt de dades), i no tenen motivació per a tergiversar les seves actuacions en la referència interna", va comentar Glazer. "Tanmateix, no podem proporcionar confirmació fins que la nostra avaluació independent conclogui. "


Watch video about

Epoch AI sotmès a escrutini per haver revelat el finançament d'OpenAI després de la publicació de FrontierMath.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 1:24 p.m.

5 atributs culturals que poden fer o desfer el vo…

Resum i Redactat de “The Gist” sobre la Transformació de la IA i la Cultura Organitzacional La transformació de la IA suposa principalment un repte cultural més que purament tecnològic

Dec. 20, 2025, 1:22 p.m.

Agent de vendes amb IA: Els 5 millors impulsors d…

L’objectiu final de les empreses és ampliar les vendes, però la forta competència pot dificultar aquest objectiu.

Dec. 20, 2025, 1:19 p.m.

Intel·ligència Artificial i SEO: una combinació p…

La incorporació de la intel·ligència artificial (IA) en les estratègies d'optimització per a motors de cerca (SEO) està transformant fonamentalment la manera com les empreses milloren la seva visibilitat online i atreuen trànsit orgànic.

Dec. 20, 2025, 1:15 p.m.

Els avenços en la tecnologia deepfake: implicacio…

La tecnologia deepfake ha fet avanços significatius recentment, generant vídeos manipulats altament realistes que retraten de manera convincente individus fent o dient coses que mai van fer realment.

Dec. 20, 2025, 1:13 p.m.

El impuls de Nvidia en Intel·ligència Artificial …

Nvidia ha anunciat una expansió significativa de les seves iniciatives de codi obert, mostrant un compromís estratègic per donar suport i avançar en l’ecosistema de codi obert en computació d’alt rendiment (HPC) i intel·ligència artificial (AI).

Dec. 20, 2025, 9:38 a.m.

La governadora de Nova York, Kathy Hochul, signa …

El 19 de desembre de 2025, la governadora de Nova York, Kathy Hochul, va signar la Llei de Seguretat i Ètica de la Intel·ligència Artificial Responsables (RAISE), establint un punt d'inflexió important en la regulació d’aquestes tecnologies avançades a l’estat.

Dec. 20, 2025, 9:36 a.m.

Stripe llança Agentic Commerce Suite per a vendes…

Stripe, la company de serveis financers programables, ha introduït l'Suite d'Comerç Agentic, una nova solució destinada a permetre a les empreses vendre a través de múltiples agents d'intel·ligència artificial.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today