lang icon Polish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 27, 2024, 10:02 p.m.
123

Model O3 firmy OpenAI osiąga kamień milowy w testach AI.

Najnowszy duży model językowy OpenAI, znany jako "o3", nie został jeszcze szeroko udostępniony, ale wstępne testy wskazują na jego możliwości. Model został krótko zaprezentowany w filmie promocyjnym, z niewieloma szczegółami na temat jego zdolności. Szczególnie o3 został przetestowany przy użyciu "Korpusu Abstrakcji i Rozumowania dla Sztucznej Inteligencji Ogólnej" (ARC-AGI), który jest benchmarkiem zaprojektowanym do mierzenia zdolności modelu do adaptacji do nowych sytuacji. W tym teście o3 osiągnął 76% dokładności, przewyższając wyniki ludzkie notowane przez pracowników Mechanical Turk, co niektórzy uważają za przełom w zdolności AI do rozwiązywania nowych zadań. François Chollet, który opracował ARC-AGI, podkreśla, że wynik o3 świadczy o znacznym skoku w zdolnościach AI, sugerując, że o3 wkrótce może konkurować z ludzką pracą. Chociaż Chollet wcześniej był sceptyczny co do tego, czy AI osiągnie poziom inteligencji ludzkiej, uznaje ten rozwój za przełom.

Test ARC-AGI polega na rozwiązywaniu wizualnych łamigłówek niewymagających języka, stawiając nowe wyzwania przed modelami takimi jak o3. Pomimo sukcesów, metody o3 pozostają niejasne ze względu na zamknięty charakter źródłowy. Chollet spekuluje, że architektura modelu znacznie różni się od poprzedników, stosując podejście wyszukiwania w czasie testu, podobne do tego używanego przez AlphaZero od Google. Chollet zauważa jednak, że OpenAI nie ujawniło nakładów zasobów na osiągnięcie wyników ARC-AGI, co może wpłynąć na postrzeganą efektywność. Pozostają pytania dotyczące ogólnej adaptacyjności o3, gdyż był specjalnie szkolony do testu ARC-AGI. Chollet podkreśla, że choć o3 wykazuje potencjał, nadal nie radzi sobie z niektórymi prostymi zadaniami, co sugeruje, że nie osiągnął jeszcze poziomu AGI (sztucznej inteligencji ogólnej). Planuje wydać zaktualizowaną wersję ARC-AGI, aby stawiać dalsze wyzwania modelom takim jak o3, wskazując, że prawdziwe AGI wciąż jest poza zasięgiem.



Brief news summary

Naj­nowszy model językowy OpenAI, "o3", osiągnął znaczące postępy w rozwoju AI, zdobywając 76% punktów w teście "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI), przekraczając średnią ludzką wynoszącą nieco ponad 75%. Jest to historyczne osiągnięcie, ponieważ to pierwszy przypadek, gdy AI uzyskało taki wynik, co stanowi istotny krok naprzód w rozwiązywaniu problemów i adaptacyjności. François Chollet, twórca testu ARC-AGI i naukowiec Google AI, określił to jako "prawdziwy przełom", odzwierciedlając rosnącą zdolność AI do wykonywania zadań przypominających ludzkie. Niemniej jednak Chollet zauważył, że to nie oznacza, iż o3 osiągnął poziom ogólnej inteligencji sztucznej (AGI), ponieważ nadal ma trudności z prostszymi zadaniami. Proponował, że innowacje w architekturze, być może podobne do wyszukiwania Monte Carlo, mogły przyczynić się do wyników o3. Chociaż o3 to duży krok naprzód, nie osiągnął jeszcze poziomu uniwersalnej ludzkiej inteligencji, a przyszłe iteracje ARC-AGI mogą stanowić nowe wyzwania dla modeli AI.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 13, 2025, 2:25 p.m.

Il Foglio integruje sztuczną inteligencję w dzien…

Il Foglio, czołowa włoska gazeta, podjęła przełomowy eksperyment z integrowaniem sztucznej inteligencji w dziennikarstwie pod kierownictwem redaktora Claudio Cerasy.

June 13, 2025, 2:08 p.m.

Firma programistyczna zajmująca się kryptowalutam…

© 2025 Fortune Media IP Limited.

June 13, 2025, 10:31 a.m.

Inwestycja Meta w wysokości 14,3 miliarda dolarów…

Meta ujawniła dużą inwestycję w sektorze sztucznej inteligencji, wykupując 49% udziałów w firmie AI Scale za 14,3 miliarda dolarów.

June 13, 2025, 10:14 a.m.

Ustawa Emmera o Przejrzystości Papierów Wartościo…

Waszyngton, D.C. – Wczoraj wieczorem ustawa Congressman’a Toma Emmera dotycząca przejrzystości w zakresie papierów wartościowych, wraz z częściami ustawodawstwa Blockchain Regulatory Certainty Act (BRCA), pomyślnie przeprowadziła etap redakcyjny w Komisji Usług Finansowych Izby Reprezentantów po włączeniu do ustawy CLARITY.

June 13, 2025, 6:20 a.m.

Rząd Wielkiej Brytanii rozwija narzędzie AI, któr…

Rząd Wielkiej Brytanii podejmuje znaczne wysiłki, aby zwiększyć wydajność sektora publicznego poprzez wykorzystanie technologii sztucznej inteligencji.

June 13, 2025, 6:16 a.m.

ICE chce więcej technologii analityki blockchain

Imigracja i Służba Celna (ICE) zwiększa swoje inwestycje w technologię analizy blockchain, równocześnie korzystając z innych platform śledczych.

June 12, 2025, 2:15 p.m.

Nieprzewidywalne zachowanie modeli językowych AI …

Wydanie newslettera Axios AM z dnia 9 czerwca 2025 roku podkreśla rosnące obawy związane z zaawansowanymi dużymi modelami językowymi (LLMs) w sztucznej inteligencji.

All news