lang icon En
Dec. 27, 2024, 10:02 p.m.
3619

OpenAI'nin O3 Modeli, Yapay Zeka Testlerinde Önemli Bir Aşama Kaydetti.

Brief news summary

OpenAI'nin en son dil modeli "o3," "Yapay Genel Zeka için Soyutlama ve Akıl Yürütme" (ARC-AGI) testinde %76 skor elde ederek, %75'in biraz üzerindeki insan ortalamasını aşarak AI gelişiminde önemli ilerlemeler kaydetmiştir. Bu, bir AI'nin bu seviyede skor elde ettiği ilk vaka olup, problem çözme ve uyum sağlama yeteneklerinde dikkate değer bir gelişmeyi temsil etmektedir. ARC-AGI testinin yaratıcısı ve Google AI bilim insanı François Chollet, bu durumu "gerçek bir atılım" olarak nitelendirerek, AI'nin insan benzeri görevleri yerine getirme kapasitesinin arttığını belirtmiştir. Ancak Chollet, bunun o3'ün Yapay Genel Zekaya (AGI) ulaştığı anlamına gelmediğini çünkü basit görevlerde hala zorlandığını belirtti. Monte Carlo ağaç araması gibi mimari yeniliklerin o3'ün performansına katkıda bulunmuş olabileceğini önerdi. o3 büyük bir ilerleme kaydetmiş olsa da, henüz evrensel insan zekası seviyesine ulaşmamıştır ve gelecekteki ARC-AGI iterasyonları AI modellerine yeni zorluklar çıkarabilir.

OpenAI'nin en son büyük dil modeli olan "o3", henüz geniş çapta piyasaya sürülmedi, ancak ön testler yeteneklerine işaret ediyor. Model, yetenekleri hakkında az ayrıntıyla bir tanıtım videosu aracılığıyla kısaca tanıtıldı. Özellikle, o3, yeni durumlara uyum sağlama yeteneğini ölçmek için tasarlanmış bir ölçüt olan "Yapay Genel Zekâ için Soyutlama ve Akıl Yürütme Korpusu" (ARC-AGI) kullanılarak test edildi. Bu testte o3, 76% doğruluk oranına ulaştı ve Mechanical Turk çalışanlarının kaydettiği insan skorlarını aşarak, AI'nın yeni görevleri ele alma yeteneğinde bir dönüm noktası olarak kabul edilen bir başarıya imza attı. ARC-AGI'yi geliştiren François Chollet, o3'ün skorunun AI yeteneğinde önemli bir sıçrama gösterdiğini vurguluyor ve o3'ün yakında insan işiyle rekabet edebileceğini öne sürüyor. Chollet, daha önce AI'nın insan seviyesinde zekâya ulaşması konusunda şüpheci olsa da, bu gelişmeyi bir değişim olarak kabul ediyor.

ARC-AGI testi, dil üzerine dayanmayan görsel bulmacaları çözmeyi içeriyor ve o3 gibi modellere yeni yollarla meydan okuyor. Başarılarına rağmen, o3'ün yöntemleri, kapalı kaynak yapısı nedeniyle belirsizliğini koruyor. Chollet, modelin mimarisinin öncüllerinden önemli ölçüde farklı olduğunu ve Google'ın AlphaZero tarafından kullanılan bir test zamanı arama yaklaşımını benimsediğini öne sürüyor. Ancak, OpenAI'nin ARC-AGI skorları için harcanan kaynakları açıklamadığına dikkat çekiyor, bu da algılanan verimliliği etkileyebilir. o3'ün genel uyarlanabilirliği konusunda sorular devam ediyor, zira özellikle ARC-AGI testi için eğitildi. Chollet, o3'ün umut vaat ettiğini vurgulasa da, bazı basit görevlerde başarısız olduğunu belirtiyor ve bunun henüz AGI (yapay genel zekâ) seviyesinde olmadığını öne sürüyor. Modellere, o3 gibi daha fazla meydan okumak için güncellenmiş bir ARC-AGI versiyonu yayımlamayı planladığını belirtiyor ve gerçek AGI'nın şimdilik hala erişilmez olduğunu ifade ediyor.


Watch video about

OpenAI'nin O3 Modeli, Yapay Zeka Testlerinde Önemli Bir Aşama Kaydetti.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 18, 2025, 9:17 a.m.

Apple'ın Siri Yapay Zeka Sistemi: Artık Kişiselle…

Apple, sesli etkinleştirilen sanal asistanı Siri'nin güncellenmiş bir sürümünü duyurdu.

Dec. 18, 2025, 5:29 a.m.

Amazon, Liderlik Değişiklikleri Ortasında Yapay Z…

Amazon, yapay zeka bölümünde büyük değişiklikler geçiriyor; bu değişiklikler uzun süredir şirkette çalışan bir kıdemlinin ayrılması ve daha geniş kapsamlı yapay zeka girişimlerini yönetmek üzere yeni liderlik atamalarıyla öne çıkıyor.

Dec. 18, 2025, 5:22 a.m.

Gartner, 2028 yılına kadar Satış Uzmanlarının %10…

Gartner, önde gelen bir araştırma ve danışmanlık firması, 2028 yılına kadar küresel satışçıların yaklaşık %10’unun yapay zeka (YZ) sayesinde kazandıkları zamanı kullanarak 'aşırı istihdam' yapmaya başlayacağını öngörüyor.

Dec. 18, 2025, 5:20 a.m.

Evet! Atlanta, GA'da En İyi Yapay Zekâ Destekli D…

Evet! Atlanta merkezli dijital pazarlama ajansı olan YEAH!, performans odaklı yerel pazarlama konusunda uzmanlaşmış, Atlanta’nın en iyi yapay zeka dijital pazarlama ajansı olarak seçildi.

Dec. 18, 2025, 5:18 a.m.

Thrillax, AI Çağı için Görünürlüğe Odaklı SEO Çer…

Thrillax, dijital pazarlama ve SEO firması, görünürlüğe odaklanan yeni bir SEO çerçevesinin lansmanını duyurdu.

Dec. 18, 2025, 5:15 a.m.

Çin, Küresel İşbirliği ve Kapsayıcı Yönetimi Dest…

Çin, yapay zeka (YZ) alanında küresel işbirliğini teşvik etmek amacıyla yeni bir uluslararası kuruluş kurulmasını önerdi.

Dec. 18, 2025, 5:08 a.m.

İngiltere, araştırma fonlarını daha fazla yapay z…

Sınırsız erişim denemesi yapın Sadece 4 hafta boyunca tanımlanmadı Daha sonra aylık olarak tanımlanmadı

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today