OpenAI'nin o3 AI modeli, ARC-AGI'de insan seviyesinde puanlar elde etti.

OpenAI tarafından geliştirilen, o3 olarak bilinen yeni bir yapay zeka (YZ) modeli, "genel zeka"yı ölçen ARC-AGI benchmark testinde insan seviyesinde sonuçlar elde etti. %85 puan alarak önceki yapay zeka en iyilerinin oldukça üzerinde performans gösterdi ve ortalama insan skoruna denk geldi. Yapay genel zeka (AGI) yaratmak, büyük yapay zeka araştırma laboratuvarları için birincil hedeflerden biridir ve bu sonuç, bu amaca yönelik ilerleme kaydedildiğini gösteriyor. ARC-AGI testi, bir yapay zekanın "örnek verimliliği"ni — yani minimal veri ile yeni durumlara uyum sağlama yeteneğini — değerlendirir. Mevcut yapay zekalar, örneğin GPT-4, görevleri yerine getirmek için kapsamlı verilere ihtiyaç duyar ve yeterince örnek olmadığı nadir görülen senaryolarda zorlanır. Yapay zekanın çeşitli, öngörülemeyen işleri idare edebilmesi için birkaç veri noktasından genelleme yapabilmesi gerekir; bu zeka için temel bir unsurdur. OpenAI'nin o3 modeli, insan IQ testlerine benzer şekilde sınırlı örneklerle bulmacaları çözerek kare desenleri başarıyla kavradı. O3'ün işleyişinin detayları belirsiz olsa da, uyarlanabilirliği açıktır. Yeni durumları minimal varsayımlarla kapsayan "en zayıf" kuralları tanımlar, bu da daha büyük bir uyarlanabilirlik sağlar.
Bu süreç, görevleri çözmek için "düşünce zincirleri" kullanan Google'ın AlphaGo yapay zekasına benzemektedir. Her zincir, potansiyel bir çözümü temsil eder ve bir uygun kural kullanılarak en uygun olanı seçmek için değerlendirilir. Umut verici test sonuçlarına rağmen, o3'ün gerçekten AGI'yi insan benzeri zekaya yaklaştırıp yaklaştırmadığı belirsizdir. Başarısı, önceki modellerin doğal bir gelişiminden ziyade ARC-AGI için özel eğitime bağlı olabilir. OpenAI, o3 hakkında tüm detayları henüz açıklamamıştır, bu yüzden gerçek potansiyeli üzerinde spekülasyon yapılıyor. O3'yi anlamak, kapsamlı değerlendirme gerektirecek ve insan uyarlanabilirliğine rakip olup olamayacağını ortaya çıkarabilir. Eğer öyleyse, ekonomileri ve teknolojiyi devrim niteliğinde değiştirebilir, AGI yönetimi için yeni değerlendirmeler getirebilir. Aksi takdirde, yine de etkileyici olmasına rağmen, günlük hayat büyük ölçüde değişmeden kalacaktır.
Brief news summary
OpenAI, o3 AI modelini tanıttı ve ARC-AGI benchmark testinde %85 puan alarak az veriyle öğrenme ve genel zekayı değerlendirmekte önemli bir adım attı. Bu ilerleme, yapay genel zeka (AGI) oluşturmak için kritik bir öneme sahip olsa da, gerçek AGI kavramı tartışmalı olmaya devam ediyor. ARC-AGI kriteri, IQ testlerine benzer şekilde, sınırlı örneklerle kuralları çıkarsamak için yapay zekayı zorlayan ızgara tabanlı bulmacalar içeriyor. o3 modelinin stratejileri hakkında ayrıntılar henüz mevcut olmasa da, Google'ın gelişmiş problem çözme yöntemlerini kullanan AlphaGo'suna benzer olabilirler. OpenAI, modelin iç işleyişine dair detaylı bir bilgi sunmadı. o3 sisteminin AGI gelişimine etkisi hakkında devam eden bir tartışma var, çünkü insan benzeri uyarlanabilirliğe ulaşmak, kendini geliştirme yoluyla endüstrileri dönüştürebilir. OpenAI, değerlendirmeler ilerledikçe modelin yetenekleri ve AI'nın ilerleyişindeki gelecekteki rolü hakkında daha fazla fikir verebilmeyi amaçlıyor.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

ABD Temsilciler Meclisi Blockchain Geliştirme Tas…
Çarşamba günü Amerikan Temsilciler Meclisi, 279-136 oyla Finansal Yenilik ve Teknoloji 21.

Google, Meta'nın Satın Alımına Zemin Oluşturan Sc…
Google, Meta’nın yakın zamanda şirketin yüzde 49 hissesini satın almasının ardından, önde gelen veri etiketleme girişimi Scale AI ile olan ilişkisini sonlandırmayı planlıyor.

Dairenin Yerli USDC'si Dünyanın Blokzincirinde Ca…
Çarşamba, 11 Haziran'da, şirket Circle’ın USDC’si ve geliştirilmiş Çok Zincirli Transfer Protokolü (CCTP V2) resmi olarak World Chain üzerinde başlatıldığını duyurdu.

Google'ın Arama için Yapay Zeka Modu: Kullanıcı E…
Google, kullanıcıların çevrimiçi bilgilerle etkileşim biçimini dönüştürmeyi hedefleyen yenilikçi bir yapay zeka Modu'nun arama motoru içinde tanıtımını yaptı.

Il Foglio, Gazetecikte Yapay Zekasını ChatGPT ile…
Il Foglio, önde gelen İtalyan gazetelerinden biri, editör Claudio Cerasa önderliğinde gazeteciliğe yapay zekayı entegre eden çığır açan bir deney başlattı.

Kripto yazılım şirketi OneBalance, Cyber Fund ve …
© 2025 Fortune Media IP Limited.

Meta'nın Süper Zeka Hızlandırmak İçin Scale AI'ye…
Meta, Yapay Zeka sektörüne yaptığı büyük yatırımı açıkladı; AI firması Scale'ın %49 hissesini 14,3 milyar dolar karşılığında satın aldı.