Model AI o3 dari OpenAI Mencapai Skor Setara dengan Manusia pada ARC-AGI

Model kecerdasan buatan (AI) baru oleh OpenAI, yang dikenal sebagai o3, baru-baru ini mencapai hasil setara manusia pada tolok ukur ARC-AGI, sebuah tes yang mengukur "kecerdasan umum". Model ini mencetak 85%, jauh mengungguli rekam jejak AI sebelumnya dan sebanding dengan skor rata-rata manusia. Menciptakan kecerdasan umum buatan (AGI) adalah tujuan utama bagi laboratorium penelitian AI besar, dan hasil ini menunjukkan kemajuan menuju tujuan tersebut. Tes ARC-AGI menilai "efisiensi sampel" AI—kemampuannya untuk beradaptasi dengan situasi baru dengan data minimal. AI yang ada, seperti GPT-4, memerlukan data ekstensif untuk melakukan tugas, dan mengalami kesulitan dengan skenario yang kurang umum karena contoh yang terbatas. Agar AI dapat menangani pekerjaan yang bervariasi dan tak terduga, AI harus dapat menggeneralisasi dari beberapa poin data—sebuah elemen kunci dari kecerdasan. o3 dari OpenAI berhasil dengan menguasai pola kotak grid, menyelesaikan teka-teki dengan contoh yang terbatas, mirip dengan tes IQ manusia. Meskipun detail spesifik mengenai fungsi o3 belum jelas, adaptabilitasnya terlihat. Ia mengidentifikasi aturan "terlemah" yang mencakup situasi baru dengan asumsi minimal, memungkinkan adaptabilitas yang lebih besar.
Proses ini menyerupai AI AlphaGo dari Google, yang menggunakan "rantai pemikiran" untuk menyelesaikan tugas. Setiap rantai mewakili solusi potensial, dievaluasi menggunakan heuristik, atau aturan panduan, untuk memilih yang paling cocok. Meskipun hasil tes yang menjanjikan, tidak pasti apakah o3 benar-benar memajukan AGI mendekati kecerdasan manusia. Keberhasilannya mungkin tidak menunjukkan peningkatan bawaan dibandingkan model sebelumnya tetapi bisa disebabkan oleh pelatihan khusus untuk ARC-AGI. OpenAI belum sepenuhnya mengungkapkan detail tentang o3, sehingga potensi sebenarnya masih spekulatif. Memahami o3 akan memerlukan evaluasi menyeluruh dan dapat mengungkapkan kemampuannya untuk menyaingi adaptabilitas manusia. Jika demikian, ini mungkin merevolusi ekonomi dan teknologi, membawa pertimbangan baru untuk tata kelola AGI. Jika tidak, meskipun tetap mengesankan, ini akan membuat kehidupan sehari-hari sebagian besar tidak berubah.
Brief news summary
OpenAI telah meluncurkan model AI o3, yang mencapai skor 85% pada tolok ukur ARC-AGI, sebuah langkah penting dalam penelitian AI untuk menilai kecerdasan umum dan kemampuan belajar dari data minimal. Kemajuan ini sangat penting untuk menciptakan kecerdasan umum buatan (AGI), meskipun konsep AGI sejati tetap kontroversial. Tolok ukur ARC-AGI melibatkan teka-teki berbasis grid mirip dengan tes IQ, menantang AI untuk menyimpulkan aturan dengan contoh yang terbatas. Meskipun spesifikasi strategi model o3 tidak tersedia, mungkin mirip dengan AlphaGo milik Google, yang menggunakan metode pemecahan masalah yang canggih. OpenAI belum merilis informasi detail tentang cara kerja internal model ini. Ada diskusi yang berkelanjutan tentang dampak sistem o3 terhadap pengembangan AGI, karena pencapaian adaptabilitas seperti manusia dapat mengubah industri melalui peningkatan diri. OpenAI berencana untuk menawarkan wawasan lebih lanjut seiring evaluasi berjalan, dengan tujuan menjelaskan kemampuan model dan peran masa depannya dalam memajukan AI.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Dewan Perwakilan Rakyat AS Loloskan RUU Kripto un…
Dewan Perwakilan Rakyat AS telah melangkah maju dengan legislasi kripto bipartian baru yang bertujuan mendorong adopsi blockchain di berbagai sektor dan meningkatkan daya saing negara melalui dukungan federal.

Benar bahwa rekan-rekan mahasiswa saya sedang men…
Peran kecerdasan buatan (AI) dalam pendidikan tinggi sering kali tampak bermasalah, dengan banyak mahasiswa menggunakan alat AI untuk mencontek saat penilaian dan ujian daring terbuka, yang tampaknya mengurangi kemampuan berpikir kritis yang sebenarnya.

SEC Menggeluarkan Pedoman Krispto Sebelumnya di T…
Dalam perkembangan regulasi yang signifikan, Komisi Sekuritas dan Bursa AS (SEC) mengambil langkah tegas pada Mei 2025 dengan secara resmi menarik kembali pedoman terkait kripto yang sebelumnya diterbitkan.

Ketika Tenaga Kerja Bertemu AI: Perbatasan Baru d…
Pemimpin abad ke-20 mengakui bahwa tenaga kerja yang terorganisasi bukan hanya sebagai alat tawar-menawar, tetapi sebagai fondasi kredibilitas ekonomi.

SoFi Akan Meluncurkan Pengiriman Uang Blockchain …
Dalam artikel ini: Platform fintech yang berbasis di AS, SoFi (SOFI), mengumumkan pada hari Rabu bahwa mereka akan meluncurkan layanan kiriman uang internasional melalui blockchain dan stablecoin, serta memungkinkan pengguna untuk berinvestasi dalam cryptocurrency dalam tahun ini, memenuhi inisiatif aset digital mereka sebelumnya

Robot Humanoid China Mengungguli Tim Sepak Bola N…
Beijing baru-baru ini menyelenggarakan serangkaian pertandingan sepak bola robot humanoid otonom yang sangat dinantikan dan menarik perhatian publik yang signifikan, bahkan bisa dibilang melebihi antusiasme yang biasanya terlihat untuk tim sepak bola nasional pria China.

Usaha Berani Crypto untuk Membangun Kembali Pasar…
Masuk untuk mengakses portofolio Anda Masuk