Model AI o3 dari OpenAI Mencapai Skor Setara dengan Manusia pada ARC-AGI

Model kecerdasan buatan (AI) baru oleh OpenAI, yang dikenal sebagai o3, baru-baru ini mencapai hasil setara manusia pada tolok ukur ARC-AGI, sebuah tes yang mengukur "kecerdasan umum". Model ini mencetak 85%, jauh mengungguli rekam jejak AI sebelumnya dan sebanding dengan skor rata-rata manusia. Menciptakan kecerdasan umum buatan (AGI) adalah tujuan utama bagi laboratorium penelitian AI besar, dan hasil ini menunjukkan kemajuan menuju tujuan tersebut. Tes ARC-AGI menilai "efisiensi sampel" AI—kemampuannya untuk beradaptasi dengan situasi baru dengan data minimal. AI yang ada, seperti GPT-4, memerlukan data ekstensif untuk melakukan tugas, dan mengalami kesulitan dengan skenario yang kurang umum karena contoh yang terbatas. Agar AI dapat menangani pekerjaan yang bervariasi dan tak terduga, AI harus dapat menggeneralisasi dari beberapa poin data—sebuah elemen kunci dari kecerdasan. o3 dari OpenAI berhasil dengan menguasai pola kotak grid, menyelesaikan teka-teki dengan contoh yang terbatas, mirip dengan tes IQ manusia. Meskipun detail spesifik mengenai fungsi o3 belum jelas, adaptabilitasnya terlihat. Ia mengidentifikasi aturan "terlemah" yang mencakup situasi baru dengan asumsi minimal, memungkinkan adaptabilitas yang lebih besar.
Proses ini menyerupai AI AlphaGo dari Google, yang menggunakan "rantai pemikiran" untuk menyelesaikan tugas. Setiap rantai mewakili solusi potensial, dievaluasi menggunakan heuristik, atau aturan panduan, untuk memilih yang paling cocok. Meskipun hasil tes yang menjanjikan, tidak pasti apakah o3 benar-benar memajukan AGI mendekati kecerdasan manusia. Keberhasilannya mungkin tidak menunjukkan peningkatan bawaan dibandingkan model sebelumnya tetapi bisa disebabkan oleh pelatihan khusus untuk ARC-AGI. OpenAI belum sepenuhnya mengungkapkan detail tentang o3, sehingga potensi sebenarnya masih spekulatif. Memahami o3 akan memerlukan evaluasi menyeluruh dan dapat mengungkapkan kemampuannya untuk menyaingi adaptabilitas manusia. Jika demikian, ini mungkin merevolusi ekonomi dan teknologi, membawa pertimbangan baru untuk tata kelola AGI. Jika tidak, meskipun tetap mengesankan, ini akan membuat kehidupan sehari-hari sebagian besar tidak berubah.
Brief news summary
OpenAI telah meluncurkan model AI o3, yang mencapai skor 85% pada tolok ukur ARC-AGI, sebuah langkah penting dalam penelitian AI untuk menilai kecerdasan umum dan kemampuan belajar dari data minimal. Kemajuan ini sangat penting untuk menciptakan kecerdasan umum buatan (AGI), meskipun konsep AGI sejati tetap kontroversial. Tolok ukur ARC-AGI melibatkan teka-teki berbasis grid mirip dengan tes IQ, menantang AI untuk menyimpulkan aturan dengan contoh yang terbatas. Meskipun spesifikasi strategi model o3 tidak tersedia, mungkin mirip dengan AlphaGo milik Google, yang menggunakan metode pemecahan masalah yang canggih. OpenAI belum merilis informasi detail tentang cara kerja internal model ini. Ada diskusi yang berkelanjutan tentang dampak sistem o3 terhadap pengembangan AGI, karena pencapaian adaptabilitas seperti manusia dapat mengubah industri melalui peningkatan diri. OpenAI berencana untuk menawarkan wawasan lebih lanjut seiring evaluasi berjalan, dengan tujuan menjelaskan kemampuan model dan peran masa depannya dalam memajukan AI.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Alat AI Google Menghasilkan Deepfakes yang Meyaki…
Google baru-baru ini meluncurkan Veo 3, sebuah alat generasi video AI canggih yang mampu menghasilkan video deepfake hiper-realistis.

Blockchain: Visi Berani, Mimpi yang Terlalu Diger…
Saya baru saja mendiskusikan peran berkembang Pakistan dalam dunia kripto dengan Raza Rumi di Naya Daur TV.

Broadcom Rilis Chip Jaringan Baru untuk Mendukung…
Broadcom telah memperkenalkan chip jaringan terbaru mereka, Tomahawk 6, yang dibuat untuk mengatasi peningkatan permintaan infrastruktur kecerdasan buatan (AI).

Tether Luncurkan Token Emas Omnichain ‘XAUt0’ di …
Tether bekerja sama dengan TON Foundation untuk memperkenalkan XAUt0, versi omnichain dari stablecoin berbasis emas XAUt, yang bertujuan untuk memperluas akses emas digital di berbagai blockchain.

Penemuan Obat Berbasis Kecerdasan Buatan: Sebuah …
Kecerdasan buatan (AI) sedang mengubah industri farmasi dengan meningkatkan proses penemuan obat secara signifikan.

Tokenisasi properti tiba di Arab Saudi
Rafal Real Estate, sebuah perusahaan terkemuka di sektor properti, telah menandatangani kesepakatan pionir dengan perusahaan Amerika Serikat droppRWA untuk menerapkan tokenisasi aset properti di Arab Saudi.

AI dalam Pendidikan: Pengalaman Pembelajaran Pers…
Kecerdasan buatan (AI) sedang dengan cepat mengubah pendidikan dengan menawarkan pengalaman belajar yang sangat personal sesuai dengan kebutuhan unik setiap siswa.