OpenAI, 'Operator'ı Tanıttı: Yeni Bir Yapay Zeka Destekli Web Otomasyon Aracı

Perşembe günü, OpenAI, "Operator" adlı yeni bir yapay zeka modeli olan Bilgisayar-Kullanan Ajan (CUA) tarafından desteklenen bir web otomasyon aracının araştırma önizlemesini tanıttı. Bu araç, kullanıcıların düğmeler ve metin alanları gibi ekrandaki öğelerle etkileşimde bulunarak insan davranışına benzer şekilde görevleri yerine getirmelerini sağlayarak bilgisayarları görsel bir arayüz üzerinden kontrol etmelerine olanak tanır. Şu anda, Operator, 200 dolarlık aylık ChatGPT Pro planının abonelerine operator. chatgpt. com adresinde erişilebilir; gelecekte Plus, Team ve Enterprise kullanıcılarına erişimi genişletmeyi planlıyor. OpenAI, bu özellikleri ChatGPT'ye entegre etmeyi ve geliştiriciler için CUA'yı bir API aracılığıyla sunmayı hedefliyor. Operator, ekran içeriğini gerçek zamanlı izleyerek, simüle edilmiş klavye ve fare eylemleri yoluyla komutları yerine getiriyor. Ekran görüntülerini analiz ederek bilgisayarın durumunu anlaması sağlanıyor; bu da tıklama, yazma ve kaydırma gibi kararlar almasına olanak tanıyor. Bu sürüm, kullanıcı adına hareket edebilen "ajanik" yapay zeka sistemlerini araştıran teknoloji şirketleri arasında bir eğilimle örtüşüyor. Google, Aralık 2024'te otomatik web görevleri için Project Mariner'i tanıttı, Anthropic ise Ekim 2024'te benzer amaçlar için "Bilgisayar Kullanımı" adında bir araç piyasaya sürdü. Bir yapay zeka araştırmacısı olan Simon Willison, Operator arayüzünün Anthropic'in Claude Bilgisayar Kullanımı demosuna benzediğini, bir sohbet paneli ile etkileşimli görsel arayüz içerdiğini belirtti. CUA, ekran görüntülerini yakalayarak, bunları analiz ederek piksel verilerini GPT-4o'nun görsel yetenekleri ile değerlendiriyor, gerekli eylemleri belirliyor ve sanal girişleri gerçekleştiriyor. Bu geri bildirim döngüsü, hata düzeltmesi yapmasına ve çeşitli uygulamalar arasında karmaşık görevleri yönetmesine olanak tanıyor.
Kullanım sırasında, minyatür bir tarayıcı penceresi Operator'un eylemlerini gösteriyor. Yeteneklerine rağmen, teknoloji hala evrim geçiriyor ve sınırlamaları mevcut; tekrarlayan web görevlerinde başarılı, ancak tanıdık olmayan arayüzler ve karmaşık metin düzenlemesinde zorlanıyor—iç testlerde yalnızca yüzde 40 başarı oranı bildiriliyor. Operator, WebVoyager benchmark'ta yüzde 87 başarı oranı elde etti, ancak çevrimdışı eğitim siteleri için WebArena benchmark'ta yüzde 58. 1'e düştü. OSWorld benchmark'taki performansı ise yüzde 38. 1 olarak kaydedildi. OpenAI, sistemin işlevselliğini artırmak için kullanıcı geri bildirimleri arıyor, çünkü CUA'nın her senaryoda güvenilir olmayacağını anlıyor ve zamanla çok yönlülüğünü geliştirmeyi planlıyor. Operator'un kullanıcı etkinliklerini gözlemleyip kontrol edebilmesi nedeniyle gizlilik ve güvenlik önemli endişeler taşıyor. OpenAI, hassas eylemler için kullanıcı onayını gerektiren güvenlik önlemleri uyguladı; kumar ve yetişkin içeriği gibi belirli site kategorilerine erişimi önlemek için tarayıcı kısıtlamaları belirlendi. OpenAI ayrıca, altüst etme girişimlerini önlemek için gerçek zamanlı moderasyon entegre ediyor; ancak Willison, yeni tehditler olasılığı nedeniyle uzun vadeli güvenliği hakkında şüphelerini dile getirdi. Proaktif önlemlere rağmen, OpenAI belgelerinde modelleme karmaşıklıkları ve evrilen karşıt tehditler nedeniyle zorlukların devam ettiğini kabul ediyor. Gizlilik endişeleri, Operator'un ekran görüntülerini OpenAI'nın bulut sunucularına göndermesi gerçeğinden kaynaklanıyor; kullanıcılara şirketin gizlilik önlemlerine güvenmeleri, model eğitimi için veri opt-out seçeneği, tek tıklama ile veri silme ve hassas görevler için oturum yönetimi sunmaları teşvik ediliyor. Willison, kullanıcıları, kimlik bilgilerini korumak için ayrı görevler için yeni oturumlar başlatmaya ve ödeme bilgilerini sağlarken dikkatli olmaya teşvik etti; böyle bir işlem sonrasında hızlı bir temizlik önerisinde bulundu.
Brief news summary
Perşembe günü, OpenAI "Operator" adlı, ChatGPT Pro kullanıcıları için tasarlanmış bir web otomasyon aracını tanıttı; bu araç, Computer-Using Agent (CUA) modelini kullanıyor. Bu yenilikçi araç, butonlar ve metin alanları gibi ekran ögelerini tanıyarak insan etkileşimlerini taklit eden kullanıcı dostu bir görsel arayüze sahip. Operator, mevcut ekran durumunu değerlendirmek için ekran görüntüleri alarak tıklama ve yazma gibi görevleri yerine getirebiliyor. Denemelerde, tekrar eden görevlerde %87 başarı oranı yakaladı, fakat tanıdık olmayan arayüzlerle veya karmaşık metin düzenlemeleriyle etkileşimde bu oran %40'a düştü. Kullanıcıları korumak amacıyla OpenAI, hassas işlemler için onay talep etmekte ve belirli web sitelerine erişimi kısıtlamaktadır. Platform, istem enjeksiyonlarından kaynaklanan riskleri azaltmak için gerçek zamanlı moderasyonu içermektedir, ancak güvenlik sorunları devam etmektedir. Kullanıcılara veri toplama işlemini reddetme ve tarayıcı geçmişlerini silme seçeneği sunulmaktadır. Operator’ın önemli potansiyeline rağmen, uzmanlar sınırlamaları nedeniyle dikkatli olunmasını önermekte ve hassas görevlerin güvenli ortamlarda gerçekleştirilmesi tavsiyesinde bulunmaktadır. OpenAI, kullanıcı geri bildirimlerine dayanarak Operator'ı geliştirerek pratik kullanım için evrim geçirmeye kararlıdır.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

ABD Yasama Organları, Federal Ajanslarda Çinli Ya…
ABD’de iki partili bir yasa yapıcı grup, No Adversarial AI Act adlı dönüm noktası niteliğindeki yasayı sundu ve bu yasa, Çin yapımı yapay zeka (AI) sistemlerinin federal hükümet içinde kullanılmasını yasaklamayı hedefliyor.

Gizlilik odaklı blockchain Canton'un inşa edicisi…
Dijital Varlık, gizlilik odaklı blokzinciri Canton Network'ün geliştiren şirket, Salı günü yaptığı açıklamada, DRW Venture Capital ve Tradeweb Markets liderliğindeki stratejik bir finansman turunda 135 milyon dolar topladığını duyurdu.

JPMorgan, Kurumsal Müşteriler İçin JPMD Mevduat T…
JPMorgan, kurumsal müşterilere güvenli on-chain ödemeleri gerçekleştirmek için tasarlanmış yeni dijital varlık JPMD’yi tanıttı.

OpenAI, Çin'in Zhipu AI'sinin küresel yapay zeka …
Çinli yapay zeka girişimi Zhipu AI, OpenAI raporlarına göre Malezya, Singapur, Birleşik Arap Emirlikleri, Suudi Arabistan ve Kenya gibi bölgelerde hükümet anlaşmaları elde etmede önemli adımlar attı.

ABD Eyaletleri, Artan Dolandırıcılık İle Mücadele…
Amerika Birleşik Devletleri genelinde, özellikle yaşlı vatandaşları hedef alan dolandırıcılık vakalarının hızla artmasıyla birlikte, eyaletler kripto para ATM'lerini düzenleme çabalarını artırıyor.

Yapay Zeka Araçları Öğretim Verimliliğini Artırıy…
Yapay zeka (YZ) araçları, Amerika Birleşik Devletleri’nde eğitim alanını hızla yeniden şekillendiriyor; öğretmenlere öğretim yöntemlerinin verimliliğini artırma ve iş-yaşam dengesini iyileştirme konusunda yeni fırsatlar sunuyor.

ABD Kongresi, Stablecoin Düzenleme Çerçevesinin G…
Yıllar boyunca yapılan çok sayıda çabaya rağmen, Amerika Birleşik Devletleri Kongresi şu anda stablecoinler için özel olarak kapsamlı bir düzenleyici çerçeve yasallaştırmaya yakın.