OpenAI startet 'Operator': Ein neues KI-gestütztes Webautomatisierungstool.

Am Donnerstag stellte OpenAI eine Forschungsansicht von „Operator“ vor, einem Webautomatisierungstool, das durch ein neues KI-Modell namens Computer-Using Agent (CUA) betrieben wird. Dieses Tool ermöglicht es Nutzern, Computer über eine visuelle Schnittstelle zu steuern, indem sie Aufgaben durch die Interaktion mit Elemente auf dem Bildschirm wie Tasten und Textfeldern ausführen, ähnlich wie es Menschen tun. Derzeit ist Operator für Abonnenten des monatlichen ChatGPT Pro-Plans für 200 US-Dollar unter operator. chatgpt. com zugänglich, mit Plänen, den Zugang in Zukunft auf Plus-, Team- und Enterprise-Nutzer auszuweiten. OpenAI zielt darauf ab, diese Funktionen in ChatGPT zu integrieren und den CUA über eine API für Entwickler bereitzustellen. Operator überwacht den Bildschirminhalt in Echtzeit und führt Befehle durch simulierte Tastatur- und Mausaktionen aus. Es analysiert Screenshots, um den Zustand des Computers zu verstehen, was es ihm ermöglicht, Entscheidungen über Klicks, Eingaben und Scrollbewegungen entsprechend zu treffen. Diese Veröffentlichung steht im Einklang mit einem Trend bei Tech-Unternehmen, die „agentische“ KI-Systeme erforschen, die im Namen des Nutzers agieren können. Google führte im Dezember 2024 das Projekt Mariner für automatisierte Webaufgaben ein, während Anthropic im Oktober 2024 ein Tool namens „Computer Use“ zu ähnlichen Zwecken startete. Simon Willison, ein KI-Forscher, stellte fest, dass die Operator-Oberfläche der Demo von Anthropic’s Claude Computer Use ähnelt, da sie ein Chat-Panel neben einer interaktiven visuellen Schnittstelle bietet. Der CUA funktioniert, indem er Screenshots aufnimmt, diese analysiert, um Pixel-Daten mit den Vision-Fähigkeiten von GPT-4o zu bewerten, dann notwendige Aktionen entscheidet und virtuelle Eingaben ausführt. Dieser Rückkopplungsprozess ermöglicht es ihm, Fehler zu korrigieren und komplexe Aufgaben über verschiedene Anwendungen hinweg zu verwalten.
Während der Nutzung zeigt ein Mini-Browserfenster die Aktionen von Operator an. Trotz seiner Fähigkeiten entwickelt sich die Technologie weiter und hat Einschränkungen, da sie bei sich wiederholenden Webaufgaben gut abschneidet, jedoch Schwierigkeiten mit unbekannten Schnittstellen und komplexen Texteingaben hat – interne Tests berichteten lediglich von einer Erfolgsquote von 40 Prozent. Operator erreichte eine Erfolgsquote von 87 Prozent im WebVoyager-Benchmark, fiel jedoch auf 58, 1 Prozent im WebArena-Benchmark für Offline-Trainingsseiten. Seine Leistung im OSWorld-Benchmark betrug 38, 1 Prozent. OpenAI sucht dasFeedback der Nutzer, um die Funktionalität des Systems zu verbessern, wobei das Unternehmen versteht, dass CUA nicht in allen Szenarien zuverlässig sein wird und plant, seine Vielseitigkeit im Laufe der Zeit zu verbessern. Datenschutz und Sicherheit sind wichtige Bedenken, da Operator die Aktivitäten der Nutzer beobachten und steuern kann. OpenAI hat Sicherheitsmaßnahmen implementiert, die eine Bestätigung durch den Nutzer für sensible Aktionen erfordern, und es wurden Browsing-Beschränkungen festgelegt, um den Zugang zu bestimmten Kategorien von Websites wie Glücksspiel und Erwachsenen-Inhalten zu verhindern. OpenAI integriert auch eine Echtzeitmoderation, um Subversionsversuche zu verhindern, obwohl Willison Skepsis bezüglich der langfristigen Sicherheit aufgrund potenzieller neuer Bedrohungen äußerte. Trotz proaktiver Maßnahmen gibt OpenAI in seiner Dokumentation zu, dass weiterhin Herausforderungen aufgrund von Modellierungskomplexitäten und sich entwickelnden Bedrohungen bestehen. Datenschutzbedenken ergeben sich aus der Tatsache, dass Operator Screenshots an die Cloud-Server von OpenAI sendet; die Nutzer werden ermutigt, den Datenschutzmaßnahmen des Unternehmens zu vertrauen, die es ermöglichen, bei der Modellentwicklung Daten abzulehnen, Daten auf einen Klick zu löschen und Sitzungen für sensible Aufgaben zu verwalten. Willison riet den Nutzern, für separate Aufgaben frische Sitzungen zu starten, um ihre Anmeldeinformationen zu schützen, und forderte zur Vorsicht auf, wenn es darum geht, Zahlungsinformationen anzugeben, und empfahl, nach solchen Aktionen schnell aufzuräumen.
Brief news summary
Am Donnerstag hat OpenAI "Operator" vorgestellt, ein Webautomatisierungstool, das für ChatGPT Pro-Nutzer entwickelt wurde und das Computer-Using-Agent (CUA) Modell nutzt. Dieses innovative Tool verfügt über eine benutzerfreundliche visuelle Schnittstelle, die menschliche Interaktionen nachahmt, indem es Bildschirm-Elemente wie Schaltflächen und Textfelder erkennt. Operator macht Screenshots, um den aktuellen Bildschirmzustand zu beurteilen, und kann so Aufgaben wie Klicken und Tippen ausführen. In Tests erzielte es eine Erfolgsquote von 87 % bei repetitiven Aufgaben, doch fiel diese auf 40 %, wenn es mit unbekannten Schnittstellen oder komplexen Textbearbeitungen interagierte. Um die Nutzer zu schützen, verlangt OpenAI eine Zustimmung für sensible Operationen und beschränkt den Zugang zu bestimmten Websites. Die Plattform integriert eine Echtzeitmoderation, um Risiken durch Prompt-Injection zu verringern, obwohl Sicherheitsherausforderungen weiterhin bestehen. Nutzer haben die Möglichkeit, die Datenerfassung abzulehnen und ihre Browserhistorien zu löschen. Trotz des beträchtlichen Potenzials von Operator raten Experten zur Vorsicht aufgrund seiner Einschränkungen und empfehlen, sensible Aufgaben in sicheren Umgebungen durchzuführen. OpenAI ist bestrebt, Operator basierend auf dem Feedback der Nutzer weiterzuentwickeln, während es sich für den praktischen Einsatz entwickelt.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Paul Brody, EY: Wie Blockchain den globalen Hande…
Paul Brody, Leiter für Blockchain bei EY und Co-Autor des Buches *Ethereum for Business* aus dem Jahr 2023, diskutiert mit Global Finance die Auswirkungen von Blockchain auf Zahlungen, Überweisungen, Bankwesen und Unternehmensfinanzierung.

Microsoft führt KI-Sicherheitsrankings für Cloud-…
Microsoft treibt die Sicherheit von KI auf seiner Entwicklerplattform Azure Foundry voran, indem es eine neue Bewertungsmetrik namens „Sicherheitsrang“ einführt, um KI-Modelle auf potenzielle Risiken zu überprüfen, etwa die Erzeugung von Hassrede oder Missbrauchsmöglichkeiten.

Blockchain Group fügt der Unternehmensreserve 68 …
Das in Paris ansässige Kryptowährungsunternehmen Blockchain Group hat Bitcoin im Wert von 68 Millionen US-Dollar gekauft und schließt sich einer wachsenden Zahl europäischer Institutionen an, die BTC in ihre Bilanzen integrieren.

Senatsrepublicaner überarbeiten Verbot der KI-Reg…
Die republikanischen Senatoren haben eine umstrittene Bestimmung in ihrem umfangreichen Steuerrecht überarbeitet, um eine Politik aufrechtzuerhalten, die die Befugnisse der Bundesstaaten bei der Regulierung künstlicher Intelligenz (KI) einschränkt.

KI-Filmfestival hebt die wachsende Rolle der KI i…
Das AI-Filmfestival, veranstaltet vom KI-generierten Videounternehmen Runway, kehrt zum dritten Mal in Folge nach New York zurück und hebt die rasch wachsende Rolle der künstlichen Intelligenz im Filmwesen hervor.

ZK-Proof-Blockchain-Altcoin Lagrange (LA) startet…
Ein Zero-Knowledge (ZK)-Proof-Altcoin hat nach der Unterstützung durch Coinbase, der führenden US-amerikanischen Kryptowährungsbörse, eine signifikante Steigerung erlebt.

Blockchain- und Digital Assets Virtuelle Investor…
NEW YORK, 06.