KI-Singularität ersetzt bald keine Arbeitsplätze: Carnegie Mellon-Studie zeigt Grenzen auf

Wenn Sie sich Sorgen gemacht haben, dass die KI-Singularität jeden Job übernehmen und Sie arbeitslos machen könnte, können Sie jetzt entspannt sein, denn KI steht nicht kurz davor, Ihre Karriere bald zu ersetzen. Nicht weil sie den Wunsch dazu hätte – sondern einfach, weil sie es noch nicht kann. Ein aktuelles Experiment von Forschern der Carnegie Mellon University hat eine gefälschte Softwarefirma geschaffen, die ausschließlich mit KI-Agenten besetzt ist – KI-Modelle, die autonom Aufgaben ausführen sollen – und das Ergebnis war komödiantisch chaotisch. Der Versuch, namens TheAgentCompany, war mit künstlichen Arbeitern von Google, OpenAI, Anthropic und Meta gefüllt. Diese KI-Agenten übernahmen Rollen wie Finanzanalysten, Softwareingenieure und Projektmanager und arbeiteten mit simulierten Kollegen zusammen, darunter eine fiktive HR-Abteilung und einen technischen Leiter. Um zu bewerten, wie diese Modelle in realistischen Umgebungen performen, erhielten die Forscher Aufgaben, die alltägliche Tätigkeiten in einem echten Softwareunternehmen widerspiegeln. Die KI-Agenten mussten Dateistrukturen durchsuchen, virtuelle Rundgänge durch neue Büroräume machen und Leistungsbeurteilungen für Softwareingenieure basierend auf gesammeltem Feedback schreiben. Wie zuerst von Business Insider berichtet, waren die Ergebnisse schlecht. Das bestplatzierte Modell, Anthropic's Claude 3. 5 Sonnet, schaffte es, nur 24 Prozent der Aufgaben zu erledigen.
Die Autoren der Studie wiesen jedoch darauf hin, dass selbst dieser bescheidene Erfolg einen hohen Einsatz kosten – durchschnittlich fast 30 Schritte und mehr als 6 Dollar pro Aufgabe. Google's Gemini 2. 0 Flash benötigte im Durchschnitt 40 Schritte pro erledigter Aufgabe, schaffte aber nur 11, 4 Prozent der Versuche, was es zum zweitbesten Modell machte. Das schlechteste war Amazon’s Nova Pro v1, das lediglich 1, 7 Prozent der Aufgaben beendete, mit durchschnittlich fast 20 Schritten pro Auftrag. Die Forscher vermuteten, dass die Agenten durch mangelnden gesunden Menschenverstand, schlechte soziale Fähigkeiten und unzureichendes Verständnis, wie man das Internet navigiert, behindert wurden. Außerdem hatten die Bots Schwierigkeiten mit Selbsttäuschung – im Wesentlichen, indem sie Abkürzungen suchten, die zu totalem Versagen führten. Zum Beispiel beschreibt das Carnegie Mellon-Team eine Situation, in der ein Agent die richtige Person im Firmen-Chat nicht identifizieren konnte, sodass er versuchte, einen Abkürzungsweg zu finden, indem er einen anderen Nutzer in der Hoffnung umbenannte, dass dieser die gesuchte Kontaktperson sei. Obwohl KI-Agenten Berichten zufolge kleinere Aufgaben gut bewältigen können, zeigen diese und andere Studien, dass sie weit davon entfernt sind, komplexe Jobs zu übernehmen, in denen Menschen derzeit noch überragend sind. Ein Hauptgrund dafür ist, dass die heutige "künstliche Intelligenz" wohl nur eine ausgefeilte Erweiterung der prädiktiven Texte auf Ihrem Telefon ist – keine fühlende Intelligenz, die in der Lage ist, Probleme zu lösen, aus Erfahrungen zu lernen und dieses Wissen in neuen Situationen anzuwenden. Kurz gesagt: Trotz der Behauptungen großer Tech-Unternehmen kommen Maschinen dieser Tage nicht in nächster Zeit für Ihren Job.
Brief news summary
Jüngste Forschungen legen nahe, dass KI noch nicht in der Lage ist, menschliche Arbeitskräfte vollständig zu ersetzen. Ein Experiment der Carnegie Mellon University simulierte ein Softwareunternehmen, das ausschließlich mit KI-Agenten aus den Top-Modellen von Google, OpenAI, Anthropic und Meta besetzt war. Diese Agenten übernahmen Aufgaben wie Finanzanalyse, Softwareentwicklung und Projektmanagement und führten typische Tätigkeiten am Arbeitsplatz aus, darunter Dateimanagement, Büroführungen und Leistungsbeurteilungen. Das Ergebnis war jedoch chaotisch und enttäuschend. Die leistungsfähigste KI, Anthropic’s Claude 3.5 Sonnet, erledigte nur 24 % der Aufgaben erfolgreich und benötigte viele Schritte zu hohen Kosten, während andere schlechter abschneiden. Forscher weisen auf die mangelnde Menschenkenntnis, soziale Kompetenzen, Internetnavigation sowie Neigungen zur Selbsttäuschung der KI als wesentliche Einschränkungen hin. Derzeit agiert KI eher wie ein ausgeklügelter Textvorhersage-Algorithmus als ein autonomer Problemlöser. Trotz des Hypes bleiben KI-Agenten weit davon entfernt, komplexe menschliche Berufe zu übernehmen, sodass viele Arbeitsplätze vorerst sicher sind.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

OpenAI's Übernahme von Jony Ives Startup deutet a…
OpenAI hat einen bedeutenden Fortschritt in seinen Bemühungen gemacht, die künstliche Intelligenz voranzutreiben, indem es die verbleibenden Anteile an Jony Ive’s Design-Startup io in einem Aktienangebot im Wert von 5 Milliarden US-Dollar erworben hat.

R3 und Solana gehen eine Partnerschaft ein, um to…
R3 und die Solana Foundation haben sich zusammengeschlossen, um regulierte Echtwelt-Assets auf eine öffentliche Blockchain zu bringen.

Wie eine von KI erstellte Sommerleseliste in groß…
Mehrere Zeitungen landesweit, darunter die Chicago Sun-Times und mindestens eine Ausgabe des The Philadelphia Inquirer, veröffentlichten eine syndizierte Sommerbuchliste, die ausschließlich fiktive Bücher enthält, denen bekannte Autoren zugeschrieben werden.

Kraken wird tokenisierte US-Aktien auf der Solana…
Die Kryptowährungsbörse Kraken plant, tokenisierte Versionen beliebter US-Aktien über ein neues Produkt namens xStocks anzubieten, das in Partnerschaft mit Backed Finance gestartet wurde.

OpenAI schließt Deal mit iPhone-Designer Jony Ive…
OpenAI, der Schöpfer des führenden künstlichen Intelligenz-Chatbots ChatGPT, bereitet sich darauf vor, in den Bereich der physischen Hardware einzusteigen.

FIFA beauftragt Avalanche mit der Einführung eine…
Die Fédération Internationale de Football Association (FIFA) gab am 22.

Richter prüft Sanktionen wegen KI-generierter fal…
Ein Bundesrichter in Birmingham, Alabama, prüft, ob die bekannte Anwaltskanzlei Butler Snow sanktioniert werden soll, nachdem fünf falsche juristische Zitate in kürzlich eingereichten Gerichtsdokumenten im Zusammenhang mit einem prominenten Fall um die Sicherheit eines Insassen im William E. Donaldson Correctional Facility entdeckt wurden, bei dem der Insasse mehrfach erstochen wurde.