Das o3-Modell von OpenAI hat einen überraschenden Durchbruch in der KI erzielt, indem es 75, 7% im ARC-AGI-Benchmark erreichte, wobei eine verbesserte Version 87, 5% erzielte. Während dies beeindruckend ist, deutet es nicht auf das Erreichen von künstlicher allgemeiner Intelligenz (AGI) hin. Der ARC-AGI-Benchmark, der auf dem Abstract Reasoning Corpus beruht, testet die Fähigkeit der KI in komplexen, neuartigen Aufgaben mit visuellen Rätseln. Er ist schwierig gestaltet, um brute-force Lösungen durch einfaches Datentraining zu vermeiden. Der Benchmark umfasst ein öffentliches Trainingsset von 400 Beispielen und anspruchsvollere Bewertungssets. Private und halb-private Testsets gewährleisten eine unvoreingenommene Bewertung ohne vorherigen Wissenszugang der KI. Früher erreichte OpenAIs o1 nur 32% im ARC-AGI, und die Methode des Forschers Jeremy Berman erzielte 53%. François Chollet, der Schöpfer des ARC, beschreibt die Leistung von o3 als einen bedeutenden Sprung in der KI, der eine zuvor in GPT-Modellen nicht gesehene Anpassungsfähigkeit zeigt. Trotz der großen Aufmerksamkeit rund um o3 ist es nicht wesentlich größer als frühere Modelle, was es zu einem echten qualitativen Fortschritt macht, anstatt nur zu einem inkrementellen Fortschritt.
Dennoch verursacht es hohe Kosten: $17 bis $20 und 33 Millionen Token pro Puzzle bei niedriger Rechenleistung, deutlich steigend bei hoher Rechenleistung. Chollet betont "Programmsynthese" für das Lösen neuer Probleme, die kleine, kombinierbare Programme umfasst. Obwohl es kaum Details zu o3s Mechanismen gibt, wird vermutet, dass kettenlogisches Denken mit Suchmechanismen und Verstärkungslernen (RL) für die Verfeinerung der Lösung verwendet werden, obwohl Experten hierzu unterschiedliche Ansichten haben. Trotz seines Namens ist der ARC-AGI kein Test für AGI. Chollet betont, dass, obwohl o3 fortgeschrittene Fähigkeiten hat, es keine AGI ist, da es immer noch an einfachen Aufgaben scheitert und nicht autonom ohne externe Eingaben lernen kann. Unabhängige Überprüfung stellt die Ergebnisse von OpenAI in Frage, wobei vermutet wird, dass o3 auf ARC-Trainingsdaten abgestimmt wurde. Forscher schlagen vor, diese Systeme in neuen Umgebungen über ARC hinaus zu testen, um ihre Abstraktions- und Denkfähigkeiten zu bestätigen. Chollets Team entwickelt einen neuen Benchmark, der herausfordernd für o3 ist, während Menschen die meisten Rätsel leicht lösen könnten, was die Kluft zwischen aktueller KI und echter AGI unterstreicht.
Der Durchbruch des OpenAI o3 Modells beim ARC-AGI Benchmark: Ein Schritt in Richtung fortschrittliche KI.
                  
        Amazon meldete im dritten Quartal einen Nettoumsatz von 180,2 Milliarden US-Dollar, was einem Anstieg von 13 Prozent im Vergleich zum Vorjahr entspricht und vor allem durch KI-Initiativen in den Seattle-basierten Betriebsstätten vorangetrieben wurde.
        Letzten Sommer bei den Olympischen Spielen in Paris erkannte Mack McConnell, dass sich die Suche fundamental verändert hat, als seine Eltern unabhängig voneinander ChatGPT nutzten, um ihren Tag zu planen.
        Die Integration Künstlicher Intelligenz (KI) im Social Media Marketing (SMM) verändert die digitale Werbung und Nutzerbindung rasch, angetrieben durch Fortschritte in Computervision, natürlicher Sprachverarbeitung (NLP) und Predictive Analytics.
        Meta Platforms Inc.
        In den letzten Jahren hat die künstliche Intelligenz (KI) das Marketing revolutioniert, sodass große Unternehmen Strategien optimieren und beeindruckende Renditen erzielen können.
        HIMSS' Rob Havasy und PMI's Karla Eidem betonen, dass Gesundheitsorganisationen klare Ziele setzen und eine robuste Datenverwaltung etablieren müssen, bevor sie KI-Werkzeuge entwickeln.
        Wix, eine führende Plattform für Website-Erstellung und -Verwaltung, hat eine innovative Funktion namens AI Visibility Overview eingeführt, die Website-Betreiber dabei unterstützt, ihre Präsenz in AI-generierten Suchergebnissen besser zu verstehen.
Launch your AI-powered team to automate Marketing, Sales & Growth
    and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today