Die folgende Ankündigung von ChatGPT-4o hat unter KI-Enthusiasten für Aufsehen gesorgt. Anstatt Nachrichten an einen Chatbot zu tippen und lange Textantworten zu erhalten, ermöglicht es ChatGPT-4o den Benutzern nun, in Echtzeit Audio- und Video-Konversationen mit dem Chatbot zu führen. Dieser Fortschritt mag wie eine einfache Weiterentwicklung des bestehenden Interaktionsmodells erscheinen, aber nachdem ich mir die von OpenAI bereitgestellten Video-Demos angesehen habe, wird klar, dass wir kurz vor einem bedeutenden Wandel in unserer Wahrnehmung und Nutzung großer Sprachmodelle stehen. Obwohl uns persönlicher Zugang zu den Audio-Visuellen Funktionen von ChatGPT-4o fehlt, macht die Einbeziehung wichtiger nonverbaler Hinweise sowohl vom Chatbot als auch von den Benutzern das Gespräch viel menschlicher. Die Auswirkungen sind deutlich in dem Video zu sehen, in dem ein werdender Vater ChatGPT-4o nach seiner Meinung zu einem Vaterwitz fragt. Während die vorherige Version, ChatGPT4, leicht mit Textnachrichten wie "Herzlichen Glückwunsch zur bevorstehenden Familienzuwachs!" und "Das ist ein lustiger Vaterwitz" antworten konnte, bringt es ein völlig neues Maß an Echtheit, GPT-4o dieselben Antworten im Video zu hören, komplett mit echtem Lachen und nuancierten Stimmtonlagen. Eine weitere beeindruckende Demonstration ist, wenn GPT-4o auf Bilder eines bezaubernden weißen Hundes reagiert und eine hohe, babytalkartige Stimmfarbe annimmt. Dieses Verhalten ist sofort nachvollziehbar für jeden, der zum ersten Mal einem entzückenden Haustier begegnet, und zeigt, was Randall Munroe von xkcd als den "Du bist eine Katze!"-Effekt bezeichnet hat.
Diese Beispiele, zusammen mit dem Video, in dem GPT-4o das Lied "Happy Birthday" mit dramatischen Pausen und veränderten Texten singt, machen es schwer, GPT-4o nicht als etwas Menschenähnliches wahrzunehmen. Als ich mir die GPT-4o-Demos von OpenAI ansah, musste ich immer wieder über die überraschenden stimmlichen Fähigkeiten schmunzeln. Ob es sich um eine Sportkommentator-Stimme oder eine sarkastische Aubrey Plaza-Imitation handelt, es ist unglaublich entwaffnend, besonders für diejenigen von uns, die an textbasierte Interaktionen mit Sprachmodellen gewöhnt sind. Wenn diese Demos repräsentativ für die stimmlichen Fähigkeiten von ChatGPT-4o sind, können wir die Entwicklung einer völlig neuen Ebene der parasozialen Beziehung zwischen Benutzern und diesem KI-Assistenten erwarten. Textbasierte Chatbots haben jahrelang kognitive Verzerrungen ausgenutzt, um die Illusion von Empfindungsfähigkeit zu erschaffen. Jetzt, mit GPT-4o's präzisen Stimmtönen und emotionalen Aspekten, werden sich viele Benutzer wahrscheinlich selbst überzeugen, dass es tatsächlich einen "Geist in der Maschine" gibt. Neben den verbesserten emotionalen Eigenschaften werden die schnelleren Reaktionszeiten von GPT-4o die Interaktionen mit Chatbots revolutionieren. Die Verringerung der Zeitspanne von zwei bis drei Sekunden bei ChatGPT4 auf die angegebenen 320 Millisekunden bei GPT-4o mag zunächst nicht bedeutend erscheinen, summiert sich jedoch im Laufe der Zeit. Das Beispiel der Echtzeitübersetzung verdeutlicht diese Verbesserung, da die Gesprächspartner nun ein viel natürlicheres Gespräch führen können, ohne die unangenehmen Pausen zwischen Satzabschluss und Beginn der Übersetzung.
None
Künstliche Intelligenz (KI) verändert den Bereich des digitalen Marketings grundlegend und hat maßgeblichen Einfluss auf die Methoden der Suchmaschinenoptimierung (SEO).
Der jüngste Vertrag zwischen OpenAI und AMD unterstreicht die entscheidende Rolle leistungsstarker Hardware bei der Unterstützung des raschen globalen Wachstums der Künstlichen Intelligenz.
SolaX hat einen wichtigen Meilenstein erreicht, indem es bei der CLNB 2025 - Messe für Neue Energiewirtschaftskette als Tier-1-Lieferant für Behind-The-Meter (BTM) Batteriespeichersysteme (BESS) ausgezeichnet wurde.
Runway, ein führendes Unternehmen im Bereich künstliche Intelligenz und kreative Technologie, hat kürzlich seine neueste Innovation im Bereich der Videogeneration vorgestellt: das Gen-4 KI-Modell.
Google Labs hat in Zusammenarbeit mit Google DeepMind Pomelli gestartet, ein KI-gesteuertes Experiment, das kleinen bis mittelständischen Unternehmen dabei helfen soll, marketingkampagnen zu erstellen, die zur Marke passen.
Während der Feiertagssaison 2024 haben KI-gestützte Chatbots das Online-Einkaufserlebnis für US-Verbraucher deutlich verbessert.
Startups in New Jersey haben jetzt Zugriff auf fortschrittliche KI-Tools durch eine integrierte Lösung, entwickelt von LeapEngine, einer bekannten lokalen Digitalagentur.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today