lang icon English
May 13, 2024, 2:25 p.m.
1341

None

Brief news summary

OpenAI hat ChatGPT-4o vorgestellt, einen Chatbot, der einen neuen Weg für große Sprachmodelle aufzeigt. Dieser fortschrittliche Bot integriert Echtzeit-Audio und -Video und kann daher mit nonverbalen Signalen wie Stimmintonationen und Lachen antworten. Dadurch entsteht eine menschenähnliche Dimension in Interaktionen, die Gespräche authentischer und ansprechender macht. Demonstrationen der Fähigkeiten des Bots zeigen, dass er sich bei Witzen herzlich lachen kann, süße Tierstimmen nachahmen kann und bezaubernde Interpretationen beliebter Lieder liefert. Diese stimmlichen Merkmale schaffen eine emotionale Verbindung zwischen den Nutzern und dem KI-Assistenten. Die schnellere Reaktionszeit von 320 Millisekunden verbessert zudem den Gesprächsfluss, wie in Echtzeit-Übersetzungsbeispielen zu sehen ist. Der Durchbruch in der audiovisuellen Kommunikation hat das Potenzial, die Grenze zwischen Mensch und Maschine zu verwischen und eine parasoziale Beziehung zwischen Nutzern und dem KI-Assistenten zu fördern.

Die folgende Ankündigung von ChatGPT-4o hat unter KI-Enthusiasten für Aufsehen gesorgt. Anstatt Nachrichten an einen Chatbot zu tippen und lange Textantworten zu erhalten, ermöglicht es ChatGPT-4o den Benutzern nun, in Echtzeit Audio- und Video-Konversationen mit dem Chatbot zu führen. Dieser Fortschritt mag wie eine einfache Weiterentwicklung des bestehenden Interaktionsmodells erscheinen, aber nachdem ich mir die von OpenAI bereitgestellten Video-Demos angesehen habe, wird klar, dass wir kurz vor einem bedeutenden Wandel in unserer Wahrnehmung und Nutzung großer Sprachmodelle stehen. Obwohl uns persönlicher Zugang zu den Audio-Visuellen Funktionen von ChatGPT-4o fehlt, macht die Einbeziehung wichtiger nonverbaler Hinweise sowohl vom Chatbot als auch von den Benutzern das Gespräch viel menschlicher. Die Auswirkungen sind deutlich in dem Video zu sehen, in dem ein werdender Vater ChatGPT-4o nach seiner Meinung zu einem Vaterwitz fragt. Während die vorherige Version, ChatGPT4, leicht mit Textnachrichten wie "Herzlichen Glückwunsch zur bevorstehenden Familienzuwachs!" und "Das ist ein lustiger Vaterwitz" antworten konnte, bringt es ein völlig neues Maß an Echtheit, GPT-4o dieselben Antworten im Video zu hören, komplett mit echtem Lachen und nuancierten Stimmtonlagen. Eine weitere beeindruckende Demonstration ist, wenn GPT-4o auf Bilder eines bezaubernden weißen Hundes reagiert und eine hohe, babytalkartige Stimmfarbe annimmt. Dieses Verhalten ist sofort nachvollziehbar für jeden, der zum ersten Mal einem entzückenden Haustier begegnet, und zeigt, was Randall Munroe von xkcd als den "Du bist eine Katze!"-Effekt bezeichnet hat.

Diese Beispiele, zusammen mit dem Video, in dem GPT-4o das Lied "Happy Birthday" mit dramatischen Pausen und veränderten Texten singt, machen es schwer, GPT-4o nicht als etwas Menschenähnliches wahrzunehmen. Als ich mir die GPT-4o-Demos von OpenAI ansah, musste ich immer wieder über die überraschenden stimmlichen Fähigkeiten schmunzeln. Ob es sich um eine Sportkommentator-Stimme oder eine sarkastische Aubrey Plaza-Imitation handelt, es ist unglaublich entwaffnend, besonders für diejenigen von uns, die an textbasierte Interaktionen mit Sprachmodellen gewöhnt sind. Wenn diese Demos repräsentativ für die stimmlichen Fähigkeiten von ChatGPT-4o sind, können wir die Entwicklung einer völlig neuen Ebene der parasozialen Beziehung zwischen Benutzern und diesem KI-Assistenten erwarten. Textbasierte Chatbots haben jahrelang kognitive Verzerrungen ausgenutzt, um die Illusion von Empfindungsfähigkeit zu erschaffen. Jetzt, mit GPT-4o's präzisen Stimmtönen und emotionalen Aspekten, werden sich viele Benutzer wahrscheinlich selbst überzeugen, dass es tatsächlich einen "Geist in der Maschine" gibt. Neben den verbesserten emotionalen Eigenschaften werden die schnelleren Reaktionszeiten von GPT-4o die Interaktionen mit Chatbots revolutionieren. Die Verringerung der Zeitspanne von zwei bis drei Sekunden bei ChatGPT4 auf die angegebenen 320 Millisekunden bei GPT-4o mag zunächst nicht bedeutend erscheinen, summiert sich jedoch im Laufe der Zeit. Das Beispiel der Echtzeitübersetzung verdeutlicht diese Verbesserung, da die Gesprächspartner nun ein viel natürlicheres Gespräch führen können, ohne die unangenehmen Pausen zwischen Satzabschluss und Beginn der Übersetzung.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 2, 2025, 5:26 a.m.

KI-gestütztes SEO: Die Zukunft des digitalen Mark…

Künstliche Intelligenz (KI) verändert den Bereich des digitalen Marketings grundlegend und hat maßgeblichen Einfluss auf die Methoden der Suchmaschinenoptimierung (SEO).

Nov. 2, 2025, 5:25 a.m.

AMD's 100-Milliarden-Dollar-KI-Chip-Deal mit Open…

Der jüngste Vertrag zwischen OpenAI und AMD unterstreicht die entscheidende Rolle leistungsstarker Hardware bei der Unterstützung des raschen globalen Wachstums der Künstlichen Intelligenz.

Nov. 2, 2025, 5:22 a.m.

SolaX Rangiert als SMM Global Tier 1 BTM BESS-Lie…

SolaX hat einen wichtigen Meilenstein erreicht, indem es bei der CLNB 2025 - Messe für Neue Energiewirtschaftskette als Tier-1-Lieferant für Behind-The-Meter (BTM) Batteriespeichersysteme (BESS) ausgezeichnet wurde.

Nov. 2, 2025, 5:22 a.m.

Runway's Gen-4 KI-Modell verbessert die Fähigkeit…

Runway, ein führendes Unternehmen im Bereich künstliche Intelligenz und kreative Technologie, hat kürzlich seine neueste Innovation im Bereich der Videogeneration vorgestellt: das Gen-4 KI-Modell.

Nov. 2, 2025, 5:20 a.m.

Google Labs & DeepMind starten Pomelli, ein KI-ba…

Google Labs hat in Zusammenarbeit mit Google DeepMind Pomelli gestartet, ein KI-gesteuertes Experiment, das kleinen bis mittelständischen Unternehmen dabei helfen soll, marketingkampagnen zu erstellen, die zur Marke passen.

Nov. 2, 2025, 5:14 a.m.

KI-Chatbots steigern die Online-Verkäufe während …

Während der Feiertagssaison 2024 haben KI-gestützte Chatbots das Online-Einkaufserlebnis für US-Verbraucher deutlich verbessert.

Nov. 1, 2025, 2:28 p.m.

New Jersey KI-gestütztes Marketing für Startups: …

Startups in New Jersey haben jetzt Zugriff auf fortschrittliche KI-Tools durch eine integrierte Lösung, entwickelt von LeapEngine, einer bekannten lokalen Digitalagentur.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today