Google startet Gemini 2.5: KI-Modell mit erweiterten Denkfähigkeiten

Am Dienstag stellte Google Gemini 2. 5 vor, eine neue Suite von KI-Reasoning-Modellen, die innehalten, um vor der Beantwortung von Fragen „nachzudenken“. Im Rahmen dieser Einführung veröffentlicht Google Gemini 2. 5 Pro Experimental, das als multimodales KI-Reasoning-Modell beschrieben wird und als das intelligenteste Angebot des Unternehmens bisher angepriesen wird. Dieses Modell wird am Dienstag über Google AI Studio, die Entwicklerplattform des Unternehmens, sowie in der Gemini-App für Abonnenten des 20-Dollar-pro-Monat-Gemini Advanced AI-Plans verfügbar sein. Für die Zukunft hat Google angekündigt, dass alle seine zukünftigen KI-Modelle Reasoning-Fähigkeiten integrieren werden. Seit OpenAI im September 2024 sein erstes KI-Reasoning-Modell, o1, eingeführt hat, strebt die Technologiewelt danach, dessen Fähigkeiten zu erreichen oder zu übertreffen. Derzeit haben Unternehmen wie Anthropic, DeepSeek, Google und xAI eigene KI-Reasoning-Modelle entwickelt, die zusätzliche Rechenressourcen und Zeit nutzen, um Informationen zu überprüfen und Probleme zu analysieren, bevor sie Antworten geben. Diese Reasoning-Techniken haben die Leistungsfähigkeit von KI-Modellen in mathematischen und Programmieraufgaben auf neue Ebenen gehoben. Viele Experten im Technologiebereich sind überzeugt, dass Reasoning-Modelle eine entscheidende Rolle bei KI-Agenten spielen werden – autonomen Systemen, die Aufgaben mit minimalem menschlichen Input ausführen können.
Es ist jedoch wichtig zu beachten, dass diese Modelle auch höhere Kosten verursachen. Google hat zuvor mit KI-Reasoning-Modellen experimentiert und im Dezember eine „denkende“ Version von Gemini veröffentlicht. Dennoch stellt Gemini 2. 5 den ehrgeizigsten Versuch des Unternehmens dar, die Modellreihe von OpenAI zu übertreffen. Laut Google übertrifft Gemini 2. 5 Pro seine früheren Frontier-KI-Modelle sowie mehrere führende Wettbewerber in verschiedenen Benchmark-Tests. Insbesondere wurde Gemini 2. 5 so gestaltet, dass es in der Erstellung visuell ansprechender Webanwendungen und agentenbasierter Programmierlösungen glänzt. In einer Programmierbewertung namens Aider Polyglot berichtet Google, dass Gemini 2. 5 Pro einen Score von 68, 6 % erreicht hat und damit die besten KI-Modelle von OpenAI, Anthropic und dem chinesischen KI-Labor DeepSeek übertroffen hat. In einer anderen Bewertung, die sich auf Softwareentwicklungskompetenzen konzentriert und SWE-bench Verified genannt wird, erzielte Gemini 2. 5 Pro jedoch einen Score von 63, 8 %, übertraf OpenAIs o3-mini und DeepSeeks R1, blieb jedoch hinter Anthropics Claude 3. 7 Sonnet zurück, das 70, 3 % erzielte. In einer multimodalen Bewertung, die als Humanity’s Last Exam bekannt ist und tausende von crowdsourceten Fragen in Mathematik, Geisteswissenschaften und Naturwissenschaften umfasst, gibt Google an, dass Gemini 2. 5 Pro einen Score von 18, 8 % erreicht hat und damit die meisten konkurrierenden Spitzenmodelle übertraf. Ursprünglich hat Google Gemini 2. 5 Pro mit einem Kontextfenster von 1 Million Tokens ausgestattet, was es dem KI-Modell ermöglicht, etwa 750. 000 Wörter auf einmal zu verarbeiten – mehr als die gesamte Buchreihe „Der Herr der Ringe“. Darüber hinaus wird Gemini 2. 5 Pro bald die doppelte Eingabelänge von 2 Millionen Tokens unterstützen. Google hat die API-Preise für Gemini 2. 5 Pro noch nicht bekannt gegeben, plant jedoch, in den kommenden Wochen weitere Informationen bereitzustellen.
Brief news summary
Am Dienstag stellte Google Gemini 2.5 vor, sein neuestes KI-Argumentationsmodell, das eine Pause-und-Nachdenken-Strategie einsetzt, um die Qualität der Antworten zu verbessern. Diese neue Version, Gemini 2.5 Pro Experimental, wird als Googles bisher raffinierteste KI angepriesen und ist für 20 US-Dollar pro Monat über Google AI Studio und die Gemini-App im Rahmen des Gemini Advanced-Plans erhältlich. Der Launch folgt auf bedeutende Updates in der Branche, insbesondere nach der Veröffentlichung des o1-Modells von OpenAI im September 2024, wobei Konkurrenten wie Anthropic, DeepSeek und xAI um eine verbesserte Leistungsfähigkeit der Modelle in den Bereichen Programmierung und Mathematik kämpfen, trotz höherer Ressourcenanforderungen. Gemini 2.5 Pro zielt darauf ab, frühere Modelle zu übertreffen und erzielt Ergebnisse von 68,6% im Aider Polyglot-Codierungsassessment und 63,8% im SWE-bench Verified-Test. Allerdings hat es nicht mit Anthropics Claude 3.7 Sonnet mithalten können und nur 18,8% beim Humanity's Last Exam erreicht. Bemerkenswert ist, dass es ein Kontextfenster von 1 Million Token hat, das es ihm ermöglicht, etwa 750.000 Wörter gleichzeitig zu verarbeiten, was die Länge von "Der Herr der Ringe" übersteigt. Google plant, diese Kapazität in naher Zukunft auf 2 Millionen Token zu erhöhen, mit weiteren Preisdetails, die bald bekannt gegeben werden.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Blockchain (BKCH) erreicht neuen 52-Wochen-Hoch
Der Global X Blockchain ETF (BKCH) zieht wahrscheinlich die Aufmerksamkeit von Anlegern auf sich, die auf Momentum-Profite setzen.

UBS setzt KI-Analystenklone ein
Abonnieren Sie FT Edit Nur 49 £ pro Jahr Genießen Sie 2 Monate kostenlos bei einer Jahresabonnement — zuvor 59,88 £, jetzt 49 £

OpenAI wechselt zur Public Benefit Corporation fü…
OpenAI hat kürzlich eine bedeutende Änderung seiner Organisationsstruktur bekannt gegeben, indem es von einer gewinnorientierten Limited Liability Company (LLC) zu einer Public Benefit Corporation (PBC) gewechselt ist.

DMG Blockchain Solutions investiert in KI-bereite…
DMG Blockchain Solutions Inc.

Nvidia kündigt humanoide Robotik-Modelle sowie Ku…
Nvidia (NVDA) präsentierte sich am Montag auf der diesjährigen Computex Taipei-Technologiemesse mit einer Reihe von Ankündigungen, die von der Entwicklung humanoider Roboter bis hin zur Erweiterung ihrer fortschrittlichen NVLink-Technologie reichen.

Der Blockchain-Regierung-Markt wird voraussichtli…
Der globale Markt für Blockchain-Technologie im öffentlichen Sektor verzeichnet ein beispielloses Wachstum, mit einem Wert von 22,5 Milliarden US-Dollar im Jahr 2024 und einer prognostizierten Steigerung auf 791,5 Milliarden US-Dollar bis 2030.

Nvidia-CEO kündigt bedeutende Taiwan-Chip-Investi…
Auf der Computex 2025 in Taipeh kündigte Nvidia-CEO Jensen Huang bedeutende Initiativen an, die das zunehmende Engagement des Unternehmens für Taiwan und den Fortschritt der Künstlichen Intelligenz-Infrastruktur unterstreichen.