Apps & Mobile Entwicklung

Neues Top-Modell von Google: Gemini 3.1 Pro punktet vor allem bei Logik-Aufgaben


Google hat mit Gemini 3.1 Pro ein neues Spitzenmodell vorgestellt. Vor allem im Bereich von Logik-Aufgaben verspricht man Verbesserungen. Bemerkenswert sind in dieser Hinsicht die Ergebnisse im populären ARC-AGI-2.

Mit dem ARC-Benchmark soll erfasst werden, wie KI-Modelle abstrakte Logik-Aufgaben lösen können. Es handelt sich um Aufgaben, die für Menschen vergleichsweise leicht zu lösen sind, selbst für aktuelle KI-Systeme jedoch herausfordernd sind.

Neue Spitze

Gemini 3.1 Pro erreicht im Thinking-Modus in diesem Benchmark einen Wert von 77,1 Prozent. Damit liegt man vor Anthropics neuem Spitzenmodell, Opus 4.6 sowie vor Gemini 3 Pro. OpenAIs GPT-5.2, also ein Top-Modell von Ende 2025, liegt deutlich dahinter.

Gemini 3.1 Pro im Benchmark-Vergleich (Bild: Google)

Auch in weiteren Benchmark-Ergebnissen, die Google bereitstellt, schneidet Gemini 3.1 Pro gut ab. Generell kann es sich knapp vor Opus 4.6 und damit an der Spitze positionieren.

OpenAI hatte zuletzt mit GPT-5.3 Codex eine aktualisierte Version des Agenten-Modells vorgestellt. Die allgemeine Fassung steht noch aus. Wenn diese kommt, hätten alle Top-Entwickler die Modellpalette wieder aktualisiert. Erstaunlich ist, dass der Sprung mittlerweile binnen weniger Monate erfolgt.

Gemini 3.1 Pro über die Gemini-App verfügbar

Google klassifiziert Gemini 3.1 Pro zunächst als Vorschauversion. Nutzer können auf das Modell über die Gemini-App sowie über NotebookLM zugreifen. Entwickler haben Zugriff über die Gemini-API, Unternehmen können es via Vertex AI und Gemini Enterprise nutzen.

Gemini 3.1 Pro war bereits die Grundlage für den neuen Recherche-Modus Gemini 3 Deep Think, den Google in der letzten Woche vorgestellt hatte. Mit dem aktualisierten technischen Gerüst wurden nochmals die Agenten-Fähigkeiten optimiert. Damit habe man laut Google weitere Fortschritte bei komplexen Aufgaben aus Bereichen wie Mathematik und Coding erzielt.

Gemini-3-Modelle als Erfolgsgeschichte für Google

Die Gemini-3-Modellreihe ist für Google bislang eine Erfolgsgeschichte. Ein Aufschwung wurde im Sommer 2025 mit der Veröffentlichung der Nano-Banana-Bildmodelle erzielt. Der Start der neuen Modellgeneration befeuerte aber auch die Nachfrage nach dem Assistenten.

Rein beim Marktanteil liegt Gemini laut den Zahlen von Analysediensten wie SimilarWeb noch klar hinter ChatGPT. OpenAIs Chatbot kam im Dezember 2025 auf rund 68 Prozent des Traffics, den generative KI-Assistenten erzeugen. Geminis Anteil lag bei etwa 18 Prozent, was aber für einen klaren zweiten Platz reicht. Im Vergleich zum Vorjahr konnte Google deutlich aufholen, in den App-Download-Charts lag Gemini zeitweise sogar vor ChatGPT.

  • Generative KI-Chatbots: Wie stark Gemini im Jahr 2025 auf ChatGPT aufgeholt hat
  • Code Red bei OpenAI: ChatGPT soll neues Modell und mehr Personalisierung erhalten

Das erhöhte den Druck auf OpenAI. Sam Altman hatte daher im Dezember einen „Code Red“ ausgerufen, um die Weiterentwicklung von ChatGPT zu beschleunigen.



Source link

Beliebt

Die mobile Version verlassen