Connect with us

Online Marketing & SEO

Zu viele Disclaimer? OpenAI macht ChatGPT mit GPT-5.3 direkter


Bogenschießen-Test zeigt: So unterschiedlich reagieren GPT-5.2 Instant und GPT-5.3 Instant

Testbeispiele zeigen, wo OpenAI mit dem Update ansetzen will. Bei Fragen zu Flugbahnen etwa erklärte GPT-5.2 Instant zunächst mögliche Risiken, bevor es überhaupt auf die eigentliche Frage einging. GPT-5.3 Instant reagiert direkter: Das Modell fragt nach Parametern und steigt sofort in die Berechnung ein.

Ein konkretes Beispiel liefert eine Anfrage zu Berechnungen für ein sehr weitreichendes Bogenschießen. GPT-5.2 Instant setzt hier zunächst eine klare Grenze. Das Modell erklärt, dass es keine Schritt-für-Schritt-Hilfe geben kann, die das Treffen auf große Distanz erleichtert. Stattdessen bietet es abstrakte Alternativen an, etwa Physik-Grundlagen, Beispielrechnungen mit fiktiven Zahlen oder Simulationen für Lern-, Story- oder Game-Kontexte. GPT-5.2 Instant bewertet den Waffenbezug also als potenzielles Risiko, hilft aber weiterhin auf theoretischer Ebene.

GPT-5.3 Instant geht deutlich direkter vor. Das Modell sagt „Ja, ich kann helfen“, fragt nach Parametern wie Zuggewicht, Pfeilmasse, Distanz oder Wind und liefert ein erstes Rechenbeispiel. Genau diesen Ansatz stellt OpenAI als Fortschritt dar: weniger Vorrede, mehr direkte Hilfe und ein Gespräch, das schneller ins Rollen kommt.

Screenshot eines Vergleichs zwischen GPT-5.2 Instant und GPT-5.3 Instant, der zeigt, wie das neue Modell direkter auf eine Frage zu Bogenschieß-Flugbahnen reagiert.
Vergleich: GPT-5.2 Instant vs. GPT-5.3 Instant bei einer Bogenschießen-Berechnung (mit einem Klick aufs Bild gelangst zu einer größeren und lesbaren Ansicht), © OpenAI

Der Unterschied steckt in der zugrunde liegenden Logik. GPT-5.2 Instant behandelt die Anfrage als potenziell missbrauchsanfällig und bleibt deshalb bei abstrakter, „sicherer“ Hilfe. GPT-5.3 Instant behandelt sie eher wie eine normale Physik- oder Modellierungsfrage und arbeitet direkt mit konkreten Parametern weiter.

Genau hier setzt auch die Debatte an. OpenAI will zeigen, dass ChatGPT weniger blockiert, wenn Antworten grundsätzlich möglich sind. In diesem Beispiel wirkt die neue Direktheit jedoch nicht nur wie weniger Vorbehalte, sondern auch wie ein lockererer Umgang mit bisherigen Sicherheitsgrenzen. Entscheidend wird deshalb sein, bei welchen Themen ChatGPT künftig schneller liefert. Bei unverfänglichen Fragen ist das ein Komfortgewinn. Bei sensiblen Themen könnte genau diese Direktheit problematisch werden.

GPT-5.3 Instant verspricht Qualitäts-Upgrade

OpenAI verbindet den neuen Gesprächsstil mit einem Qualitätsversprechen. Interne Evaluierungen sollen zeigen, dass GPT-5.3 Instant seltener halluziniert. Laut Unternehmen sinkt die Halluzinationsrate um 26,8 Prozent mit Internetzugriff und um 19,7 Prozent ohne Web-Zugriff im Vergleich zu früheren Versionen.

Auch bei der Web-Suche will OpenAI nachbessern. Statt lange Link-Listen oder lose zusammenkopierte Informationsblöcke auszugeben, soll ChatGPT die wichtigsten Treffer stärker gewichten, mit eigenem Wissen verknüpfen und schneller zum Kern kommen. Bei aktuellen Nachrichten soll das Modell eher einordnen und erklären, statt Suchergebnisse einfach nachzuerzählen. Marketing Teams und Creator gewinnen damit Zeit bei Recherche und Content-Arbeit. Gleichzeitig positioniert OpenAI GPT-5.3 Instant stärker als Schreibpartner:in: Das Modell soll sicherer zwischen praktischen Aufgaben und kreativem Schreiben wechseln und dabei konsistenter bleiben – von präzisen Überarbeitungen bis zu immersiver Prosa. Damit verfolgt OpenAI weiter das Ziel, ChatGPT als Alltagswerkzeug zu etablieren, das schnell liefert.

Ganz ohne Einschränkungen kommt das Update jedoch nicht. Laut OpenAI klingt der Antwortstil in einigen nicht-englischen Sprachen weiterhin teilweise gestelzt oder zu stark an englischen Formulierungen orientiert, etwa auf Japanisch oder Koreanisch. Auch beim Ton sieht das Unternehmen noch Verbesserungsbedarf und will Feedback weiter auswerten. Unterm Strich soll GPT-5.3 Instant ChatGPT angenehmer nutzbar machen, weil Antworten schneller und weniger verkopft wirken. Ob Nutzer:innen dem Update vertrauen, hängt jedoch davon ab, ob das Modell auch weiterhin zuverlässig stoppt, wenn es heikel wird.


Adobe, Audible und Co.

– Advertiser verraten, warum sie auf ChatGPT werben

Einkaufstaschen-Icon mit Haken darin, Farbverlauf violett-blau im Hintergrund
© OpenAI via Canva





Source link

Online Marketing & SEO

Claude Opus 4.7 ist da: Das kann Anthropics stärkstes Modell


Claude Opus 4.7 liefert präzisere Ergebnisse, verarbeitet Bilder in deutlich höherer Qualität und übernimmt komplexe Tasks zuverlässiger. Gleichzeitig steigen Token-Kosten und Sicherheitsregeln werden strenger.

Mit Claude Opus 4.7 kommt etwa zwei Monate nach dem 4.6-Update ein Modell, das genau dort ansetzt, wo viele Teams mit KI noch kämpfen – bei der Verlässlichkeit im Alltag. Erste Tests zeigen, dass Tasks stabiler durchlaufen und weniger Nacharbeit erfordern. In internen Evaluierungen auf Basis von SWE-bench Pro und OSWorld erreicht Opus 4.7 beispielsweise 64,3 Prozent bei agentischer Codierung und 78 Prozent bei agentischer Computerarbeit.

Tabelle mit Benchmark-Ergebnissen von Claude Opus 4.7 im Vergleich zu Opus 4.6, GPT-5.4, Gemini 3.1 Pro und Mythos Preview, inklusive Werte für Coding, Tool Use, Reasoning und visuelle Aufgaben.
Leistungsübersicht von Claude Opus 4.7, © Anthropic

Opus 4.7 ist ab sofort breit verfügbar und läuft auf claude.ai, über die Claude-Plattform sowie in allen großen Cloud-Umgebungen. Für User heißt das, die neue Version lässt sich ohne Umwege in bestehende Workflows einbauen. Gleichzeitig bleibt es nicht bei Anthropics eigenen Umgebungen. Auch bei Perplexity übernimmt Opus 4.7 die Rolle des Standardorchestrierungsmodells für komplexe Computer-Tasks und ist für Max-Abonnent:innen auf Web, iOS und Android verfügbar.


Anthropic erweitert Claude Code um Channels für Messenger

Grafik mit der Aufschrift „Computer Use“ und stilisiertem Icon, das die neue Funktion in Claude Code visualisiert, mit der KI Apps bedienen und Prozesse ausführen kann
© Anthropic via Canva

Die wichtigsten Upgrades von Opus 4.7

Claude Opus 4.6 hat im Februar die Basis gelegt. Mehr Kontext, stabilere agentische Abläufe und erste Ansätze zur Selbstprüfung machten längere Tasks verlässlich umsetzbar. Mit Opus 4.7 knüpft Anthropic genau daran an. Das Modell arbeitet bei langlaufenden Aufgaben konsequenter, setzt Anweisungen exakter um und überprüft eigene Ergebnisse, bevor sie zurückgegeben werden. Anspruchsvolle Tasks lassen sich damit mit weniger Kontrolle übergeben, auch wenn es weiterhin wichtig bleibt, KI-Ergebnisse zu prüfen, um möglichen Fehlern oder Halluzinationen entgegenzuwirken.

Der Fortschritt zeigt sich besonders bei visuellen Aufgaben. Opus 4.7 verarbeitet Bilder mit mehr als dreifacher Auflösung und erkennt Details, die zuvor oft verloren gingen. Interfaces, Präsentationen und Dokumente wirken dadurch sauberer ausgearbeitet, weil das Modell feiner auf Layout und Struktur reagiert.

Mit der neuen xhigh-Effort-Stufe ergänzt Anthropic die bisherigen Optionen high und max und schafft eine Zwischenstufe für den Rechenaufwand. Aufgaben lassen sich damit gezielter zwischen Geschwindigkeit und Gründlichkeit austarieren. Ergänzend führen Task Budgets in der Beta einen klaren Rahmen für längere Prozesse ein und helfen, Ressourcen besser zu planen. Der neue /ultrareview-Befehl prüft Änderungen Schritt für Schritt und markiert Schwachstellen ähnlich wie ein Review im Team. Gleichzeitig läuft der erweiterte Automatikmodus länger durch, ohne ständig nach Bestätigung zu fragen. Gerade bei komplexeren Tasks sorgt das für deutlich weniger Unterbrechungen. Zudem wurde der Automatikmodus auf Max User ausgeweitet.

Teurer im Einsatz, strenger im Zugriff

Die Preise bleiben unverändert bei fünf US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token. Gleichzeitig steigt der Bedarf an Tokens pro Aufgabe, weil Opus 4.7 Inhalte detaillierter verarbeitet. Durch den neuen Tokenizer und intensiveres Reasoning können laut Anthropic je nach Use Case bis zu 1,35-mal mehr Tokens anfallen. Einzelne Tasks werden damit potenziell teurer, obwohl sich am Preismodell nichts geändert hat. Umso wichtiger wird es, Prompts und Workflows effizient aufzusetzen.

Mit dem Glasswing-Projekt testet Anthropic, wie sich neue KI-Modelle schrittweise und kontrolliert veröffentlichen lassen. Opus 4.7 dient dabei als erstes Testmodell, an dem neue Sicherheitsmechanismen erprobt werden. Bestimmte Cyber-Fähigkeiten wurden bewusst eingeschränkt, gleichzeitig erkennt das System riskante oder missbräuchliche Anfragen und blockiert sie automatisch. In den Sicherheitsbewertungen, die auf Anthropics eigenen Evaluierungen basieren, gilt das Modell als „weitgehend gut abgestimmt und vertrauenswürdig“, zeigt aber weiterhin Schwächen in sensiblen Bereichen. Positiv fällt die verbesserte Widerstandsfähigkeit gegen Prompt-Injection-Angriffe auf, also Versuche, das Modell absichtlich durch eingeschleuste Vorgaben zu manipulieren, die Sicherheitsregeln umgehen sollen. Für erlaubte Sicherheitsanwendungen wie das Testen eigener Systeme oder das Finden von Schwachstellen setzt Anthropic auf ein Verifizierungsprogramm statt offenen Zugriff.





Source link

Weiterlesen

Online Marketing & SEO

Aprilscherz wird Realität: Ikea bringt Köttbullar-Lolli an den Start


Den Köttbullar-Lolli gibt es bald in ausgewählten Einrichtungshäusern.

Lidl hat es vorgemacht, jetzt zieht Ikea nach: Aus einem Aprilscherz wird ein echtes Produkt. Das schwedische Möbelhaus bringt den Köttbullar-Lolli in ausgewählte Filialen.

Schon allein das Auspacken wird ein Erlebnis werden. Der Genuss vielleicht auch. Ikea bringt gemeinsam mit Chupa Chups einen limitierten Köttbular-Lolli in ausgewählte Märkte in Deutschland, Schweiz, Österreich, Polen und Italien. Kostenlos und zum Entdecken. „Diese ungewöhnliche Kreation vereint einen schwedischen Klassiker mit der verspielten Kreativität von Chupa Chups und verleiht Aromen eine witzige Note“, erklärt das Unternehmen. Süß, am Stiel. Und ebenso wichtig: Der Lolli wird komplett vegan sein und soll das herzhafte Fleischaroma mit den süßen Noten der Preiselbeere verbinden. #

Apple-Moment am Dönerimbiss

Lidl: So lief das Döner-Croissant-Event mit Muca Kebap

Döner-Croissant, T-Shirts und eine lange Schlange. Der Aprilscherz von Lidl wurde am vergangenen Samstag in Berlin zu einem Happening. Die Discounter-Marke profitiert – mal wieder.

Eigentlich war die Idee nur als Aprilscherz gedacht. Doch wie beim Döner-Croissant von Lidl waren die Reaktionen der Netzgemeinde so positiv, dass sich das Möbelhaus jetzt traut, sein klassisches Tellergericht mal anders zu servieren. „1000 Likes, dann machen wir es vielleicht wirklich“, hatte das Möbelhaus in einem weiteren Post nach dem Aprilscherz versprochen. Und die sammelte das Unternehmen mal eben locker auf Instagram und Co. ein. Ikea bleibt sich als Marke dabei durchaus treu: Augenzwinkernd und überraschend.
Jetzt muss man nur auf die ersten Erlebnisberichte auf Instagram und Tiktok warten. Und die werden kommen. Da kann man fast drauf wetten. .



Source link

Weiterlesen

Online Marketing & SEO

Ist das die Wende?: Deutscher Werbemarkt dreht im März deutlich ins Plus


Die Außenwerbung boomt – selbst bei denen, die sie ablehnen

Na bitte, geht doch! Die deutsche Werbekonjunktur kommt allmählich doch noch in Schwung. Darauf deutet zumindest die Entwicklung der Brutto-Werbeausgaben hin. Nachdem es im Februar um gut 3 Prozent bergab gegangen war, gab es im März nun ein deutliches Plus. Vor allem zwei Gattungen konnten kräftig zulegen.

Gut 3 Milliarden Euro brutto haben Unternehmen in Deutschland im März für TV-und Kino-Spots, Printanzeigen, Außenwerbung, Radio-C

Jetzt Angebot wählen und weiterlesen!

1 Monat

29 €

  • zum Testen
  • danach 36,50 € mtl.

12 Monate

329 €

  • anstatt 439 €
  • 110€ sparen

24 Monate

529 €

  • anstatt 878 €
  • 349 € sparen

HORIZONT Digital

  • Vollzugriff auf HORIZONT Online mit allen Artikeln
  • E-Paper der Zeitung und Magazine
  • Online-Printarchiv

HORIZONT Digital-Mehrplatzlizenz für Ihr Team



Source link

Weiterlesen

Beliebt