Künstliche Intelligenz
DeepSeek V3.2-Exp: Neue Sparse Attention und halbierte API-Kosten
Das chinesische KI-Start-up DeepSeek hat mit V3.2-Exp eine experimentelle Version seines Sprachmodells veröffentlicht und gleichzeitig die Preise für seine API-Dienste um mehr als 50 Prozent gesenkt. Wie das Unternehmen auf seiner Hugging-Face-Seite mitteilte, markiert die neue Version einen Zwischenschritt zur nächsten Generation der KI-Architektur.
Das erst im Jahr 2023 gegründete Unternehmen, das Anfang des Jahres mit seinem R1-Modell für Aufsehen im Silicon Valley gesorgt hatte, arbeitet nach eigenen Angaben mit chinesischen Chipherstellern an der Weiterentwicklung seiner Modelle. Die neue Version V3.2-Exp baut auf dem älteren V3.1-Modell auf und führt eine neue Technik namens DeepSeek Sparse Attention (DSA) ein.
Die Sparse-Attention-Technologie soll die Effizienz bei der Verarbeitung langer Textsequenzen verbessern. Während herkömmliche Attention-Mechanismen bei großen Sprachmodellen alle Tokens gleichzeitig berücksichtigen, konzentriert sich DSA nur auf die relevantesten Bereiche des Inputs. Dies reduziert den Rechenaufwand laut DeepSeek erheblich, ohne die Qualität der Ausgabe wesentlich zu beeinträchtigen.
Parallel zur Modellveröffentlichung kündigte DeepSeek eine drastische Preissenkung für seine API-Dienste um mehr als 50 Prozent an. Die neuen Tarife gelten sofort und sollen dem Unternehmen helfen, mehr Nutzer zu gewinnen. Zum Vergleich bleibt das bisherige V3.1-Terminus-Modell bis zum 15. Oktober 2025 über eine temporäre API verfügbar.
Unterstützung durch Huawei und neue Datenformate
Huawei, der führende Anbieter von KI-Chips in China, kündigte an, dass seine Produkte das neueste DeepSeek-Modell unterstützen werden.
DeepSeek hat außerdem angegeben, dass die neuesten Versionen seiner Modelle mit simplen 8-Bit-Gleitkommawerten (Floating Point 8, FP8) umgehen kann, während an der Implementierung von BF16 (Brain Floating Point 16) gearbeitet wird. FP8 ermöglicht theoretisch Speichereinsparungen und schnellere Berechnungen, da es weniger Speicherplatz benötigt und die Matrizen vergleichsweise simpel sind. Obwohl FP8 weniger präzise ist als klassische Formate wie FP32, gilt es für KI-Anwendungen als ausreichend genau.
BF16 hingegen stellt einen Kompromiss zwischen Geschwindigkeit und Präzision dar. Die Unterstützung beider Formate soll es ermöglichen, große Modelle auch auf Hardware mit begrenzten Ressourcen zu betreiben.
API-Preise um 50 Prozent gesenkt
Mit der Preissenkung um mehr als 50 Prozent positioniert sich DeepSeek aggressiv im umkämpften KI-API-Markt. Das Unternehmen reiht sich damit in eine Reihe chinesischer Start-ups ein, die durch niedrige Preise Marktanteile gewinnen wollen. Input-Token kosten bei DeepSeek künftig 0,28 US-Dollar pro Million Token statt bislang 0,56 US-Dollar. Mit Cache sinkt der Preis sogar auf 0,028 US-Dollar. Eine Million Output-Token kosten 0,42 US-Dollar. Vorbehalte gegenüber chinesischen Modellen gibt es beim Datenschutz und der staatlichen Zensur Chinas.
(mki)
Künstliche Intelligenz
heise+ Update vom 14. November 2025: Lesetipps zum Wochenende
Liebe Leserinnen und Leser,
der Blick in den klaren Nachthimmel ist faszinierend. Vom leuchtenden Mond über Sternbilder und teils sogar Kugelsternhaufen lässt sich vieles mit dem bloßen Auge bestaunen. In seltenen Fällen wird es dabei richtiggehend magisch – nämlich wenn starke Sonnenstürme Polarlichter bis in unsere Gefilden bringen. Dies war in dieser Woche der Fall und sorgte für atemberaubende Bilder, die quer durchs Netz geteilt wurden.
Wer schon einmal ein Polarlicht gesehen hat, stellt sich automatisch die Frage: Wieso strahlt der Himmel eigentlich grünlich oder rötlich? Wie kommt das alles zustande? Unsere Physikexpertin hat sich dem Phänomen „Aurora Borealis“ gewidmet und erklärt einerseits die Ursachen für die verschiedenen Himmelsfarben, und beantwortet andererseits die Frage, welche Auswirkungen Sonnenstürme auf das Magnetfeld der Erde und für unsere Technik haben. Lesen Sie diesen Artikel, es lohnt sich.
Das war die Leseprobe unseres heise-Plus-Artikels „heise+ Update vom 14. November 2025: Lesetipps zum Wochenende“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Künstliche Intelligenz
Anonymisierendes Linux: Tails 7.2 mit dezenter Versionspflege
Die auch für den mobilen Einsatz auf USB-Stick optimierte anonymisierende Linux-Distribution Tails ist in Version 7.2 verfügbar. Die Entwickler haben kleine Ärgernisse und Probleme beseitigt und Kernkomponenten auf den aktuellen Stand gebracht.
Weiterlesen nach der Anzeige
In der Versionsankündigung schreibt das Tails-Projekt, dass die Entwickler etwa den Tor-Browser auf Version 15.0.1 – ein Versionssprung, zuvor war Version 14.5.8 aktuell – gehievt haben, der seinerseits auf Firefox 140 basiert und dadurch nützliche Neuerungen mitbringt. Dazu zählen vertikale Tabs, Tab-Gruppen und eine neue Adressleiste mit verbesserter Suche. Thunderbird ist hingegen auf Stand 140.4.0 dabei. Hier haben die Programmierer ein Problem ausgebügelt: Thunderbird hat Verbindungen zu Telemetriediensten von Mozilla aufgebaut – das tut es nun nicht mehr. Der Linux-Kernel kommt in Fassung 6.12.57 mit.
Weitere Anpassungen in Tails 7.2
Die Root-Konsole haben die Maintainer entfernt. Um eine Root-Konsole zu erhalten, sollen Nutzerinnen und Nutzer schlicht sudo -i in der normalen Konsole aufrufen. Benachrichtigungen mit der „Nicht erneut nachfragen“-Option erscheinen jetzt erst, nachdem die Uhr mit Netzzeit synchronisiert wurde.
Tails 7.2 steht als Abbild zum Verfrachten auf USB-Sticks zum Herunterladen bereit. Damit lassen sich Rechner abseits der „heimischen Sicherheitszone“ mit geschützter Privatsphäre nutzen. Aber auch zum Brennen auf DVDs oder zum Ausprobieren in der VM gibt es Installationsabbilder in Form von ISO-Images, die das Tails-Projekt zum Download auf einer eigenen Webseite zur Verfügung stellt.
Die Mitte Oktober erschienene Version 7.1 von Tails brachte erste kleine Softwareaktualisierungen und Korrekturen für störende Fehlerchen mit, nachdem die Distribution kurz zuvor mit Version 7.0 auf die aktuelle Debian-Trixie-Basis umgezogen ist.
(dmk)
Künstliche Intelligenz
Aus Softwarefehlern lernen – Teil 8: Rundungs- und Gleitkommafehler
Zahlen erscheinen in der Programmierung oft eindeutig und exakt – zumindest, solange man sich in ganzzahligen Bereichen bewegt. Doch sobald Gleitkommazahlen, Dezimalwerte oder Rundungen ins Spiel kommen, entstehen subtile Probleme. Kleine Ungenauigkeiten, die im ersten Moment harmlos wirken, können sich mit der Zeit summieren und massive Auswirkungen haben.
Weiterlesen nach der Anzeige

Golo Roden ist Gründer und CTO von the native web GmbH. Er beschäftigt sich mit der Konzeption und Entwicklung von Web- und Cloud-Anwendungen sowie -APIs, mit einem Schwerpunkt auf Event-getriebenen und Service-basierten verteilten Architekturen. Sein Leitsatz lautet, dass Softwareentwicklung kein Selbstzweck ist, sondern immer einer zugrundeliegenden Fachlichkeit folgen muss.
Die Teile der Serie „Aus Softwarefehlern lernen“:
Muster 8: Rundung, Trunkierung und kumulative Fehler: Wenn kleine Abweichungen groß werden
Ein lehrreiches Beispiel stammt aus der Finanzwelt, nämlich dem Vancouver Stock Exchange (VSE) in den frühen 80er-Jahren. Der Börsenindex der VSE startete ursprünglich bei 1.000 Punkten. Nach fast zwei Jahren notierte er scheinbar bei rund 524 Punkten – was wie ein dramatischer Markteinbruch aussah. Tatsächlich hatte sich der Markt jedoch kaum verändert. Die Ursache war banal und gleichzeitig folgenschwer: Es handelte sich um Rundungs- und Trunkierungsfehler.
Nach jeder Transaktion wurde der Index nämlich auf drei Dezimalstellen getrimmt – und zwar durch Abschneiden (Trunkierung), nicht durch korrektes Runden. Dieser winzige Verlust setzte sich bei tausenden Updates pro Tag fort. Die kumulativen Fehler führten nach und nach zu einer schleichenden Absenkung des Index, bis er fast halbiert war. Erst nach einer umfassenden Korrektur sprang er schlagartig wieder auf rund 1.098 Punkte hoch.
Dieses Muster findet sich nicht nur im Finanzbereich. Jede Software, die periodisch Berechnungen durchführt, Zwischenergebnisse speichert oder fortlaufend Rundungen vornimmt, kann in die gleiche Falle tappen. Typische Beispiele:
- Zinsberechnungen und Zahlungspläne: Falsch gerundete Centbeträge, die sich über Monate auf Hunderttausende summieren.
- Statistiken und Berichte: Prozentwerte, die bei jeder Aggregation minimal nach unten oder oben verzerrt werden.
- Physik- und Simulationstools: Kleine Ungenauigkeiten in Gleitkommawerten, die über tausende Iterationen davonlaufen.
- Spiele und Echtzeitanimationen: Ein ständiger minimaler Fehler in der Position kann nach Minuten oder Stunden sichtbar werden.
Das Perfide an dieser Fehlerklasse ist, dass die ersten Ergebnisse durchaus plausibel aussehen. Eine Zahl wie 99,999 statt 100,0 fällt nicht notwendigerweise auf – bis sie tausendfach akkumuliert ist. Kumulative Rundungsfehler können dabei auf verschiedene Weise Schaden anrichten:
Weiterlesen nach der Anzeige
- Falsche Geschäftsentscheidungen: Ein Unternehmen könnte fälschlicherweise glauben, dass ein Portfolio Wert verliert oder eine bestimmte Handelsstrategie unprofitabel ist.
- Fehlerhafte Auswertungen und Alarmierungen: Monitoring-Systeme, die Schwellenwerte überwachen, können falsche Warnungen auslösen oder echte Probleme übersehen.
- Rechtliche und steuerliche Probleme: Schon minimale Differenzen in Geldbeträgen können zu Compliance-Verstößen oder Kundenbeschwerden führen.
Tatsächlich ist es sehr einfach, passende Gegenmaßnahmen für stabile Zahlen zu ergreifen – wie so oft muss diese nur auch jemand umsetzen:
- Dezimalarithmetik verwenden: Für Geld und präzise Berechnungen niemals Binär-Gleitkommazahlen (wie
floatoderdouble) nutzen, sondern dezimale Typen wiedecimalin C#,BigDecimalin Java oder Bibliotheken wiedecimal.jsin JavaScript. - Rundungsstrategie explizit festlegen: Ob Banker’s Rounding, mathematisches Runden oder Trunkierung – die Regel muss dokumentiert und einheitlich umgesetzt sein.
- Rekalkulationen from scratch: Wenn die Notwendigkeit besteht, Daten zu aggregieren oder fortzuschreiben, sollte das System regelmäßig aus den Rohdaten neu berechnen, um Drifts zu erkennen und zu korrigieren.
- Property-Based Testing und Langzeitsimulationen: Tests, die viele Iterationen simulieren, decken schleichende Effekte auf, bevor sie produktiv Schaden anrichten.
Viele Entwicklerinnen und Entwickler neigen dazu, Rundungsfragen als Detail zu betrachten. Es wirkt harmlos – bis es reale Folgen hat. Das Beispiel der Vancouver Stock Exchange zeigt, dass ein halber Punkt Verlust pro Transaktion in der Summe Milliarden an Marktverschiebung auslösen kann.
Wer präzise arbeitet, behandelt Zahlen nicht als bloße Technikfrage, sondern als Teil des Domänenmodells. Geldbeträge, Sensorwerte oder wissenschaftliche Messungen haben oft klare Regeln, wie sie zu runden oder darzustellen sind – und genau diesen Regeln muss auch die Software folgen.
(who)
-
UX/UI & Webdesignvor 3 MonatenDer ultimative Guide für eine unvergessliche Customer Experience
-
UX/UI & Webdesignvor 3 MonatenAdobe Firefly Boards › PAGE online
-
Apps & Mobile Entwicklungvor 3 MonatenGalaxy Tab S10 Lite: Günstiger Einstieg in Samsungs Premium-Tablets
-
Social Mediavor 3 MonatenRelatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
Datenschutz & Sicherheitvor 2 MonatenHarte Zeiten für den demokratischen Rechtsstaat
-
UX/UI & Webdesignvor 4 WochenIllustrierte Reise nach New York City › PAGE online
-
Entwicklung & Codevor 3 MonatenPosit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 2 MonatenEventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events
