Connect with us

Künstliche Intelligenz

DeepSeek V3.2-Exp: Neue Sparse Attention und halbierte API-Kosten


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Das chinesische KI-Start-up DeepSeek hat mit V3.2-Exp eine experimentelle Version seines Sprachmodells veröffentlicht und gleichzeitig die Preise für seine API-Dienste um mehr als 50 Prozent gesenkt. Wie das Unternehmen auf seiner Hugging-Face-Seite mitteilte, markiert die neue Version einen Zwischenschritt zur nächsten Generation der KI-Architektur.

Das erst im Jahr 2023 gegründete Unternehmen, das Anfang des Jahres mit seinem R1-Modell für Aufsehen im Silicon Valley gesorgt hatte, arbeitet nach eigenen Angaben mit chinesischen Chipherstellern an der Weiterentwicklung seiner Modelle. Die neue Version V3.2-Exp baut auf dem älteren V3.1-Modell auf und führt eine neue Technik namens DeepSeek Sparse Attention (DSA) ein.

Die Sparse-Attention-Technologie soll die Effizienz bei der Verarbeitung langer Textsequenzen verbessern. Während herkömmliche Attention-Mechanismen bei großen Sprachmodellen alle Tokens gleichzeitig berücksichtigen, konzentriert sich DSA nur auf die relevantesten Bereiche des Inputs. Dies reduziert den Rechenaufwand laut DeepSeek erheblich, ohne die Qualität der Ausgabe wesentlich zu beeinträchtigen.

Parallel zur Modellveröffentlichung kündigte DeepSeek eine drastische Preissenkung für seine API-Dienste um mehr als 50 Prozent an. Die neuen Tarife gelten sofort und sollen dem Unternehmen helfen, mehr Nutzer zu gewinnen. Zum Vergleich bleibt das bisherige V3.1-Terminus-Modell bis zum 15. Oktober 2025 über eine temporäre API verfügbar.

Huawei, der führende Anbieter von KI-Chips in China, kündigte an, dass seine Produkte das neueste DeepSeek-Modell unterstützen werden.

DeepSeek hat außerdem angegeben, dass die neuesten Versionen seiner Modelle mit simplen 8-Bit-Gleitkommawerten (Floating Point 8, FP8) umgehen kann, während an der Implementierung von BF16 (Brain Floating Point 16) gearbeitet wird. FP8 ermöglicht theoretisch Speichereinsparungen und schnellere Berechnungen, da es weniger Speicherplatz benötigt und die Matrizen vergleichsweise simpel sind. Obwohl FP8 weniger präzise ist als klassische Formate wie FP32, gilt es für KI-Anwendungen als ausreichend genau.

BF16 hingegen stellt einen Kompromiss zwischen Geschwindigkeit und Präzision dar. Die Unterstützung beider Formate soll es ermöglichen, große Modelle auch auf Hardware mit begrenzten Ressourcen zu betreiben.

Mit der Preissenkung um mehr als 50 Prozent positioniert sich DeepSeek aggressiv im umkämpften KI-API-Markt. Das Unternehmen reiht sich damit in eine Reihe chinesischer Start-ups ein, die durch niedrige Preise Marktanteile gewinnen wollen. Input-Token kosten bei DeepSeek künftig 0,28 US-Dollar pro Million Token statt bislang 0,56 US-Dollar. Mit Cache sinkt der Preis sogar auf 0,028 US-Dollar. Eine Million Output-Token kosten 0,42 US-Dollar. Vorbehalte gegenüber chinesischen Modellen gibt es beim Datenschutz und der staatlichen Zensur Chinas.


(mki)



Source link

Künstliche Intelligenz

Apples erste Bugfix-Welle für 26er-Betriebssysteme ist da


Bugfix für alle: iOS 26.0.1, iPadOS 26.0.1, macOS 26.0.1, visionOS 26.0.1, tvOS 26.0.1 und watchOS 26.0.2 stehen nun zum Download bereit. Apple behebt damit erste aufgetretene Fehler seiner neuen Betriebssysteme.

So teilt Apple mit, dass iOS 26.0.1 Probleme im Zusammenhang mit WLAN- und Bluetooth-Verbindungen bei iPhone 17, 17 Pro, 17 Pro Max und Air behebt. Dabei ging es offenbar um Inkompatibilitäten und/oder den Stromsparmodus des neuen Apple-Funkchips N1. Fotos, die unter bestimmten Lichtbedingungen mit den vier neuen iPhones aufgenommen wurden, enthielten teils schwarze Artefakte, die nicht mehr vorkommen sollen.

„Einige“ iPhones konnten sich zudem nach dem Upgrade auf Version 26 nicht mehr mit dem Mobilfunknetz verbinden. Schließlich wurden noch Bugs bei der Icon-Darstellung (die nach Veränderung der Farbeinstellung leer blieben) und der Sprachsteuerung VoiceOver gefixt – letzteres war potenziell ein schwerwiegendes Problem für sehbehinderte Menschen. iPadOS 26.0.1 behebt das VoiceOver-Problem, eventuell auch den eigen Fehler sowie einen Bug, bei dem die Bildschirmtastatur sich an unerwartete Stellen bewegt hat. Unklar ist noch, ob Apple auch ein Problem im Zusammenhang mit dem Download von Apple-Intelligence-Grundmodellen auf den neuen iPhones behebt.

macOS 26.0.1 fixt einen Bug, der dazu führte, dass das Betriebssystem nicht auf Mac-Studio-M3-Ultra-Maschinen installieren weden konnte. Auch weitere Fehlerbehebungen sollten enthalten sein. watchOS 26.0.2 (das auf watchOS 26.0.1 folgt, das Satelliten-Funktionen der Apple Watch Ultra 3 für Mexiko freischaltete) enthält ebenfalls Fehlerbehebungen, genauso wie visionOS 26.0.1, tvOS 26.0.1 und die HomePod-Software 26.0.1.

Zudem werden Sicherheitslöcher gestopft. In iOS 26.0.1 und iPadOS 26.0.1 ist dies ein Bug im FontParser, der Apps zum Absturz bringen konnte und Prozessspeicher korrumpierte. Dieser Fehler steckte auch in macOS 26.0 und ist in macOS 26.0.1 behoben. Fixes dafür stecken ebenfalls in visionOS 26.0.1, nicht hingegen in watchOS 26.0.2 und tvOS 26.0.1, die laut Apple keine Sicherheitsverbesserungen enthalten. Die FontParser-Lücke wird übrigens auch in macOS 14.8.1 (Sonoma), macOS 15.7.1 (Sequoia) und iOS 18.7.1 und iPadOS 18.8.1 gestopft.


(bsc)



Source link

Weiterlesen

Künstliche Intelligenz

Snapchat verlangt Geld für das Bewahren von „Memories“


Der Messenger Snapchat ist einst damit angetreten, dass einmal angesehene Darstellungen von alleine verschwinden. 2016 kam die Möglichkeit hinzu, eigene Aufnahmen doch dauerhaft zu speichern: Die sogenannten Memories wandern in einen durchsuchbaren Cloudspeicher. Wer das intensiv beansprucht, muss bald dafür zahlen.

Die gute Nachricht: bis fünf GByte gespeicherter Memories bleiben sie gebührenfrei. Damit werde das Angebot für die weitaus überwiegende Zahl der Snapchat-User (Snapchatter) gebührenfrei bleiben, sagt Betreiber Snap, Inc. Über 5 GByte hinausgehendes Speichervolumen bleibe für zwölf Monate unangetastet. Ansonsten müssen Snapchatter bezahlen.

In den USA sind für bis zu 100 GB Memories zwei US-Dollar pro Monat fällig. Es gibt laut Mitteilung noch zwei größere Pakete: Bis zu 250 GByte kostet es das Doppelte. Wer damit kein Auslangen findet, muss ein echter Enthusiast sein, der 16 Dollar monatlich dafür springen lassen muss.

Snapchat reagierte mit der Einführung der Memories 2016 darauf, dass viele Nutzer die App auch als Kamera-Anwendung einsetzen. Seither sind mehr als eine Billion „Memories“ hochgeladen worden. Mit diesem Erfolg habe er nicht gerechnet, sagt Betreiber Snap. Leider gehen so große Cloudspeicher mit der Zeit richtig ins Geld.

Mit dem Preis von zwei Dollar für bis zu 100 GByte orientiert sich Snap am Preis Signals. Der ende-zu-ende-verschlüsselte Messenger bietet seit kurzem verschlüsselte Online-Backups als Beta-Feature in Signal an. Die jüngsten 45 Tage des Chatverlaufs samt Dateien hochzuladen ist gratis, ansonsten werden zwei Dollar für bis zu 100 GByte fällig. Zu Beginn muss das ganze Archiv hochgeladen werden, dann folgen täglich inkrementelle Uploads.

Bald möchte der nicht gewinnorientierte Signal-Betreiber zudem ermöglichen, Speicher am eigenen Handy freizugeben und durch scrollen stückweise auf das Online-Backup zuzugreifen. Das dürfte besonders Ursula von der Leyen (CDU) freuen, weil sie dann nicht mehr auf die Selbstlösch-Funktion Signals zurückgreifen muss, um zu verhindern, dass ihrem Handy der Speicherplatz ausgeht. Damit wird die Präsidenten der Europäischen Kommission endlich jene Transparenz gewähren können, nach der sie sicherlich strebt.


(ds)



Source link

Weiterlesen

Künstliche Intelligenz

Starkes Wachstum: Deutschlands Rechenzentren drohen, zum Flaschenhals zu werden


KI und Digitalisierung treiben die Branche, doch Deutschlands Rechenzentren drohen, zum Flaschenhals zu werden. Nach einer Studie kann das sogar Folgen für die digitale Souveränität haben.

Die deutsche Internetwirtschaft soll in den kommenden fünf Jahren jährlich um durchschnittlich 9,7 Prozent wachsen. Das ergab eine Studie der Unternehmensberatung Arthur D. Little im Auftrag des Branchenverbandes eco. Der Umsatz der Branche wird demnach von 245 Milliarden Euro im Jahr 2025 auf 389 Milliarden Euro im Jahr 2030 steigen.

Die Studie nennt zwei Hauptursachen für das Wachstum. Zum einen durchdringe die Digitalisierung sämtliche Lebens- und Arbeitsbereiche. Zum anderen würden Unternehmen und Verbraucher zunehmend KI-Technologien nutzen. Der Einsatz von Künstlicher Intelligenz bilde die Grundlage der aktuellen Dynamik und schaffe neue Geschäftsmodelle.

Die Studienautoren prognostizieren, dass die IT-Anschlussleistung von Rechenzentren in Deutschland bis 2030 um rund 50 Prozent steigen wird, von 2,4 auf 3,7 Gigawatt. Sie berechnen jedoch gleichzeitig, dass die Nachfrage der Wirtschaft dann mindestens dreimal bis zu fünfmal so hoch sein wird, nämlich bis zu 12 Gigawatt. Damit droht Deutschland, im internationalen Wettbewerb weiter zurückzufallen. Die USA verfügen bereits heute über die 20-fache Kapazität Deutschlands.

Ohne zusätzliche Kapazitäten werden der Studie zufolge Rechenlasten ins Ausland verlagert, was die digitale Souveränität Deutschlands gefährden würde. Der eco-Verband macht für die Infrastrukturlücken vor allem einen schleppenden Glasfaserausbau, eine zögerliche Digitalisierung im Mittelstand und fehlende Plattformkompetenz verantwortlich.

Der Vorstandsvorsitzende des eco-Verbandes, Oliver Süme, warnte, ohne entschlossenes politisches Handeln könnte der Wachstumsboom ins Leere laufen. „KI und Automatisierung lassen die Nachfrage nach Rechenleistung und schnellen Netzen explodieren. Die aktuellen Bedingungen am Standort Deutschland erlauben es uns aber gar nicht, die entsprechenden Kapazitäten zeitgerecht dem Markt zur Verfügung zu stellen.“ Dies habe auch mit politischen Versäumnissen zu tun, sagte Süme.

Konkret fordert der Verband von der Politik, den Zugang zu bezahlbarem, grundlastfähigem Strom sicherzustellen. Die hohen Industriestrompreise in Deutschland lägen mit rund 23 Cent pro Kilowattstunde 25 Prozent über dem EU-Durchschnitt. Dies stelle ein gravierendes Standortproblem dar und mindere die internationale Wettbewerbsfähigkeit der Betreiber.


(aki)



Source link

Weiterlesen

Beliebt