Künstliche Intelligenz
Trotz schwacher Konjunktur und Autokrise: Bosch rechnet mit mehr Umsatz
Stagnierende Fahrzeugproduktion, schwache Nachfrage sowie Probleme bei Elektromobilität und automatisiertem Fahren: Darunter haben ganz besonders Autozulieferer zu leiden. Dennoch rechnet Bosch in diesem Jahr mit einem Umsatzplus von etwa zwei Prozent für seinen Zulieferbereich Bosch Mobility. Das teilte das Unternehmen anlässlich der Automesse IAA Mobility in München mit. Die größte Geschäftssparte macht mehr als 60 Prozent des Gesamtumsatzes von gut 90 Milliarden Euro aus. Für den verhaltenen Optimismus macht Bosch mehrere Faktoren verantwortlich.
Hard- und Software aus einer Hand
Als Lieferant von Antrieben, Sicherheitssystemen, Lenk- und Bremssystemen sowie Sensoren, liefert Bosch Hard- und die dazu passende Software. „Bosch kann beides: Software und Hardware“, meint Chef Dr. Stefan Hartung. „Ohne anspruchsvolle Hardware bewegt sich selbst das klügste Auto keinen einzigen Millimeter.“ Zudem hat sich Künstliche Intelligenz zu einer wichtigen Säule des Kerngeschäfts entwickelt. Bosch hat nach eigener Aussage in China einen Hochleistungscomputer für ein Cockpit geliefert, mit dem man in natürlicher Sprache interagieren kann.
Um die Umsatzziele zu erreichen und die Folgen der Krise abzufedern, verfolgt Bosch bereits seit Ende 2023 eine Reihe von Sparprogrammen. In deren Rahmen hat der Konzern in den vergangenen Jahren mehrere tausend Stellen gestrichen. Weitere sollen in den kommenden Jahren folgen.
(aki)
Künstliche Intelligenz
Liveticker zur iPhone-Keynote: Ab 19 Uhr alles zu iPhone 17, Apple Watch und Co.
Jetzt ist es soweit: Ab 19 Uhr mitteleuropäischer Zeit steigt Apples diesjährige iPhone-Präsentation. Mindestens vier neue Smartphones werden erwartet: ein Standardmodell als iPhone 17, ein iPhone 17 Air mit neuem, dünnen Formfaktor sowie zwei Pro-Varianten – iPhone 17 Pro und 17 Pro Max. Außerdem könnte es drei neue Apple Watches und eventuell neue AirPods Pro geben. Alle Infos finden Sie jetzt hier in unserem Liveticker:
Herzlich willkommen beim Mac & i-Liveticker!
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Inhalt geladen.
(bsc)
Künstliche Intelligenz
Nvidia Rubin CPX: Spezialbeschleuniger für KI-Inferencing kommt Ende 2026
Nvidia will Ende 2026 einen speziellen Beschleunigerchip auf den Markt bringen, den Rubin CPX. Er soll speziell KI-Anwendungen mit enormen Context-Anforderungen (siehe unten) beschleunigen, denen wiederum eine besonders hohe Profitabilität unterstellt wird. Darunter sind KIs, die Programmcode liefern oder KI-Filme aus dem Nichts erstellen. Rubin CPX soll die spezifischen Flaschenhälse bei der Verarbeitung solcher KI-Modelle gezielt angehen.
Der Chip gehört zu Nvidias 2026 kommender Vera-Rubin-Generation von Rechenzentrumsbeschleunigern, die bereits ihren Tape-Out hinter sich hat. Er ist entweder direkt im Rackeinschub integriert oder als Zusatz-Beschleuniger in separaten Einschüben zu bekommen.
Mixture-of-Experts und Context-Länge
Die aktuell angesagten KI-Modelle wie DeepSeek R1, Llama4 Maverick, gpt-ossm, Qwen3 oder auch Kimi K2 verwenden eine Technik, die man Mixture-of-Experts nennt. Dabei kommen verschieden spezialisierte neuronale Netze (die Experts) für unterschiedliche Anfragen(teile) zum Einsatz. Das wiederum führt bei den einzelnen Experten zu geringeren Anforderungen an Speicher und Rechenleistung.
Der Trick ist, die optimale Mixtur von Experten für jede Anfrage hinzubekommen; die Verteilung der Anfragen auf die Experten wird entscheidend. Gerade in Verbindung mit Reasoning müssen die einzelnen Experten miteinander kommunizieren und das MoE-Modell als Ganzes wird aufwendiger.
Zugleich werden die Antworten von KI-Anwendungen um Größenordnungen komplexer, etwa durch die Ausgabe ganzer Programmcode-Sequenzen oder künstlich erzeugter Filme. Das lässt die Anzahl der Token, die ständig berücksichtigt werden müssen, exponentiell ansteigen. Ein Token ist dabei die kleinste Informationseinheit, die innerhalb einer KI eine numerische ID zugewiesen bekommt, um die Berechnungen zu vereinfachen. Ein Token kann Informationen von einem Buchstaben bis hin zu kurzen Phrasen repräsentieren. Schätzungen setzen ein englisches Wort im Durchschnitt mit 1,5 Token gleich.
Nvidias Vera Rubin-Beschleuniger in einer künstlerischen Darstellung. Damit ausgerüstete Systeme sollen 2026 in Rechenzentren ankommen.
Damit die Antwort in sich konsistent ist, muss die KI intern noch weitaus mehr Token bei der Gewichtung berücksichtigen als im Antwortfenster ausgegeben werden, das nennt man Context. Chat-GPT 3.5 hatte anfangs ein Context-Window von 4096 Token. GPT-4o ist schon bei 128.000 Token, Google Gemini 1.5 Pro bei 2 Millionen Token.
Disaggregated Serving
Ein dadurch entstandener Optimierungsansatz ist das entkoppelte Beantworten der Anfragen (disaggregated serving). Dabei werden Context- und Prefill-Stufen bei der Beantwortung einer Anfrage verschiedenen Beschleunigern zugewiesen. Nvidia nutzt das bereits mit aktuellen GB200-Blackwell-Systemen. So arbeiten etwa in den optimierten Einreichungen zu den KI-Benchmarks der MLCommons MLPerf Inference v5.1 von den 72 Blackwell-GPUs eines NVL72-Racks 56 GPUs nur am Context und nur die restlichen 16 erzeugen die Inhalte. Diese Optimierung bringt geschätzt anhand eines ungenau beschrifteten Diagramms einen Performance-Sprung von 40 bis 45 Prozent auf Blackwell.
Nvidia macht sich dabei noch eine Eigenschaft dieser LLMs zunutze: Sie kommen mit entsprechendem Feintuning auch mit recht niedriger Rechengenauigkeit aus, sodass das hauseigene, 4-bittige Floating-Point-Format NVFP4 mit blockweise geteiltem Exponenten für die erforderliche Antwortgenauigkeit bei MLPerf Inference ausreicht.
Von Blackwell zu Rubin (CPX)
Bereits Blackwell Ultra (GB300) hat Nvidia auf maximalen Durchsatz bei diesem Format optimiert. Dafür haben die Ingenieure die Exponent-2-Funktion aufgebohrt, die im Attention-Layer aller KI-Modelle mit Transformer-Technik eine große Rolle spielt. Da diese außerhalb der auf KI-Durchsatz spezialisierten Tensorkerne in den SFU-Einheiten (Special Function Units) laufen, sind sie in Blackwell bereits zum Flaschenhals geworden, denn die EX2-Leistung gegenüber Hopper ist kaum gewachsen. Blackwell Ultra verdoppelt den EX2-Durchsatz gegenüber Blackwell von 5 auf 10,7 Billionen Exponential-Berechnungen pro Sekunde.
Ein NVL72-Schrank GB300 schafft rund 1,1 ExaFLOPS in NVFP4, Rubin NVL144 wird von Nvidia auf 3,6 EFlops projektiert und ein Rubin-CPX-Rack auf satte 8 EFlops.
Ein Rubin CPX soll Ende 2026 gegenüber dem heutigen GB300 den dreifachen Exponential-Durchsatz von 30 PFlops NVFP4 schaffen. Da die Context-Phase weniger schnellen RAM benötigt und hauptsächlich von den Berechnungen limitiert wird, setzt Nvidia bei Rubin CPX auf 128 GByte GDDR7-Speicher.
(csp)
Künstliche Intelligenz
Umfrage: Unternehmen klagen über zu viel Aufwand mit dem Datenschutz
Deutsche Unternehmen sehen sich zunehmend durch Datenschutzregeln belastet, wie aus einer Umfrage des Digitalverbands Bitkom hervorgeht. Demnach hätten 97 Prozent der Befragten einen hohen oder gar sehr hohen Aufwand bei der Umsetzung der Datenschutzvorgaben beklagt. Vor einem Jahr seien das 94 Prozent gewesen.
53 Prozent der befragten Unternehmen hätten dabei von steigendem Aufwand berichtet, 16 Prozent sogar von einem starken Anstieg. Lediglich für 30 Prozent sei die Bürokratie beim Datenschutz gleichgeblieben, keines der befragten Unternehmen habe von Erleichterungen in dem Feld gesprochen. Für die laut Bitkom repräsentative Umfrage wurden den Angaben nach 603 Unternehmen ab 20 Beschäftigten in Deutschland aus allen Branchen herangezogen.
Gerade in kleineren Unternehmen sorgen die Anforderungen des Datenschutzes für Belastungen, befindet der Bitkom. So beklagen 45 Prozent der Unternehmen mit 20 bis 99 Beschäftigten sehr hohen Aufwand, bei Unternehmen mit 500 und mehr Beschäftigten seien es nur 38 Prozent. „Wir haben beim Datenschutz eine viel zu hohe Komplexität geschaffen, mit einer Vielzahl von Aufsichtsbehörden und unterschiedlichen Auslegungen“, kommentierte Bitkom-Präsident Ralf Wintergerst die Ergebnisse der Umfrage. Die Dokumentations- und Berichtspflichten müssten jetzt deutlich reduziert werden, forderte er.
EU-Kommission will Regeln lockern
Auf EU-Ebene ist inzwischen auch Bewegung in die Frage gekommen, ob es Erleichterungen bei der Erfüllung des Datenschutzes geben sollte. Im Mai wurde ein Entwurf der EU-Kommission zur Verschlankung der DSGVO bekannt: So sollen Firmen mit bis zu 749 Mitarbeitern im Wesentlichen von DSGVO-Dokumentationspflichten befreit werden.
Verbraucherschützer und NGOs warnten vor einer möglichen Aufweichung der DSGVO mit dieser Reform. Dem Bitkom gehen die Vorschläge der EU-Kommission aber nicht weit genug. Die Risikoeinstufung der Verarbeitungstätigkeit sollte ausschlaggebend für die Dokumentationspflicht sein, nicht die Unternehmensgröße, fordert der Verband. Außerdem brauche es Maßnahmen wie Standardvorlagen und klarere Regeln für Betroffenenanfragen.
(axk)
-
Datenschutz & Sicherheitvor 3 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
UX/UI & Webdesignvor 3 Wochen
Der ultimative Guide für eine unvergessliche Customer Experience
-
Apps & Mobile Entwicklungvor 3 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
UX/UI & Webdesignvor 1 Woche
Adobe Firefly Boards › PAGE online
-
Online Marketing & SEOvor 3 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
Social Mediavor 3 Wochen
Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
Entwicklung & Codevor 3 Wochen
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 6 Tagen
EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events