Künstliche Intelligenz

Nvidia Rubin CPX: Spezialbeschleuniger für KI-Inferencing kommt Ende 2026

Nvidia will Ende 2026 einen speziellen Beschleunigerchip auf den Markt bringen, den Rubin CPX. Er soll speziell KI-Anwendungen mit enormen Context-Anforderungen (siehe unten) beschleunigen, denen wiederum eine besonders hohe Profitabilität unterstellt wird. Darunter sind KIs, die Programmcode liefern oder KI-Filme aus dem Nichts erstellen. Rubin CPX soll die spezifischen Flaschenhälse bei der Verarbeitung solcher KI-Modelle gezielt angehen.

Der Chip gehört zu Nvidias 2026 kommender Vera-Rubin-Generation von Rechenzentrumsbeschleunigern, die bereits ihren Tape-Out hinter sich hat. Er ist entweder direkt im Rackeinschub integriert oder als Zusatz-Beschleuniger in separaten Einschüben zu bekommen.

Mixture-of-Experts und Context-Länge

Die aktuell angesagten KI-Modelle wie DeepSeek R1, Llama4 Maverick, gpt-ossm, Qwen3 oder auch Kimi K2 verwenden eine Technik, die man Mixture-of-Experts nennt. Dabei kommen verschieden spezialisierte neuronale Netze (die Experts) für unterschiedliche Anfragen(teile) zum Einsatz. Das wiederum führt bei den einzelnen Experten zu geringeren Anforderungen an Speicher und Rechenleistung.

Der Trick ist, die optimale Mixtur von Experten für jede Anfrage hinzubekommen; die Verteilung der Anfragen auf die Experten wird entscheidend. Gerade in Verbindung mit Reasoning müssen die einzelnen Experten miteinander kommunizieren und das MoE-Modell als Ganzes wird aufwendiger.

Zugleich werden die Antworten von KI-Anwendungen um Größenordnungen komplexer, etwa durch die Ausgabe ganzer Programmcode-Sequenzen oder künstlich erzeugter Filme. Das lässt die Anzahl der Token, die ständig berücksichtigt werden müssen, exponentiell ansteigen. Ein Token ist dabei die kleinste Informationseinheit, die innerhalb einer KI eine numerische ID zugewiesen bekommt, um die Berechnungen zu vereinfachen. Ein Token kann Informationen von einem Buchstaben bis hin zu kurzen Phrasen repräsentieren. Schätzungen setzen ein englisches Wort im Durchschnitt mit 1,5 Token gleich.

Nvidias Vera Rubin-Beschleuniger in einer künstlerischen Darstellung. Damit ausgerüstete Systeme sollen 2026 in Rechenzentren ankommen.

Damit die Antwort in sich konsistent ist, muss die KI intern noch weitaus mehr Token bei der Gewichtung berücksichtigen als im Antwortfenster ausgegeben werden, das nennt man Context. Chat-GPT 3.5 hatte anfangs ein Context-Window von 4096 Token. GPT-4o ist schon bei 128.000 Token, Google Gemini 1.5 Pro bei 2 Millionen Token.

Disaggregated Serving

Ein dadurch entstandener Optimierungsansatz ist das entkoppelte Beantworten der Anfragen (disaggregated serving). Dabei werden Context- und Prefill-Stufen bei der Beantwortung einer Anfrage verschiedenen Beschleunigern zugewiesen. Nvidia nutzt das bereits mit aktuellen GB200-Blackwell-Systemen. So arbeiten etwa in den optimierten Einreichungen zu den KI-Benchmarks der MLCommons MLPerf Inference v5.1 von den 72 Blackwell-GPUs eines NVL72-Racks 56 GPUs nur am Context und nur die restlichen 16 erzeugen die Inhalte. Diese Optimierung bringt geschätzt anhand eines ungenau beschrifteten Diagramms einen Performance-Sprung von 40 bis 45 Prozent auf Blackwell.

Nvidia macht sich dabei noch eine Eigenschaft dieser LLMs zunutze: Sie kommen mit entsprechendem Feintuning auch mit recht niedriger Rechengenauigkeit aus, sodass das hauseigene, 4-bittige Floating-Point-Format NVFP4 mit blockweise geteiltem Exponenten für die erforderliche Antwortgenauigkeit bei MLPerf Inference ausreicht.

Von Blackwell zu Rubin (CPX)

Bereits Blackwell Ultra (GB300) hat Nvidia auf maximalen Durchsatz bei diesem Format optimiert. Dafür haben die Ingenieure die Exponent-2-Funktion aufgebohrt, die im Attention-Layer aller KI-Modelle mit Transformer-Technik eine große Rolle spielt. Da diese außerhalb der auf KI-Durchsatz spezialisierten Tensorkerne in den SFU-Einheiten (Special Function Units) laufen, sind sie in Blackwell bereits zum Flaschenhals geworden, denn die EX2-Leistung gegenüber Hopper ist kaum gewachsen. Blackwell Ultra verdoppelt den EX2-Durchsatz gegenüber Blackwell von 5 auf 10,7 Billionen Exponential-Berechnungen pro Sekunde.

Ein NVL72-Schrank GB300 schafft rund 1,1 ExaFLOPS in NVFP4, Rubin NVL144 wird von Nvidia auf 3,6 EFlops projektiert und ein Rubin-CPX-Rack auf satte 8 EFlops.

Ein Rubin CPX soll Ende 2026 gegenüber dem heutigen GB300 den dreifachen Exponential-Durchsatz von 30 PFlops NVFP4 schaffen. Da die Context-Phase weniger schnellen RAM benötigt und hauptsächlich von den Berechnungen limitiert wird, setzt Nvidia bei Rubin CPX auf 128 GByte GDDR7-Speicher.

(csp)

Source link

Verwandte Themen:CPX Ende Fur IT KIInferencing kommt Künstliche Intelligenz Nvidia Nvidia Rubin Nvidia Vera Rubin Spezialbeschleuniger

Up Next

Liveticker zur iPhone-Keynote: Ab 19 Uhr alles zu iPhone 17, Apple Watch und Co.

Nicht verpassen

Umfrage: Unternehmen klagen über zu viel Aufwand mit dem Datenschutz

Künstliche Intelligenz

Vorhandene Windows-10-Installationen unter Linux virtualisieren

Es ist eine unbequeme Wahrheit: Die Ära Windows 10 geht zu Ende, ein Wechsel auf ein anderes Betriebssystem, das weiterhin gewartet und mit Updates versorgt wird, ist unvermeidlich. Eine Alternative zum Upgrade auf Windows 11 ist der Umstieg auf Linux, zumal sich die vorhandene Hardware meist unverändert weiter nutzen lässt. Ihr altes Windows 10 müssen Sie dabei nicht sofort aufgeben: Bis Sie für alle Anwendungen Ersatz unter Linux gefunden und Ihre alten Datenbestände migriert haben, können Sie Windows gelegentlich unter Linux starten und zum Beispiel Ihre Steuererklärungen der vergangenen Jahre in Ihrem Steuerprogramm nachschlagen oder die Nebenkostenabrechnung eines Mieters als PDF speichern, auf das Linux-System kopieren und dort ausdrucken.

Auch wenn sich das viele wünschen, Linux kann kein Wunder vollbringen und Ihnen ein auf ewig sicheres Windows 10 im vollen gewohnten Funktionsumfang bescheren. Die wichtigste Sicherheitsmaßnahme ist, dem virtuellen Windows den Internetzugang zu verwehren, damit keine Viren oder Trojaner an Bord kommen können. Das heißt aber auch, dass Ihr Windows künftig keinerlei Online- oder Cloud-Dienste mehr verwenden kann – Sie haben nur noch Zugriff auf lokal gespeicherte Daten. Die Möglichkeit, eine Datei unter Linux herunterzuladen und sie dann in der virtuellen Maschine (VM) unter Windows zu öffnen, sollten Sie nur in Ausnahmefällen und dann mit extremer Vorsicht nutzen: Schlimmstenfalls könnten Sie sich so einen Schädling einfangen.

In einer virtuellen Maschine eingeschlossen kann Windows 10 auch nach dem Wechsel auf Linux gestartet werden.
Ein lokales Netzwerk ohne Anbindung ans Internet garantiert den sicheren Betrieb auch ohne Updates.
Über ein virtuelles Laufwerk lassen sich Dateien zwischen dem Linux-Wirt und dem Windows-Gast austauschen.

Um Windows 10 als virtualisierten Gast unter Linux zu betreiben, benötigen Sie eine Kopie Ihrer Installation im Format VHDX etwa auf einer externen Festplatte. Außerdem sollten Sie bereits unter Windows das Installationspaket für den Dienst für virtuelle Dateisysteme WinFSP und den Installer der Spice Guest Tools im Download-Verzeichnis gespeichert haben, so wie es im vorangegangenen Artikel beschrieben ist. Sollten Sie die Dateien noch nicht heruntergeladen haben, finden Sie an den passenden Stellen in diesem Artikel einen Plan B für den Download.

Das war die Leseprobe unseres heise-Plus-Artikels „Vorhandene Windows-10-Installationen unter Linux virtualisieren“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.

Source link

Künstliche Intelligenz

Gesundheitsumfrage: Ein Viertel nutzt KI zur Selbstdiagnose

Ein Viertel der deutschen Bevölkerung nutzt laut einer Umfrage KI-Anwendungen zur Selbstdiagnose bei Krankheit oder für andere medizinische Fragen. Das ist nach der alljährlichen Erhebung der Unternehmensberatung Deloitte zur Digitalisierung im Gesundheitswesen ein starker Anstieg im Vergleich zum Vorjahr: von 9 auf 25 Prozent.

Bevorzugt konsultiert werden demnach aber nicht die Symptom-Checker von Krankenkassen und medizinischen Einrichtungen, sondern die Anwendungen von ChatGTP und anderen KI-Anbietern. Das liegt nach Einschätzung der Unternehmensberater daran, dass diese generellen KI-Anwendungen leicht zugänglich sind und für Fragen aller Art vielfältig genutzt werden können. An der laut Deloitte repräsentativen Umfrage nahmen im August 1.120 Erwachsene ab 18 Jahren teil.

Geteilte Meinungen über KI in der Medizin

Die Umfrage förderte aber auch zutage, dass der Einsatz künstlicher Intelligenz in der Medizin die Gemüter spaltet: Knapp die Hälfte (49 Prozent) sieht KI im Gesundheitswesen eher als Chance, 30 Prozent eher als Risiko, und 21 Prozent sind unentschlossen.

Ein beträchtlicher Teil der Bevölkerung wäre demnach im Krankheitsfall nach wie vor misstrauisch, wenn die behandelnden Mediziner KI zur Diagnose heranziehen (41 Prozent) oder die Therapie mit Hilfe von KI ausarbeiten (46 Prozent). Für sinnvoll hält eine Mehrheit von gut zwei Dritteln den Einsatz von KI-Apps für Verwaltungsaufgaben im Gesundheitswesen: Abrechnungen, Terminvereinbarungen und dergleichen mehr.

Die zunehmende Verbreitung von KI-Anwendungen im Alltag hat der Umfrage zufolge noch einen weiteren Effekt: Es sinkt die einst weitverbreitete Skepsis, die eigenen Gesundheitsdaten für medizinische Dienstleistungen, Auswertungen, Forschung und andere Zwecke zur Verfügung zu stellen. In diesem Jahr befürworteten das 50 Prozent – das sind 12 Prozentpunkte mehr als vor einem Jahr.

(emw)

Source link

Künstliche Intelligenz

Europäische Firma übernimmt Videoplattform Vimeo

Die amerikanische Videoplattform Vimeo bekommt neue Eigentümer: Bending Spoons aus Mailand bietet 1,38 Milliarden US-Dollar, was 7,85 US-Dollar je Aktie entspricht. Vimeos Verwaltungsrat empfiehlt den Aktionären einstimmig die Annahme des Angebots. Schließlich liegt es 91 Prozent über dem volumengewichteten Durchschnittskurs der jüngsten 60 Tage.

Die Transaktion soll noch dieses Jahr abgeschlossen werden, die Zustimmung von Behörden und Aktionären vorausgesetzt. Dann notiert Vimeo nicht länger an der Börse. „Als Bending Spoons erwerben wir Firmen mit der Erwartung, sie für unbegrenzte Zeit zu besitzen und zu betreiben“, sagte Luca Ferrari, CEO und Mitgründer von Bending Spoons. „Wir sind entschlossen zu ambitionierten Investitionen in den USA und anderen wichtigen Märkten, und in allen Schlüsselbereichen, sowohl bei Dienstleistungen für Kreative als auch für Großunternehmen.“ Die Erwähnung Künstlicher Intelligenz darf in der Mitteilung der Übernahmeofferte natürlich nicht fehlen.

Vimeo hat seinen Sitz in New York City. Die Videoplattform wurde 2004 von Zach Klein und Jake Lodwick als Teil des Unternehmens CollegeHumor ins Leben gerufen, einige Monate vor YouTube. 2006 übernahm IAC die Mehrheit an Vimeo, 2008 schieden Klein und Lowdick aus. Da YouTube damals schon zu Google gehörte und im Verbrauchermarkt reüssierte, richtete IAC das Vimeo-Angebot für Geschäftskunden aus. In der Folge entwickelte Vimeo Software für Videogestaltung, -bearbeitung und ‑übertragung sowie Lösungen für große Unternehmen und professionelle Filmemacher.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier eine Vimeo-Video (Vimeo LLC) geladen.

Vimeo-Video immer laden

Kein Börsenstar

Am 25. Mai 2021 wurde Vimeo durch einen Börsengang ausgegründet. Für IAC hat sich das ausgezahlt, für die meisten Anleger nicht. Vom Eröffnungskurs von 47,15 US-Dollar ging es zwar zunächst auf bis zu 57 Dollar nach oben, doch schon ab Mitte Juli 2021 wurde der Ausgabekurs nie mehr erreicht. Elf Monate nach dem Börsengang wurde Vimeos Aktienkurs erstmals einstellig, die historische Tiefstmarke sind 3,03 Dollar.

Bending Spoons ist eine aus Mailand verwaltete Firma, die in den vergangenen Jahren mehrere bekannte Anwendungen zusammengekauft hat, darunter Wetransfer, Streamyard und die Potsdamer Firma hinter der Wander-Applikation Komoot. Zum Portfolio von Bending Spoons gehören zudem Evernote und Meetup. Bei ihren Übernahmen fackeln die Italiener nicht lange: Nach dem Kauf Evernotes haben sie fast alle Angestellten verabschiedet. Auch bei anderen Übernahmen hat Bending Spoons jeweils einem Großteil der Belegschaft gekündigt.

Von Arbeitsplatzgarantien für die Vimeo-Belegschaft ist in der aktuellen Mitteilung keine Rede. „Wir sind sicher, dass (Bending Spoons) der richtige Langzeitpartner für unsere Kunden, Mitarbeiter und die Marke ist“, meint dennoch Glenn Schiffman, Verwaltungsratsvorsitzender Vimeos.

(ds)

Source link

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Datenschutz & Sicherheitvor 3 Monaten

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 3 Wochen

Der ultimative Guide für eine unvergessliche Customer Experience

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Apps & Mobile Entwicklungvor 3 Monaten

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Social Mediavor 3 Wochen

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

UX/UI & Webdesignvor 2 Wochen

Adobe Firefly Boards › PAGE online

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Online Marketing & SEOvor 3 Monaten

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

Entwicklung & Codevor 3 Wochen

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Entwicklung & Codevor 1 Woche

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Inspohub

Nvidia Rubin CPX: Spezialbeschleuniger für KI-Inferencing kommt Ende 2026

Künstliche Intelligenz

Nvidia Rubin CPX: Spezialbeschleuniger für KI-Inferencing kommt Ende 2026

Mixture-of-Experts und Context-Länge

Disaggregated Serving

Von Blackwell zu Rubin (CPX)

Künstliche Intelligenz

Vorhandene Windows-10-Installationen unter Linux virtualisieren

Künstliche Intelligenz

Gesundheitsumfrage: Ein Viertel nutzt KI zur Selbstdiagnose

Geteilte Meinungen über KI in der Medizin

Künstliche Intelligenz

Europäische Firma übernimmt Videoplattform Vimeo

Empfohlener redaktioneller Inhalt

Kein Börsenstar

Vorhandene Windows-10-Installationen unter Linux virtualisieren

Spotify Premium: Lossless-Musikstreaming nach jahrelangem Warten gestartet

Gesundheitsumfrage: Ein Viertel nutzt KI zur Selbstdiagnose

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Der ultimative Guide für eine unvergessliche Customer Experience

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt

Inspohub

Nvidia Rubin CPX: Spezialbeschleuniger für KI-Inferencing kommt Ende 2026

Mixture-of-Experts und Context-Länge

Disaggregated Serving

Von Blackwell zu Rubin (CPX)

Das könnte Ihnen gefallen

Künstliche Intelligenz

Vorhandene Windows-10-Installationen unter Linux virtualisieren

Künstliche Intelligenz

Gesundheitsumfrage: Ein Viertel nutzt KI zur Selbstdiagnose

Geteilte Meinungen über KI in der Medizin

Künstliche Intelligenz

Europäische Firma übernimmt Videoplattform Vimeo

Empfohlener redaktioneller Inhalt

Kein Börsenstar

Vorhandene Windows-10-Installationen unter Linux virtualisieren

Spotify Premium: Lossless-Musikstreaming nach jahrelangem Warten gestartet

Gesundheitsumfrage: Ein Viertel nutzt KI zur Selbstdiagnose

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Der ultimative Guide für eine unvergessliche Customer Experience

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt