Apps & Mobile Entwicklung
OpenAIs erster eigener Chip: Jalapeño soll KI-Abfragen effizienter beschleunigen
OpenAI und Broadcom haben mit Jalapeño den ersten von OpenAI entworfenen KI-Beschleuniger vorgestellt. Der Chip ist nicht für das Training neuer Modelle gedacht, sondern für die Inferenz: Er soll also Anfragen an große Sprachmodelle wie ChatGPT, Codex oder API-Dienste effizienter verarbeiten. Konkrete Leistungsdaten fehlen noch.
Eigener Chip für die Modell-Ausführung
Mit Jalapeño rückt OpenAI tiefer in die (eigene) Hardware-Entwicklung vor. Der Chip wird von den Unternehmen als „Intelligence Processor“ bezeichnet und ist laut Ankündigung von Grund auf für die Inferenz großer Sprachmodelle entworfen worden. Anders als universell einsetzbare Beschleuniger soll Jalapeño stärker auf die Arbeitslasten zugeschnitten sein, die bei interaktiven KI-Diensten entstehen.
Dazu zählen nicht nur reine Rechenleistung, sondern auch Speicherzugriffe, Netzwerk-Anbindung und möglichst geringe Latenzen. Gerade bei Chatbots, Code-Assistenten oder künftigen Agenten-Anwendungen ist nicht nur entscheidend, wie viele Tokens pro Sekunde ein System berechnen kann. Die Antwort soll auch mit möglichst wenig Verzögerung geliefert werden und bei hoher Nachfrage zuverlässig verfügbar bleiben.
OpenAI spricht von besseren Werten pro Watt
Belastbare Benchmarks nennt OpenAI noch nicht. Die Unternehmen erklären lediglich, frühe Tests würden eine deutlich bessere Leistung pro Watt als aktuelle Systeme erwarten lassen. Ein technischer Bericht mit näheren Daten soll erst in den kommenden Monaten folgen. Bis dahin bleibt offen, wie Jalapeño im direkten Vergleich zu Nvidias Beschleunigern, Googles TPUs oder anderen spezialisierten ASICs abschneidet.
Engineering-Samples laufen laut OpenAI bereits im Labor mit Fokus auf Takt und Leistungsaufnahme. Der Tape-out soll in nur neun Monaten erfolgt sein. OpenAI verweist darauf, dass eigene Modelle bei Teilen des Entwicklungs- und Optimierungsprozesses geholfen hätten.
Broadcom liefert Umsetzung und Netzwerk-Technik
OpenAI entwirft den Beschleuniger nicht allein. Broadcom übernimmt zentrale Aufgaben bei Netzwerk- und Verbindungstechnik. Auch Celestica wird als Partner für Platinen, Racks und Systemintegration genannt. Damit geht es nicht nur um einen einzelnen Chip, sondern um komplette KI-Systeme für Rechenzentren.
Der erste Einsatz ist für Ende 2026 vorgesehen. OpenAI und Broadcom stellen Jalapeño nicht als Einzelchip, sondern als Grundlage für eine über mehrere Jahre angelegte Infrastruktur-Basis dar. Bereits im Oktober 2025 hatten beide Unternehmen eine Zusammenarbeit über 10 Gigawatt an OpenAI-entworfenen KI-Beschleunigern angekündigt, deren Bereitstellung in der zweiten Jahreshälfte 2026 beginnen und bis Ende 2029 abgeschlossen werden soll.
Nicht automatisch ein Nvidia-Ersatz
Jalapeño dürfte vorerst vor allem OpenAIs eigene Infrastruktur ergänzen. Der Chip ist auf Inferenz zugeschnitten und damit nicht automatisch ein Ersatz für GPUs, die weiterhin beim Training großer Modelle und für flexible Rechenlasten wichtig bleiben. Für OpenAI kann ein eigener ASIC dennoch strategisch wichtig sein: Je besser Hardware, Software, Modelle und Dienste aufeinander abgestimmt sind, desto stärker lassen sich Kosten, Energiebedarf und Verfügbarkeit beeinflussen.
Die Zusammenarbeit ist zugleich ein weiterer Beleg dafür, dass große KI-Anbieter zunehmend eigene Beschleuniger entwickeln lassen. Nvidia bleibt zwar der dominierende Anbieter im Markt für KI-Beschleuniger, doch OpenAI folgt mit Jalapeño einem Trend, den auch Google, Amazon, Microsoft und Meta mit eigenen oder speziell angepassten Chips verfolgen.