Connect with us

Künstliche Intelligenz

KI-Inferencing: US-deutsches Start-up will Nvidia ausstechen


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Das 2017 unter dem Namen Recogni gegründete Unternehmen Tensordyne meldet den sogenannten Tape-Out seines KI-Beschleunigers „Napier“. Der Name verweist auf John Napier, der als Erfinder des Logarithmierens als Rechenhilfe gilt. Der Napier-Chip soll dank logarithmischer Mathematik die zahlreichen Multiplikationen, die bei der Anwendung von KI-Modellen nötig sind, in Additionen verwandeln.

Weiterlesen nach der Anzeige

Weil sich Additionen effizienter berechnen lassen, verspricht Tensordyne wesentlich höhere Rechenleistung pro Rack als bei KI-Servern mit der noch aktuellen Nvidia-Technik GB300. Je nach KI-Modell soll ein Napier-Rack bis zu 13-mal so viele Tokens pro Sekunde liefern wie ein Nvidia GB300 NVL72.

Die Effizienz, gerechnet in Tokens pro Sekunde pro Watt, soll sogar bis zum Faktor 17 besser sein.

Nach Angaben des Unternehmens liegen bereits Bestellungen für Napier-Systeme im Gesamtwert von mehr als 200 Millionen US-Dollar vor. Wann genau die ersten TDN72-Pods ausgeliefert werden sollen, verrät Tensordyne bisher jedoch nicht.

Bis Ende 2026 will Nvidia allerdings das gezielt für Inferencing optimierte System Groq 3 LPX auf den Markt bringen. Das einst ebenfalls für Inferencing angekündigte Rubin CPX ist damit wohl vom Tisch.

Durch die logarithmische Rechenweise können die eigentlichen Rechenwerke des Napier kleiner ausfallen, sodass mehr davon auf den Chip passen und Platz für schnelles SRAM bleibt. Jeder Chip ist mit 144 GByte HBM3E-RAM gekoppelt. Außerdem baut Teledyne einen besonders schnellen Interconnect ein.

Weiterlesen nach der Anzeige

Ein TDN72 Pod besteht aus vier eng vernetzten Rack-Einschüben mit je neun Napier-Chips. Ein Tensordyne Napier Rack (TDN Rack) wiederum besteht aus vier TDN72-Pods, also 288 Napier-Chips.



Der Aufbau des Tensordyne Rack aus vier TDN72-Pods mit je 72 „Napier“-Prozessoren.

(Bild: Tensordyne)

Das TDN Rack leistet 608 PFlops, hat 42 TByte HBM3E, 78 GByte SRAM und 256 TByte RAM. Es nimmt unter Volllast 120 Kilowatt Leistung auf und kommt mit Luftkühlung aus. Der Interconnect im Rack überträgt bis zu 275 TByte/s.

Der Napier-Chip soll unter anderem die Datenformate FP16, FP8, FP4 und Int8 verarbeiten. Er eignet sich laut Tensordyne für gängige KI-Modelle wie Kimi K2.6, DeepSeek-R1/V4 Pro, Llama3.1 405B, Mixtral 8x22B, GPT-OSS-120B und Qwen 80B.

Zum Vergleich: Nvidia will in ein Groq-3-LPX-Rack insgesamt 256 Groq-3-LPUs einbauen, jede mit 500 MByte SRAM. Das ergibt pro Rack 128 GByte SRAM, dazu kommen 12 TByte DDR5-RAM.

Der Hauptsitz von Tensordyne liegt im Silicon Valley, eine Niederlassung besteht in München. Mehrere leitende Entwickler waren früher bei der Firma Juniper Networks tätig, die heute zu HPE gehört.

Bei der Entwicklung des Napier kooperierte Tensordyne mit Broadcom. Broadcom entwickelt auch KI-Chips für andere Firmen, beispielsweise mehrere Generationen der TPUs von Google.


(ciw)



Source link

Künstliche Intelligenz

ILA 2026: Großer Andrang beim A380, das Militär rückt in den Fokus


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Der politische Wunsch nach mehr europäische Souveränität war auch eines der bestimmenden Themen der Internationalen Luft- und Raumfahrtausstellung (ILA), die am Sonntag auf dem Gelände des Flughafens Berlin-Brandenburg zu Ende gegangen ist. Bundeskanzler Friedrich Merz (CDU) hat die Messe genutzt, um die Luftfahrtstrategie der Bundesregierung vorzustellen.

Weiterlesen nach der Anzeige

Zur Sicherung der Luftfahrt als strategischer Schlüsselbranche und deren Entlastung verwies Merz auf das bereits beschlossene Entlastungspaket: Die Pflicht zur Beimischung von synthetischem für E-Kerosin entfiel bereits zum Jahresbeginn. Darüber hinaus will die Bundesregierung die letzte Erhöhung der Luftverkehrssteuer im Sommer zurücknehmen sowie die Gebühren für die Flugsicherung senken.



Eindruck von der ILA 2026

(Bild: Anne-Dorette Ziems/heise medien)

Rund 110.000 Besucher verzeichnete die ILA in diesem Jahr. 765 Aussteller aus 37 Nationen zeigten auf mehr als 200.000 Quadratmetern Produkte und Dienstleistungen für die Luft- und Raumfahrt. 330 Delegationen aus rund 60 Ländern nutzten die ILA für politischen Austausch und Kooperationen. Neben der europäischen Souveränität waren erneut Nachhaltigkeit und der Einsatz autonomer Luft- und Raumfahrzeuge wichtige Themen.

Etwa 100 Flugzeuge waren in diesem Jahr am Boden und in der Luft zu sehen. Publikumsmagnet der Flugzeugausstellung auf dem Rollfeld war ein A380 von Emirates, der auch innen besichtigt werden konnte. Während der Publikumstage am Wochenende warteten Besucher teilweise bis zu zwei Stunden in der Schlange. Wer sich trotzdem angestellt hat, hatte die Möglichkeit, auch mal einen Blick in die Business- und First Class im Obergeschoss zu werfen: Eine Gelegenheit, die sich auf einer normalen Urlaubsreise eher nicht bietet.



Flugshow auf der ILA 2026

(Bild: Anne-Dorette Ziems/heise medien)

Nicht alle Flugzeuge konnten aber auch von Innen besichtigt werden – etwa der A350-1000, der sich bei der Flugshow als beeindruckend wendig für ein derart großes Passagierflugzeug zeigte. Auf der ILA war das erste gebaute Testflugzeug des Typs A350-1000 zu sehen. Schon in seiner normalen Variante ist der A350 ein sehr sparsames Flugzeug. Zuletzt hat Airbus eine Ultra Long Range Variante entwickelt, die Flüge von bis zu 22 Stunden am Stück ermöglichen soll. Der Erstflug dieses Modells hat erst Anfang Juni stattgefunden.


Weiterlesen nach der Anzeige

Großen Andrang gab es auch bei den Flugvorführungen der Eurofighter-Jets, die mit Spiralen und Loopings alle Raumdimensionen ausgenutzt haben.

Das Thema Verteidigung nimmt großen Raum auf der ILA ein, die in drei Bereiche Luftfahrt, Raumfahrt und Verteidigung aufgeteilt ist. Viele Firmen bedienen sowohl zivile als auch militärische Luft- und Raumfahrt, zusätzlich wird das Thema „Dual Use“ immer größer. Das gilt auch in Organisationen wie der Europäischen Weltraumagentur ESA, die eigentlich für zivile Raumfahrt zuständig ist. Konkret gilt das etwa für das Satellitennavigationsnetzwerk Galileo – ein Gemeinschaftsprojekt von ESA und EU. Und auch das ESA-Erdbeobachtungsprogramm Copernicus steht der militärischen Nutzung offen.

Verschiedene Drohnen waren ebenfalls Teil der Flugshow. Optisch waren die vorwiegend wegen der Entfernung kein besonderer Hingucker, dafür aber technisch umso interessanter. Eine der gezeigten Drohnen war die KI-gesteuerte Vector AI UAS der Firma Quantum Systems, die im März 2025 vorgestellt wurde.

An der Schnittstelle zwischen Luft- und Raumfahrt war auf der ILA der besondere „Zero G A310“ zu sehen. Das Forschungsflugzeug der Firma Novespace ist umgebaut für Parabelflüge, die Experimente in der Schwerelosigkeit ermöglichen und damit zum Astronautentraining beitragen kann. Dabei fliegt die Maschine mit einem Steigwinkel von bis zu 50 Grad. Um die Spitze der Parabel herrschen für 22 Sekunden Schwerelosigkeit.



Der Space-Pavillon

(Bild: Anne-Dorette Ziems/heise medien)

Im Space-Pavillon lag der Hauptfokus auf dem Mond. Am Mittwochvormittag eröffnete Dorothee Bär (CSU), Bundesministerin für Forschung, Technologie und Raumfahrt, zusammen mit ESA-Generaldirektor Josef Aschbacher, ESA-Reserveastronautin Amelie Schönenwald sowie den ESA-Astronauten Alexander Gerst und Matthias Maurer den Bereich. Die Ambitionen Europas auf dem Mond waren mehrfach Thema im Bühnenprogramm. Allerdings konnte Aschbacher wenig Neuigkeiten zur Rolle der ESA im Artemis-Programm berichten.

Zuletzt hat die NASA das Artemis-Programm deutlich umstrukturiert. Das Gateway, die ursprünglich geplante Raumstation um den Mond, wurde zugunsten einer Basis auf der Mondoberfläche pausiert. Die ESA sollte eigentlich Module fürs Gateway entwickeln und im Gegenzug dafür drei Crew-Plätze auf zukünftigen Artemis-Missionen erhalten. Diese Vereinbarung sei so nun nicht mehr gültig, berichtet Aschbacher: „Der Flug von Luca Parmitano auf Artemis III ist keiner der drei Flüge, die für das Gateway vorgesehen waren, weil das Gateway erst einmal pausiert ist. Wir fangen wirklich wieder an, neu zu verhandeln. Meine Ambition ist es, auch Astronautenflüge auf die Mondoberfläche zu bekommen. Mein Team und ich verhandeln derzeit mit der NASA.“ Wie lange diese Verhandlungen noch dauern, ist laut Aschbacher bisher nicht absehbar. Er hofft, bis Ende des Jahres damit durch zu sein.


(vbr)



Source link

Weiterlesen

Künstliche Intelligenz

Recycling: Alte Smartphones werden zu Server-Clustern für Studierende


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Forscherinnen und Forscher der University of California San Diego arbeiten an einem Mini-Rechenzentrum aus 2000 gebrauchten Smartphones. Weil sie dabei mit Google kooperieren, verwenden sie dazu Pixel-Smartphones. Allerdings nutzen sie nur die Mainboards der alten Smartphones, lassen also Akkus und Displays weg.

Weiterlesen nach der Anzeige

Die Rechenleistung der älteren Smartphone-Prozessoren genügt für viele Aufgaben, die in der Lehre vorkommen, etwa für Jupyter Notebooks. Die CPU-Performance ist sogar besser als bei manchen billigen Cloud-Instanzen, vor allem bei Singlethreadring. Für manchen Anwendungen ist allerdings der Hauptspeicher der Smartphones zu knapp; er liegt zwischen 8 und 12 GByte bei den verwendeten Geräten.

Die Arbeitsgruppe von Prof. Ryan Kastner an der Uni San Diego forscht seit mehreren Jahren an der Nachnutzung alter Smartphones als Server. Dazu wurden bereits mehrere Arbeiten veröffentlicht, etwa „Reducing the Carbon Footprint of EdTech with Repurposed Devices“ und „Junkyard Computing: Repurposing Discarded Smartphones to Minimize Carbon“.

Das aktuelle Projekt gruppiert laut einem Blog-Beitrag von Google Research je 20 Smartphone-Mainboards zu einem Subsystem, dessen Leistung grob der eines typischen Allzweck-Servers entspricht. Die Performance genüge für die Projekte von etwa 75 Studierenden gleichzeitig. Ziel ist es, 100 dieser Subsysteme zentral zu verwalten.

Auf das Mainboard inklusive Prozessor beziehungsweise System-on-Chip sowie RAM und Flash-Speicher entfällt der größte Teil der Ressourcen, die zur Produktion eines Smartphones nötig sind. Denn die Herstellung von Halbleiterchips benötigt viel Energie sowie Tausende von Roh- und Hilfsstoffen.


(ciw)



Source link

Weiterlesen

Künstliche Intelligenz

WWDC 2026: Apple filterte Frequenzen, um Siri-Aktivierungen zu verhindern


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Apple hat die Tonspur der WWDC-2026-Keynote offenbar gezielt verändert, um massenhafte Aktivierungen der Sprachassistenz Siri auf den Geräten der Zuschauer zu verhindern. Spektrogramm-Analysen des Videostreams zeigen deutliche Lücken in bestimmten Frequenzbändern – und zwar immer genau dann, wenn auf der Bühne das Wort „Siri“ fiel.

Weiterlesen nach der Anzeige

Der niederländische Tontechniker Luuk de Leest veröffentlichte auf X eine entsprechende Analyse mit Spektrogramm und kommentierte, Apple schneide „ein Stück bei 3k, 4k, 5k und 6 kHz heraus, wenn sie ‚Siri‘ sagen, damit nicht alle HomePods losquasseln“. Die Frequenzbänder bei 3, 4, 5 und 6 Kilohertz wurden demnach gezielt herausgefiltert beziehungsweise stark abgesenkt.

Technisch beschreiben Beobachter die Maßnahme als dynamischen Notch-Filter: Nur in den Momenten, in denen der Name „Siri“ fällt, werden schmale Frequenzbänder im Bereich zwischen 3 und 6 Kilohertz abgesenkt. Dieser Bereich transportiert einen erheblichen Teil der sogenannten phonetischen Energie – also genau jene Anteile von Konsonanten und Vokalen, auf die Wake-Word-Detektoren trainiert sind. Der Rest der Tonspur bleibt unangetastet.

Für Zuschauer blieb das Wort „Siri“ im Stream dennoch verständlich – Beobachter beschreiben den Klang lediglich als leicht „metallisch“ oder „ausgedünnt“. Wake-Word-Systeme wie Siri nutzen akustische Modelle auf Basis neuronaler Netze, die auf die charakteristische Zeit-Frequenz-Signatur des Triggerwortes trainiert sind. Werden entscheidende Bereiche künstlich geschwächt, sinkt die Erkennungswahrscheinlichkeit deutlich.

Allerdings zeigt sich, dass der Ansatz keineswegs vollständig wirkt: Mehrere Nutzer berichteten in Foren und auf Social Media, ihre iPhones oder HomePods seien während der Keynote trotz der Filterung mehrfach angesprungen. Die Gründe dafür liegen in der Natur der Wake-Word-Erkennung selbst. Die Systeme unterscheiden im Kern nicht zwischen live gesprochenen Worten und Audio, das von Lautsprechern kommt – sie analysieren lediglich das Mikrofonsignal auf bestimmte akustische Muster. Unterschiedliche Mikrofoncharakteristiken, individuelle Raumakustik oder die Lautstärke des Streams machen es unmöglich, Fehlauslösungen einzelner Geräte vollständig zu verhindern. Apple hat die Audio-Veränderung bislang nicht offiziell bestätigt.

Apple steht mit diesem Vorgehen nicht allein da. Bereits 2019 wurde bekannt, dass Amazon in TV-Werbespots für Alexa ähnliche audiotechnische Maßnahmen nutzte, damit Echo-Lautsprecher nicht auf das Wake-Word reagierten. Auch Google hatte in einzelnen Präsentationen Anpassungen vorgenommen, um „OK Google“ nicht massenhaft auszulösen.

Weiterlesen nach der Anzeige

Die WWDC 2026 stand im Zeichen einer umfassend überarbeiteten Version des Sprachassistenten unter dem Namen „Siri AI“, eingebettet in Apples „Apple Intelligence“. Siri AI soll natürliche Sprache verstehen, Bildschirminhalte lesen und persönliche Kontexte in Antworten einbeziehen können. In der EU wird Siri AI zum Start allerdings nicht auf iPhone und iPad verfügbar sein – Apple verweist auf regulatorische Anforderungen. Apples Datenschutzstrategie rund um Siri AI setzt dabei weiterhin auf lokale Verarbeitung und Private Cloud Compute, um möglichst wenige Nutzerdaten nach außen zu geben.


(mki)



Source link

Weiterlesen

Beliebt