Connect with us

Künstliche Intelligenz

Nvidia dementiert Übernahmegerüchte | heise online


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

„Nvidia plant eine gigantische Übernahme, die die PC- und Server-Landschaft so grundlegend verändern wird wie nichts anderes seit der Erfindung des Computers.“ Das schrieb Semiaccurate kürzlich über eine potenzielle Übernahme eines PC-Herstellers seitens Nvidia.

Weiterlesen nach der Anzeige

Der Bericht fand so großen Anklang, dass Nvidia ihn inzwischen gegenüber diversen US-Medien dementiert: „Der Medienbericht ist falsch; Nvidia führt keine Gespräche über die Übernahme eines PC-Herstellers.“

Im Fokus der Gerüchteküche stand Dell, der sowohl Desktop-PCs und Notebooks herstellt als auch Server (zusätzlich zu anderen Komponenten wie PC-Monitore, einschließlich der Marke Alienware). Die Wahl auf Dell wäre nicht komplett abwegig gewesen: Dell-Gründer und -Chef Michael Dell sowie Nvidia-Chef Jensen Huang verstehen sich offenbar gut. In einem gemeinsamen Interview verriet Dell 2024 erstmals die Existenz von Nvidias Notebook-Prozessor N1X.

Dell hat derzeit eine Marktkapitalisierung von knapp 120 Milliarden US-Dollar. Fast so viel Nettogewinn machte Nvidia in den vergangenen drei Quartalen. Die Übernahme wäre dank der vielen KI-Milliarden rein finanziell also stemmbar.

Wie schon bei der geplanten, aber geplatzten ARM-Übernahme durch Nvidia ergäben sich durch den Kauf eines PC-Herstellers allerdings kartellrechtliche Fragen: Wenn Nvidia eigene Notebooks herstellt, gleichzeitig aber Prozessoren an andere Hersteller verkauft, könnte die Firma Konkurrenten potenziell gezielt benachteiligen.

Dells Aktie schoss nach den Gerüchten um etwa sieben Prozent hoch, hat sich seit dem Dementi aber wieder auf dem Vorwochenniveau eingependelt. Seit Jahresbeginn ist die Aktie um über 40 Prozent gestiegen.

Weiterlesen nach der Anzeige


(mma)



Source link

Künstliche Intelligenz

Kritik an BSI-Rahmen: Scheinsouveränität für die europäische Cloud?


Die Debatte über die digitale Souveränität in Europa macht vor den Rechnerwolken längst nicht mehr Halt. Im Zentrum der Kritik steht aktuell das Bundesamt für Sicherheit in der Informationstechnik (BSI) mit seinem jüngst veröffentlichten Kriterienkatalog C3A (Cloud Computing Autonomy). Der europäische Cloudverband CISPE und mehrere Provider vom alten Kontinent erheben dagegen schwerwiegende Vorwürfe: Die Bonner Behörde verspreche zwar Unabhängigkeit, legitimiere letztlich aber den ununterbrochenen Einsatz von US-Hyperscalern als Subunternehmer. Sie öffne damit extraterritorialen Risiken sowie strukturellen Vendor-Lock-ins Tür und Tor.

Weiterlesen nach der Anzeige

Die heise online vorliegende CISPE-Analyse macht große Schlupflöcher im C3A-Katalog aus. So sehe das Framework zwar vor, dass der primäre Cloud-Anbieter unter europäischer Kontrolle stehen müsse. Bei den weitaus wichtigeren Subunternehmern weiche das BSI diese Linie aber drastisch auf: Für sie wird lediglich eine registrierte Hauptniederlassung in Deutschland oder der EU verlangt.

Eine tatsächliche Eigentumskontrolle durch europäische Unternehmen ist nicht vorgeschrieben. Europäische Anbieter können im Rahmen von C3A also problemlos auf US-Infrastruktur-Giganten setzen, die vollumfänglich dem Zugriff ausländischer Behörden und Gesetzen wie dem US Cloud Act ausgesetzt sind. Damit müssen sie gegebenenfalls Daten an Behörden in den USA herausrücken.

Diese extraterritoriale Offenheit wird in dem Regelwerk nicht unterbunden, sondern formalisiert. Der Katalog verlangt von den Anbietern lediglich eine jährliche Risikoanalyse solcher Auslandszugriffe. Die Kritiker bemängeln dies als Papiertiger-Bürokratie: Es gebe keinerlei Verpflichtung, die identifizierten Risiken technisch zu minimieren oder organisatorisch auszuschließen. Da sich die Betrachtung zudem nur auf kundengenerierte Informationen beziehe, blieben andere kritische Datentöpfe wie Metadaten, Telemetrie oder Account-Informationen völlig schutzlos.

Gleichzeitig baut das BSI Hürden auf, die für den breiten europäischen Mittelstand unüberwindbar scheinen. Der Katalog fordert etwa, dass Anbieter innerhalb der EU eine tägliche Kopie des Quelltextes vorhalten und eigene Build-Umgebungen betreiben müssen, um Software im Ernstfall unabhängig patchen zu können. Was nach maximaler Resilienz klingt, geht dem CISPE zufolge aber an der wirtschaftlichen Realität vorbei. Kein europäisches mittelständisches Unternehmen verfüge über die Verhandlungsmacht oder die Ressourcen, um von globalen Softwarekonzernen den Zugriff auf proprietären Source-Code zu erzwingen oder komplexe Drittsoftware in Eigenregie weiterzuentwickeln.

Damit bewirkt das Framework das exakte Gegenteil seines Ziels: Es schließt den innovativen europäischen Mittelstand de facto aus und begünstigt jene Konstrukte, die ohnehin auf die Technologie der US-Hyperscaler aufsetzen. Als prominentes Beispiel nennen die Autoren der Stellungnahme das deutsche Cloud-Modell Delos von SAP und Microsoft. Solche Großprojekte könnten die extremen Anforderungen an die Quellcode-Hinterlegung erfüllen. Sie zementierten so aber genau jene technologische Abhängigkeit, die Europa eigentlich überwinden wolle.

Weiterlesen nach der Anzeige

Verschärft wird das Problem durch das Fehlen jeglicher Interoperabilitäts- oder Portabilitätsvorgaben, die einen Schutz vor unfairem Anbieterwechsel oder plötzlichen Kündigungen bieten würden. Das BSI fokussiere sich fast ausschließlich darauf, dass der Provider selbst im Krisenfall betriebsbereit bleibt, moniert der Verband. Die Freiheit des Kunden, seine Daten flexibel zu migrieren oder sich von proprietären Systemen zu lösen, spiele in dem Katalog keine Rolle.

Angesichts des von der EU-Kommission im Kontext des Pakets für technologische Souveränität geplanten Cloud & AI Development Act (CADA) droht das BSI-Rahmenwerk einen gefährlichen Präzedenzfall zu schaffen. Die europäische Tech-Szene steht vor der Richtungsentscheidung, welche Definition von digitaler Souveränität künftig gelten soll: Eine echte operative und technologische Unabhängigkeit oder eine bürokratisch kontrollierte, aber fortwährende Interdependenz von den globalen Tech-Monopolen.

Demgegenüber unterstrich jüngst Luise Kranich, Leiterin der Abteilung Technologiestrategie beim BSI, dass Souveränität nicht mit Isolation gleichzusetzen sei: Völlige Autarkie und maximaler Einfluss auf die Anbieter sei nicht nur nicht möglich, sondern auch nicht gewünscht. Das Amt fokussiere sich mit C3A stattdessen darauf, Abhängigkeiten kontrollierbar zu gestalten. Dass der Entwurf US-Konzernen vorab zur Prüfung vorlag, verteidigte Kranich als strategischen Härtetest: „Wenn sie sagen: ‚Könnt ihr so machen‘, dann sind wir nicht streng genug.“ Die Hyperscaler müssten erkennen, dass mehr gefordert sei „als ein Projektchen in einem deutschem Rechenzentrum“.

Lesen Sie auch


(nie)



Source link

Weiterlesen

Künstliche Intelligenz

Googles KI-Chip-Boss: „Wir sind uns der Inflation natürlich bewusst“


Amin Vahdat trägt den offiziellen Titel Chief Technologist für KI und Infrastruktur bei Google. Damit ist er nicht nur für den Compute-Bereich zuständig, der die Cloud-KI-Infrastruktur einschließt. Er kümmert sich auch um das Design von Googles internem und externem Netzwerk, die zahlreichen Rechenzentren und die dort verwendeten Plattformarchitekturen – von den eingekauften GPUs und anderen Beschleunigern über die Server bis zu Googles hauseigenen KI-Chips.

Weiterlesen nach der Anzeige

Die Tensor Processing Units (TPUs) haben in den vergangenen zehn Jahren acht Generationen durchlaufen. Die neueste Generation besteht aus zwei Varianten und wurde im April vorgestellt. Im Interview mit heise online spricht der promovierte Informatiker Vahdat, der seit 16 Jahren bei Google arbeitet und davor unter anderem Professor an der University of California in San Diego war, über Googles KI-Hardware.

heise online: Herr Vahdat, Sie haben jetzt erstmals spezielle TPU-Varianten für das Training (8t) und die Inferenz (8i). Was genau macht die neuen TPUs aus diesem Jahr besser als die alten?

Amin Vahdat: Mit unserer achten TPU-Generation haben wir uns vom Konzept eines einzelnen, generischen Beschleunigers gelöst, weil wir überzeugt sind, dass sich die physikalischen Gegebenheiten von KI-Workloads grundlegend verändert haben.

Für das Training von Frontier-Modellen erreicht die TPU 8t jetzt 121 ExaFlops pro Pod und hält einen Goodput von 97 Prozent aufrecht, sodass die Rechenleistung direkt ins aktive Lernen fließen kann. Auf der Serving-Seite verdreifacht die TPU 8i den On-Chip-SRAM auf 384 MB, um den massiven Working-Memory-Bedarf von Agenten direkt auf dem Silizium vorzuhalten. Mit unserer neuen Collectives Acceleration Engine platzieren wir die richtige Menge an Rechenleistung direkt im Netzwerkpfad. Dabei senken wir die interne Latenz um bis zu Faktor fünf und erzielen sehr geringe Antwortzeiten bei komplexem Reasoning.

Solche Verbesserungen zeigen, wie wir das Hochskalieren von KI für Unternehmen durch integrierte Lösungen wirtschaftlich machen können. Das liefert für alle Workloads von vorne bis hinten Verbesserungen.

Sie haben also die Chip-Typen verändert und auch die Namen. Was steckt strategisch dahinter?

Weiterlesen nach der Anzeige

Hardware-Entwicklungszyklen dauern bekanntlich Jahre, also mussten wir die Marktentwicklung vorausplanen, noch bevor der aktuelle Boom einsetzte. Wir haben geschätzt, dass die Branche bis 2026 an eine Weggabelung kommen würde, bei der Inferenz- und Serving-Workloads einen erheblichen Anteil der Nachfrage ausmachen.

Wir haben die Architektur daher in zwei spezialisierte Systeme aufgeteilt, weil wir gesehen haben, dass die Workloads für das Training riesiger Modelle und den Betrieb von Echtzeit-KI-Agenten auseinanderlaufen und jeweils angepasste Technologien benötigen. Das „t“ in TPU 8t steht, wie Sie bereits erwähnt haben, für Training, das eine massive Skalierung und hohen Durchsatz für die Entwicklung von Frontier-Modellen erfordert. Das „i“ in TPU 8i steht für Inferenz, die schnelle Verarbeitung mit niedriger Latenz für komplexe Reasoning-Aufgaben verlangt. Dieser Ansatz gibt uns und Kunden die Flexibilität, genau die Hardware auszuwählen, die für ihre spezifischen Workloads optimal ist.

Warum sind solche spezialisierten Chips überhaupt notwendig?

Der Übergang von einfachen Chatbots zu agentischer KI bedeutet, dass ein einzelner Prompt mittlerweile Tausende autonomer Sub-Agenten anstoßen kann, die dann wiederum mehrstufige Aufgaben ausführen. KI-Agenten, die planen, Aufgaben ausführen und lernen, müssen sich auf die Latenz einzelner Operationen konzentrieren können – nicht auf den Durchsatz, der sich erzielen lässt, wenn viele Einzeloperationen gebündelt verarbeitet werden. Historisch hatten wir Hardware für diesen letzteren, durchsatzorientierten Fall optimiert, bei einer grundlegenden Unterstützung für latenzoptimierte Inferenz.

Mit TPU 8i und TPU 8t haben wir die Spezialisierung konsequent weitergetrieben. Auch wenn die TPU 8t als sehr guter Inferenz-Chip dienen könnte, konzentrierten sich alle unsere Optimierungen auf Leistungseffizienz und Skalierung für das Training. Ebenso kann die TPU 8i eigentlich auch als sehr guter Trainings-Chip fungieren, aber alle unsere architektonischen Innovationen zielten auf Inferenz-Latenzoptimierungen. TPU 8i und 8t zeigen, wie wir das grundlegende Compute-Fabric so umbauen, dass Energie- und Skalierungsherausforderungen gelöst werden, an denen generische Infrastruktur zunehmend scheitert.



Source link

Weiterlesen

Künstliche Intelligenz

Meta entwickelt einen KI-Anhänger | heise online


Meta arbeitet laut einem Bericht an mehreren neuen KI-Brillen und einem KI-Anhänger, die dazu beitragen sollen, die hohen Verluste seines Zukunftslabors Reality Labs einzudämmen. Neben dem Verkauf der Geräte wolle Meta diese auch über damit verbundene KI-Dienste monetarisieren. Das geht aus einem internen Memo hervor, über das The Information berichtet.

Weiterlesen nach der Anzeige

Die erste neue KI-Brille mit dem Codenamen „Modelo“ soll dem Bericht zufolge bereits im Juni erscheinen. Im Herbst sollen die Modelle „Luna“ und „RBM2 Refresh“ folgen, bevor im Dezember eine vierte KI-Brille mit dem Codenamen „Mojito VIP“ auf den Markt kommen soll. Darüber hinaus teste Meta interne Prototypen mit den Bezeichnungen „Artemis“ und „SSG“ („Supersensing Glasses“), die zu einem späteren Zeitpunkt erscheinen könnten.

Bei „Artemis“ handelt es sich vermutlich um Metas erste kommerzielle AR-Brille. Hinter „SSG“ könnte dagegen eine KI-Brille stecken, deren Kameras und KI-Systeme die Umgebung kontinuierlich erfassen und analysieren und die eine eingeschränkte Form der Gesichtserkennung unterstützen könnte. Das legt ein früherer Bericht von The Information nahe.

Der neuen Meldung zufolge plant Meta auch mit internen Tests eines KI-Anhängers im kommenden Frühjahr. Dem Memo zufolge könnte das Gerät über eine Kamera verfügen, weitere Angaben zu Ausstattung, Funktionen oder Design enthält das Dokument jedoch nicht. Meta hat im vergangenen Jahr das Start-up Limitless übernommen, das einen KI-Anhänger entwickelte.

Laut des internen Schreibens hat Meta ambitionierte Ziele für sein Wearables-Geschäft. In der zweiten Jahreshälfte will das Unternehmen demnach zehn Millionen Wearables verkaufen. Zum Vergleich: Im gesamten vergangenen Jahr setzte Meta sieben Millionen KI-Brillen ab. Erreicht werden soll die neue Zielmarke durch neue Produkte und eine Ausweitung des Verkaufs auf weitere Länder.

Weitere Einnahmen sollen durch mit den Wearables verbundene KI-Dienste erzielt werden. „Um ein nachhaltiges Geschäft aufzubauen, das nicht allein von Hardwaremargen abhängt, müssen wir die Softwaredienste monetarisieren, die unsere Geräte von der Konkurrenz abheben“, schreibt Alex Himel, Metas Vice President of Wearables, in dem Memo.

Weiterlesen nach der Anzeige

Die Strategie ziele unter anderem darauf ab, die Nutzung von Metas KI-Modellen zu steigern und durch kostenpflichtige Meta-AI-Abonnements wiederkehrende Einnahmen zu erzielen. Die Wearables sollen auf Metas aktuellem KI-Modell Muse Spark sowie weiteren geplanten Modellen basieren. Ergänzt werden sollen diese durch einen noch nicht veröffentlichten KI-Agenten namens Hatch, der sich an Endkunden richtet. Bis zum Jahresende strebe Meta 6,8 Millionen monatlich aktive Nutzer seiner Wearables an.

Der Handlungsdruck ist hoch, denn Meta verliert mit Reality Labs, der Sparte für VR-Headsets, Smart Glasses und zugehörige Software, jedes Jahr zweistellige Milliardenbeträge. Trotz immenser Investitionen erwirtschaftet die Hardware-Sparte bislang nur vergleichsweise geringe Umsätze.

Nachdem der große Durchbruch von VR-Brillen bislang ausgeblieben ist und entsprechende Investitionen jüngst zurückgefahren wurden, hofft Meta nun, dass Smart Glasses zum bevorzugten Endgerät für KI-Assistenten werden.

In diesem Bereich wartet jedoch bereits die Konkurrenz: Google will gemeinsam mit mehreren Partnern im Herbst erste KI-Brillen auf den Markt bringen, während Apple für das kommende Jahr entsprechende Produkte vorbereiten soll. Auch OpenAI arbeitet an KI-Gadgets, darunter womöglich Smart Glasses.


(tobe)



Source link

Weiterlesen

Beliebt