Künstliche Intelligenz
Kubernetes 1.34 stabilisiert Dynamic Resource Allocation
Die neue Kubernetes-Version 1.34 steht als finales Release bereit und macht Dynamic Resource Allocation (DRA) allgemein verfügbar – was unter anderem neue Konfigurationsmöglichkeiten für GPUs und TPUs eröffnet. Insgesamt bringt das Release 58 Neuerungen: 23 Features gelten nun als stabil, während 22 die Beta- und 13 die Alpha-Phase erreicht haben. Unterdessen hat Metal3.io den Status als CNCF Incubating Project erreicht.
Dynamic Resource Allocation erreicht Stabilität
Die Dynamic Resource Allocation (DRA) ist nun als stabiles Feature allgemein verfügbar. Wie das Kubernetes-Team in der Ankündigung auf GitHub mitteilt, soll DRA mächtigere Wege für das Auswählen, Zuweisen, Teilen und Konfigurieren von Geräten wie Graphics Processing Units (GPUs), Tensor Processing Units (TPUs) und Network Interface Cards (NICs) eröffnen.
Auch im Alpha- und Beta-Status gibt es Neuerungen für DRA: Als Beta-Feature ermöglicht der kontrollierte Admin-Zugriff via adminAccess
-Feld in ResourceClaims
oder ResourceClaimTemplates
Cluster-Operatoren den Zugriff auf Geräte, die sich bereits für Monitoring oder Diagnostik in Verwendung befinden. Die Alpha-Features betreffen unter anderem die Observability des Gesundheitsstatus von Geräten und erweitertes Ressourcen-Mapping.
Zu den weiteren stabilen Features in diesem Release zählt das Erstellen von Ersatz-Pods durch Job-Controller. In der Standardeinstellung erstellen diese sofort einen Ersatz-Pod, wenn ein Pod zu terminieren beginnt. Dadurch laufen beide Pods gleichzeitig, was zu Schwierigkeiten – etwa nicht genügend verfügbaren Nodes für den Ersatz-Pod oder Problemen im Umgang mit Machine-Learning-Frameworks wie TensorFlow und JAX – führen kann. Das Kubernetes-Team schafft daher mit dem Feature .spec.podReplacementPolicy
in Jobs Abhilfe. Damit lässt sich festlegen, Ersatz-Pods erst dann zu erstellen, wenn ein Pod komplett terminiert ist (.status.phase: Failed.
), mithilfe der Einstellung .spec.podReplacementPolicy: Failed
.
Metal3.io jetzt im Inkubator der CNCF
Das Technical Oversight Committee (TOC) der Cloud Native Computing Foundation (CNCF) hat Metal3.io in den CNCF-Inkubator aufgenommen. Einst aus einer Zusammenarbeit von Red Hat und Ericsson im Jahr 2019 entstanden, befand sich Metal3.io (ausgesprochen „metal cubed“) seit 2020 in der CNCF-Sandbox. Es handelt sich dabei um ein Open-Source-Projekt, das ein Set aus Tools anbietet, um Bare-Metal-Infrastruktur unter Verwendung von Kubernetes zu verwalten.
Laut TOC-Sponsor Ricardo Rocha widmet sich Metal3.io einem kritischen Bedürfnis der Cloud-nativen Infrastruktur, indem es Bare Metal so verwaltbar und Kubernetes-nativ wie jede andere Plattform mache. Durch das stetige Wachstum, die technische Reife und die starke Integration in das Kubernetes-Ökosystem sei es Rocha zufolge eine klare Wahl für die Inkubation gewesen. Auf der Roadmap für 2025 stehen unter anderem Support für Multi-Tenancy und für weitere Architekturen jenseits von x86_64, zum Beispiel ARM.
(mai)