Connect with us

Apps & Mobile Entwicklung

gpt-oss-120b und gpt-oss-20b: OpenAI gibt offene Modelle auf o4/o3-mini-Niveau frei


gpt-oss-120b und gpt-oss-20b: OpenAI gibt offene Modelle auf o4/o3-mini-Niveau frei

Bild: OpenAI

OpenAI hat mit den Sprachmodellen gpt-oss-120b und gpt-oss-20b zwei offene Modelle unter einer flexiblen Apache-2.0-Lizenz freigegeben, die in Core-Reasoning-Benchmarks nahezu Parität mit o4- und o3-mini erreichen sollen. Die Sprachmodelle sind für das Ausführen auf einer einzelnen 80-GB-GPU und Edge-Geräten mit 16 GB ausgelegt.

Die Gewichte für gpt-oss-120b und gpt-oss-20b können kostenlos auf Hugging Face heruntergeladen werden und sind in MXFP4 nativ quantisiert. Das größere Modell gpt-oss-120b ist für den Einsatz in der Cloud konzipiert und kann mit 80 GB Speicher ausgeführt werden. Das kleinere gpt-oss-20b benötigt hingegen 16 GB und ist deshalb auch für die lokale Nutzung auf Geräten wie Desktop-PCs und Smartphones geeignet.

Trainiert auf Nvidia H100

Trainiert wurden die Modelle auf Nvidias H100-GPUs. Nvidia gibt an, dass gpt-oss-120b auf einem GB200 NVL72 bis zu 1,5 Millionen Tokens pro Sekunde liefern und damit 50.000 Nutzer gleichzeitig bedienen könne. Für die lokale Nutzung des gpt-oss-20b sei die Ollama-App laut Nvidia der einfachste Weg. Nutzer können eine Leistung von bis zu 256 Tokens pro Sekunde auf einer RTX 5090 mit 32 GB erwarten. Für Ollama empfiehlt Nvidia mindestens 24 GB, grundsätzlich läuft gpt-oss-20b lokal aber ab 16 GB VRAM. Bei AMD lässt sich das gpt-oss-120b zum Beispiel mit 30 Tokens pro Sekunde auf einem Ryzen AI Max+ 395 mit 96 GB LPDDR5X ausführen, das kleinere gpt-oss-20b auf einer Radeon 9070 XT mit 16 GB VRAM.

Benchmarks auf o4- und o3-mini-Niveau

Für gpt-oss-120b gibt OpenAI an, bei Core-Reasoning-Benchmarks nahezu Parität mit o4-mini erreicht zu haben. Das Modell gpt-oss-20b liefere bei gängigen Benchmarks ähnliche Ergebnisse wie o3‑mini. Trainiert wurden sie mit den Vor- und Nachtrainingstechniken von OpenAI, dabei habe ein besonderer Schwerpunkt auf dem Reasoning gelegen. Dies sei anhand eines hochwertigen, überwiegend englischen reinen Text-Datensatzes, mit Schwerpunkt auf MINT (Mathematik, Informatik, Naturwissenschaft und Technik), Codierung und Allgemeinwissen geschehen. Das Nachtraining sei daraufhin mit einem ähnlichen Prozess wie für o4-mini erfolgt.

Benchmarks mit gpt-oss-120b und gpt-oss-20b (Bild: OpenAI)

Das gpt-oss-120b soll o3-mini übertreffen und o4-mini bei Wettbewerbscodierung (Codeforces), allgemeiner Problemlösung (MMLU und HLE) und Tool-Aufrufen (TauBench) erreichen oder übertreffen. Es erziele bei gesundheitsbezogenen Abfragen (HealthBench⁠) und in der Wettbewerbsmathematik (AIME 2024 und 2025) bessere Ergebnisse als o4-mini. Das kleinere gpt-oss-20b erreiche bei denselben Bewertungen dieselbe oder sogar eine höhere Leistung, trotz seiner geringen Größe, und war laut OpenAI in den Bereich Wettbewerbsmathematik und Gesundheit überlegen.

Sicherheit im Fokus der Veröffentlichung

Einmal veröffentlicht, können offene Sprachmodelle im Gegensatz zu ihren proprietären Gegenstücken nicht wieder zurückgezogen werden. Aufgrund der Sicherheitsanforderungen und einer weiteren Worst-Case-Feinabstimmung soll sich die Veröffentlichung der Sprachmodelle deshalb verzögert haben und der Release nicht schon wie zuvor geplant im Juli erfolgt sein.

Sobald ein offenes Modell veröffentlicht wird, können Angreifer dieses für böswillige Zwecke abstimmen, erklärt OpenAI. Diese Risiken seien von OpenAI bewertet worden, indem das Modell anhand von Biologie- und Cybersicherheitsdaten präzisiert und für jeden Bereich eine Domain-spezifische, nicht-ablehnende Version entwickelt wurde, so wie es OpenAI zufolge ein Angreifer tun würde. Tests hätten gezeigt, dass solche auf böswillige Absichten abgestimmten Modelle selbst mit äußerst umfangreicher Feinabstimmung, die den Trainingsstapel von OpenAI nutzten, nicht in der Lage waren, hohe Fähigkeitslevels gemäß des Preparedness Framework von OpenAI⁠ zu erreichen.



Source link

Apps & Mobile Entwicklung

Linux-News der Woche: Debian 13 und Mesa 25.2 betreten die Bühne


Linux-News der Woche: Debian 13 und Mesa 25.2 betreten die Bühne

Frische Software und mehr Leistung stehen im Fokus der Linux-Welt. Mit Debian 13 bringen die Entwickler eine neue Version mit erneuerter Software und streichen die 32-Bit-Version. Durch Mesa 25.2 gibt es vor allem für AMD-Nutzer mehr Leistung im Raytracing und FSR‑4‑Verbesserungen.

Debian 13 „Trixie“

Nutzer der äußerst beliebten und gleichzeitig auch einer der ältesten Linux-Distributionen „Debian“ erhalten diese Woche mit Version 13, Codename „Trixie“, ein umfangreiches Update. Das auf Stabilität ausgerichtete Betriebssystem setzt auf den Linux-Kernel 6.12 und damit auf die LTS-Variante. Neu ist auch Plasma 6 und damit Qt 6. Gnome liegt in Version 48 vor, Xfce in Version 4.20. Als Besonderheit führt das Entwicklerteam die Unterstützung für 64-Bit RISC-V-Hardware ein.
Abschied nimmt die Distribution von der i386 Architektur und damit 32-Bit. Einzelne Pakete liegen zwar weiterhin als 32-Bit-Version vor, die allerdings eine Befehlssatzerweiterung (SSE2) benötigen, wie sie erst mit den 64-Bit-CPUs eingeführt wurde.
Eine vollständige Liste aller Änderungen findet sich direkt im Release-Blog.

Debian 13 „Trixie“
Debian 13 „Trixie“

Mesa 25.2 mit zahlreichen Verbesserungen für AMD, Intel und Nvidia

Eine weitere, lang erwartete Neuerung wurde diese Woche veröffentlicht: Mesa 25.2 ist endlich als finaler Release erschienen und bringt Verbesserungen für Nutzer von AMD, Intel und Nvidia.
Neben generellen Verbesserungen für Intel und Unterstützung von Nvidias Blackwell-Grafikkarten profitieren insbesondere AMD-GPUs von den Neuerungen. Insbesondere bietet Mesa verbessertes Raytracing für Radeon-Grafikkarten, FSR-4-Optimierungen, Vulkan-Video und weitere Vulkan-API-Erweiterungen. Auch haben die Entwickler Altlasten wie den DRI2-Support entfernt und es wurde ebenfalls am Vulkan-Treiber für Apple-Silicon wurde gefeilt. Insgesamt bringt Mesa 25.2 in vielen Fällen eine höhere Performance für viele Nutzer. Eine ausführliche Liste findet sich in der Release-Ankündigung.

Weitere Radeon-Updates für Mesa 25.3

Kaum ist Mesa 25.2 erschienen, gehen Einreichungen für den kommenden 25.3-Release weiter. Adressiert wird hierbei der ACO-Compiler, welcher in seiner Form bereits seit GCN-Zeiten besteht.

The ACO scheduling heuristic stems from the era of dinosaurs, more precisely the Polaris family, and wasn’t touched since.

Erste Benchmarks im Thread zum überarbeiteten Compiler zeigen, dass die Verbesserungen je nach Spiel unterschiedlich ausfallen können und in manchen Fällen auch zu niedrigeren Durchschnitts-FPS führen. Allerdings scheinen Spiele durch den Patch höhere Minimum-FPS aufzuweisen.

Weitere Veröffentlichungen

Die Linux GPU Control Application (kurz: LACT) erhält mit dem Update auf Version 0.8.1 Unterstützung für ältere AMD-Grafikkarten. Darunter Modelle aus der RDNA1-, Vega- (GCN 5.0) und Polaris-Ära (GCN 4.0). Neu ist auch die Lokalisierung der Anwendung, zu der Nutzer beitragen können.

Downloads

  • Debian

    4,7 Sterne

    Debian ist eine der ältesten, einflussreichsten und am weitesten verbreiteten Linux-Distributionen.

    • Version 13.0 „Trixie“ Deutsch
    • Version 12.11 „Bookworm“ Deutsch
    • Version 11.11 „Bullseye“ Deutsch



Source link

Weiterlesen

Apps & Mobile Entwicklung

Hunderttausende Autos müssen in die Werkstatt



Aktuell werden weltweit hunderttausende Autos zurückgerufen. Schuld daran ist ein mangelhaftes Bauelement am Sicherheitsgurt, durch das Mitfahrer bei Unfällen gefährdet werden können. So läuft der Austausch ab.

Der in den Niederlanden ansässige Automobilkonzern Stellantis vereint zahlreiche bekannte Marken unter einem Dach. Dazu gehören unter anderem Fiat, Alfa Romeo, Ferrari, Jeep, Citroën, Opel und Peugeot. Letzterer findet sich aktuell mit Negativschlagzeilen konfrontiert, denn hunderttausende Fahrzeuge des Autobauers müssen zurück in die Werkstätten. Betroffen ist dabei der Peugeot 308, ein Pkw-Modell der Kompaktklasse – erhältlich als Hybrid, Plug-in-Hybrid oder mit Dieselmotor.

Peugeot startet Rückrufaktion

Nach Informationen des Deutschen Kraftfahrt-Bundesamts (KBA) werden derzeit weltweit rund 243.000 Peugeot 308 zurückgerufen – davon allein in Deutschland 27.116 Fahrzeuge. Die Aktion läuft bereits seit Mitte Juli und wird vom KBA unter der Referenznummer 15326R geführt.

Als Grund für die Rückrufaktion nennt das KBA eine fehlerhafte Sicherheitsgurtverankerung. So besteht die Gefahr, dass die obere Verankerung von Sicherheitsgurten in der zweiten Sitzreihe in Notfallsituationen respektive unter hohen Belastungen bricht. Mitfahrer drohen bei abrupter Geschwindigkeitsverringerung, nach vorn geschleudert zu werden und sich zu verletzen. Ein Austausch soll die Gefahr nun beseitigen.

Betroffene Autofahrer werden kontaktiert

Zurzeit nimmt Stellantis Kontakt zu den Haltern betroffener Peugeot 308-Modelle auf. Dazu zählen Modelle, die zwischen Oktober 2015 und Februar 2019 vom Fließband liefen. Die Halter müssen sich zu einer Werkstatt begeben, wo die Gurtverankerung kostenfrei verstärkt werden soll. Für die Montage müssen Autofahrer dabei etwa 45 Minuten einkalkulieren. Vorfälle oder Personenschäden im Kontext der fehlerhaften Sicherheitsgurtverankerung sind aktuell nicht bekannt. Wir haben diesbezüglich bei Stellantis nachgefragt und werden diesen Artikel aktualisieren, sobald weitere Informationen vorliegen.

Das Wichtigste im Überblick:

  • Rückruf betrifft 243.000 Fahrzeuge des Modells Peugeot 308 (weltweit)
  • Nur Modelle mit den Baujahren 2015 bis 2019 weisen Mängel auf
  • Die Nachbesserung ist für die Halter kostenfrei und in 45 Minuten umgesetzt



Source link

Weiterlesen

Apps & Mobile Entwicklung

So holen HEMS noch mehr aus euren vier Wänden



Ihr habt genug von steigenden Strompreisen und möchtet das Maximum aus jeder Sonnenstunde auf eurem Dach herausholen? Dann seid Ihr bei Home Energy Management Systemen (HEMS) goldrichtig – und sogar ein Klick weit entfernt von einer Energierevolution in euren vier Wänden. Ein smarter Stromalltag ist keine entfernte Zukunftsvision mehr. Mit HEMS könnt Ihr Euer Haus zu einem echten Energiemeister trimmen, der nicht nur Kosten spart, sondern das Zusammenspiel der Geräte auf ein neues Level hebt. Lasst uns gemeinsam herausfinden, was mit der richtigen Technik alles drin ist.

Was sind HEMS eigentlich?

Vergesst die Zeiten, in denen Ihr „Strom sparen“ noch mit Licht ausmachen oder Waschmaschinen-Start verschieben gleichgesetzt habt. HEMS (Home Energy Management Systeme) sind digitale Gehirne für euer Haus: Sie beobachten, vergleichen und entscheiden im besten Fall selbst, wann Eure Geräte laufen. Überspitzt gesagt: Euer Zuhause bekommt eine eigene Schaltzentrale, die dafür sorgt, dass Euch kein Sonnenstrahl entgeht und möglichst wenig teurer Netzstrom verbraucht wird.

Von Schnittstellen zu Photovoltaikanlagen, Batteriespeichern und Wärmepumpen bis hin zu cleveren Apps, die mit Euch plaudern – HEMS bringen Bewegung ins Spiel, wenn es um Stromflüsse, Automatisierung und smarte Priorisierung geht. So läuft die Waschmaschine immer dann, wenn euer Dach volle Sonne liefert oder der Strompreis im Keller ist.

Warum lohnt sich der Einsatz?

Die große Frage: Was springt für Euch raus, wenn Ihr HEMS ins Boot holt? Die Antwort ist so einleuchtend wie ein sonniger Mittag: Ihr steuert nicht nur einzelne Geräte, sondern plant Verbrauch und Speicherung gezielt – was bares Geld sparen kann. Gerade wenn Ihr eine Wärmepumpe, E-Auto oder Speicherbatterie besitzt, spielt HEMS seine Stärken voll aus.

Strom, den Ihr selbst erzeugt, wird genau in den Momenten genutzt, in denen er am meisten wert ist. Oder Ihr schließt Lücken im Netz, wenn Überschüsse auch anderen helfen. Manche Systeme analysieren sogar Prognosedaten zu Wetter und Strompreis und kurbeln eure Effizienz auf ein ganz neues Level. Wer sich an die Idee eines Challenger-Teams aus Solarstrom, Algorithmus und Automation gewöhnt, kann im Vergleich zu reinem Eigenverbrauch deutlich mehr sparen.

So funktioniert smarte Steuerung

Ihr wollt Praxisbeispiele? Hier kommen sie: Stellt Euch vor, Euer HEMS merkt um 13:15 Uhr, dass sich gerade eine Peak-Sonneneinstrahlung auftut. Die Batterie ist ohnehin schon voll. Also signalisiert das System der Wallbox, jetzt das E-Auto zu laden. Oder Ihr lasst die Wärmepumpe genau in den günstigen Stromstunden durchlaufen, die App wählt automatisch die beste Zeit für euren Geschirrspüler. All das geschieht hinter den Kulissen – aber sichtbar auf Eurer Abrechnung.

Viele Systeme bieten zudem Presets und Empfehlungen, die sich an Euren Gewohnheiten anpassen lassen. Ihr wollt mehr Individualität? Dank der Schnittstellen zu dynamischen Stromtarifen entscheidet das System, wann externe Energie am preiswertesten dazukommt. Wer also clever plant, gönnt sich den teuersten Strom nur, wenn es unumgänglich ist.

Künstliche Intelligenz – der Energiemanager von morgen?

KI ist längst nicht mehr nur in Science-Fiction zu Hause – auch HEMS ziehen daraus ihren Nutzen. Selbstlernende Systeme beobachten tagtäglich euren Stromverbrauch, merken sich Muster und schlagen Euch Optimierungen vor. Prognosen auf Basis von Wetter, Preisen und euren Gewohnheiten helfen Euch dabei, euer Energiemanagement kontinuierlich zu verfeinern.

Und während sich euer Verhalten ändert oder neue Geräte einziehen, wächst der Algorithmus mit: Stromfresser erkennen? Automatisch abschalten, bevor neue Kosten entstehen? Check! Damit ist eure Stromlandschaft jederzeit topaktuell.

Lohnt sich der Einsatz für jedes Haus?

Hier kommt der Realitäts-Check: Klar gleicht nicht jede PV-Anlage einem Solarkraftwerk. Vor allem bei größeren PV-Anlagen (ab ca. 5.000 W Leistung und Speicher) rechnet sich HEMS besonders schnell. Wer aber nur ein Balkonkraftwerk sein Eigen nennt und auf dynamische Verbrauchsoptimierung verzichten kann, sollte die Kosten für etwaige Abos gut abwägen.

Denn: Viele HEMS-Hersteller bieten Basisfunktionen gratis an, für die volle Performance – inklusive KI, Prognosen und maximalen Automatisierungen – verlangen viele jedoch ein (monetär überschaubares) Jahresabo. Zwischen 50 und 100 Euro sollte man für die Profi-Features schon einplanen – die Ersparnis hängt dann im Gegenzug eng mit eurer Anlagenleistung und Flexibilität im Alltag zusammen. Bei Anlagen unter 2.000 Watt lohnt sich die Abovariante dank der Zusatzkosten eher nicht. Anlagen zwischen 2.000 und 5.000 Watt können dafür geeignet sein, je nachdem wie smart Ihr einzelne Komponenten Eures Haushalts steuern könnt. Ab Anlagen einer Größe von 5.000 Watt sowie einem Stromspeicher lohnt sich die Verwendung meiner Einschätzung nach immer. Doch auch hier gilt natürlich: Je größer die Anlage und eure elektronischen Verbraucher, desto größer ist die Gesamtersparnis. 

Wo sind die Stolpersteine versteckt?

Nicht alles, was smart glänzt, ist am Ende auch pures Gold. Prüft vor dem Kauf, welche Geräte, Speicher und Schnittstellen kompatibel sind und wo Euch der Hersteller vielleicht doch an ein monatliches Abo erinnert. Wer einen günstigen Stromtarif nutzt oder erst wenige steuerbare Geräte besitzt, profitiert eventuell zunächst nur begrenzt – vor allem, wenn aktive KI-Features hinter einer Paywall versteckt sind.

Am Ende zählt: Je besser Ihr Euer System kennt und nutzt, desto schneller landet Ihr im grünen Bereich. Und so manchen Umweg, den smarte Systeme heute noch zwingen, klärt vielleicht schon das nächste Software-Update.

Fazit: Die Sonne clever lenken statt einfach nur abzuwarten

HEMS ist mehr als Technik: Es ist ein Lebensgefühl für alle, die Strom nicht nur effizienter, sondern auch bewusster nutzen wollen. Ihr bringt das Zusammenspiel aus Eigenversorgung, Netz und Verbrauch auf ein neues Level – mit echter Energie, die Euch niemand mehr so leicht aus der Hand nehmen kann. Ihr wollt euer Zuhause zur Schaltzentrale der Energiewende machen? Packt die Sonnenbrille aus, denn mit HEMS wird’s richtig hell und effizient in diesem Sommer. 



Source link

Weiterlesen

Beliebt