Künstliche Intelligenz

Meta SAM 3 und 3D als offene Modelle verfügbar

Meta macht SAM 3, 3D Objects und 3D Body frei verfügbar. Das sind die neuesten Segmentierungsmodelle. Was sperrig klingt, meint tatsächlich das automatisierte Segmentieren von Objekten in Bildern und Videos. So lassen sich Objekte erfassen und beispielsweise in neue Umgebungen einfügen. Meta sieht darin einen wichtigen Schritt bei der Computer Vision.

Weiterlesen nach der Anzeige

SAM steht für Segment Anything Model. Man kann die neue Version etwa über die App Edits nutzen oder den Playground – eine extra eingerichtete Webseite, die Modelle sind aber auch frei auf den gängigen Plattformen verfügbar.

Redakteurin bearbeitet mit SAM. — (Bild: Eva-Maria Weiß / KI / SAM)

Im Playground lassen sich Bilder oder Videos hochladen und Elemente per Prompt auswählen, die SAM freistellt. Dafür reicht in der Regel ein einzelnes Wort, SAM erkennt etwas eine Person, einen Hund oder einen Wasserkocher. Möglich sind nur simple Prompts mit ein, zwei oder auch drei Wörtern. Das liegt daran, dass Meta sich für ein Encoder-Modell entschieden hat, statt ein großes Sprachmodell zu integrieren – wie uns Nikhila Ravi, Research-Engineer bei Meta in einem Interview erklärt.

Danach lassen sich Effekte anwenden. Man kann das Objekt klonen, verpixeln, Rahmen setzen, den Hintergrund verändern, schwärzen und vieles mehr. Die Bilder lassen sich herunterladen. Fast schon obligatorisches Einsatzgebiet für diese Art von Spielereien ist freilich Instagram. Die Bilder lassen sich aber auch anderswo hochladen und verschicken.

SAM 3D als Shopping-Hilfe

Möglich ist es auch, Objekte aus Fotos auszuwählen, von denen SAM ein 3D-Bild erstellt. Diese lassen sich dann wiederum in andere Hintergründe einfügen sowie Effekte drüberlegen. Eine Lampe im luftleeren Raum über Eis und mit Glühwürmchen-artigen Punkten ist zwar kein wirklich realistisches Nutzungsszenario, aber lustig. Hält man das Objekt mit der Maus fest, lässt sich der Blickwinkel ändern. Selbst Personen können zu 3D-Bildern werden, deren Bewegungen auch über mehrere Bilder hinweg segmentiert werden. Dafür gibt es das spezialisierte Modell SAM 3D Body, bei dem im Hintergrund die Skelettstruktur einer Person erfasst wird statt der Form des gesamten Körpervolumens.

Eine segmentierte Lampe hängt im Schnee. — Mit SAM 3D kann man eine Lampe in den Schnee hängen.

(Bild: SAM)

Meta testet die 3D-Funktion bereits im Facebook Marketplace aus. Dort können Käufer angebotene Wohngegenstände freistellen und in die eigenen Räumlichkeiten integrieren. An ähnlichen Funktionen wird im Online-Shopping schon lange gearbeitet, allerdings waren die Freisteller und Objekte bisher deutlich komplexer in der Erstellung. Dass man Gebrauchtwaren mal eben in ein 3D-Objekt umwandeln kann, ist neu.

Weiterlesen nach der Anzeige

Neben dem Playground kann SAM 3 auch in Edits genutzt werden. Das ist Metas KI-basierte Videoeditor-App. Die Funktionen sind hier ebenfalls darauf ausgelegt, die Videos und Bilder dann bei Instagram hochzuladen. Eine ähnliche App bietet auch Tiktok mit CapCut an.

Das Modell ist nicht darauf trainiert, etwa in der Medizin eingesetzt zu werden. Hierfür bedürfte es eines weiteren Finetunings. Die Einsatzgebiete von SAM reichen neben der spaßigen Bild- und Videobearbeitung bis zur Robotik und dem Datalabeling.

Neu ist auch das Modell SAM Audio. Damit lassen sich Geräusche, Sprache und Musik segmentieren. Möglich ist etwa, aus einer Videoaufnahme von einer Band nur die Gitarre herauszufiltern. Ein Gespräch oder Vogelgezwitscher können aus einer Umgebung separiert werden. Es reicht auch hier ein simpler Prompt. Meta spricht von einem Perception Encoder Audio Video – einem neuen ebenfalls frei verfügbaren Modell.

(emw)

Source link

Verwandte Themen:als audio IT KI-Modelle Künstliche Intelligenz meta Meta Platforms Modelle offene Sam und verfügbar Video

Up Next

Meta liefert mit SAM die Augen für multimodale Sprachmodelle

Nicht verpassen

39C3: Satellitenunabhängiges Navigationssystem R-Mode soll Ende 2026 starten

Künstliche Intelligenz

Dell schließt unzählige Sicherheitslücken in Avamar, iDRAC und NetWorker

Die Entwickler von Dell haben in Avamar und NetWorker massenhaft Schwachstellen in Komponenten wie Apache Tomcat und Spring Security geschlossen, die die Backuplösungen nutzen. Die Server-Fernverwaltung iDRAC bekommt ebenfalls ein Sicherheitsupdate.

Weiterlesen nach der Anzeige

Verwundbare Backuplösungen

In drei Warnmeldungen listet Dell die nun geschlossenen Sicherheitslücken in Komponenten von Drittanbietern auf, die Avamar und NetWorker betreffen.

Darunter fallen Komponenten wie Apache HTTP Server, Expat, OpenSSL und Vim. Der Großteil der geschlossenen Lücken stammt aus dem Jahr 2025. Darunter sind auch „kritische“ Schwachstellen (etwa Samba CVE-2025-10230), über die Schadcode auf Systeme gelangen kann. Es wurden aber auch Lücken geschlossen, die schon über zehn Jahre alt sind (zum Beispiel Apache HttpClient CVE-2015-5262 „mittel“).

Weitere Gefahr

Server-Admins sollten iDRAC-Service-Module für Linux und Windows auf den aktuellen Stand bringen. Geschieht das nicht, können sich Angreifer mit niedrigen Nutzerrechten aufgrund von Fehlern bei der Zugriffskontrolle höhere Nutzerrechte verschaffen (CVE-2026-23856). In einer Warnmeldung versichern die Entwickler, das Sicherheitsproblem in der Ausgabe 5.4.1.1 gelöst zu haben. Alle vorigen Versionen sollen verwundbar sein.

Weiterlesen nach der Anzeige

(des)

Source link

Künstliche Intelligenz

Redis 8.6 beschleunigt Durchsatz um das Fünffache

Die In-Memory-Datenbank Redis ist in Version 8.6 erschienen. Das Update steigert den Durchsatz bei Caching-Workloads auf ARM-Prozessoren um mehr als das Fünffache gegenüber Redis 7.2. Auf einem 16-Kern-System in der AWS-Cloud mit einem Graviton4-Prozessor erreichte Redis 8.6 in Benchmarks bis zu 3,5 Millionen Operationen pro Sekunde.

Weiterlesen nach der Anzeige

Die Entwickler optimierten zahlreiche Komponenten: Sorted Sets verzeichnen eine Latenzreduktion von bis zu 35 Prozent, GET-Operationen bei kurzen Strings führt Redis 15 Prozent schneller durch. Beim Speicherverbrauch sinkt der RAM-Bedarf für Hashes um 16,7 Prozent, für Sorted Sets sogar um 30,5 Prozent. Diese Verbesserungen betreffen nicht nur ARM-Systeme – auf Intel- und AMD-Plattformen zeigen sich ähnliche Verbesserungen.

Für KI- und Machine-Learning-Anwendungen bringt Redis 8.6 beschleunigte Vektor-Operationen: Die Geschwindigkeit beim Einfügen von Vektoren steigt um 43 Prozent, Abfragen werden 58 Prozent schneller durchgeführt. Dies gilt besonders bei binärer und 8-Bit-Quantisierung auf x86-64-Systemen.

Idempotente Produktion verhindert Duplikate in Streams

Eine weitere zentrale Neuerung betrifft Redis Streams. Der XADD-Befehl unterstützt jetzt idempotente Produktion durch die Parameter IDMP und IDMPAUTO. Damit lassen sich Duplikate vermeiden, wenn Produzenten nach Netzwerkfehlern oder Abstürzen Nachrichten erneut senden. Jeder Produzent erhält eine eindeutige Producer-ID, jede Nachricht eine Idempotency-ID – entweder manuell vergeben oder automatisch aus dem Nachrichteninhalt generiert.

Administratoren können die Haltedauer dieser IDs über XCFGSET STREAM IDMP-DURATION steuern und die maximale Anzahl pro Producer mit IDMP-MAXSIZE begrenzen. Die idempotente Produktion ist besonders wichtig bei Systemen mit mehreren Consumer-Groups: Stürzt etwa der Producer bei einer Essensbestellung nach dem Senden ab, verhindert die Idempotenz, dass Küche, Lager und Lieferdienst die Bestellung doppelt verarbeiten. Eine Einschränkung gibt es jedoch: Die Kombination aus idempotenter Produktion und AOF-Persistierung ohne RDB-Preamble führt derzeit zu Problemen – ein Patch soll folgen.

Neue Eviction-Strategien für Write-Heavy-Workloads

Weiterlesen nach der Anzeige

Mit den LRM-Policies (Least Recently Modified) erweitert Redis 8.6 die Eviction-Strategien. Anders als die etablierten LRU-Policies (Least Recently Used) berücksichtigt LRM nicht den letzten Lesezugriff, sondern ausschließlich Schreiboperationen. Das ist vorteilhaft bei write-intensiven Anwendungen oder KI-Workloads, wo Lesezugriffe die Relevanz eines Eintrags nicht beeinflussen sollen. Verfügbar sind volatile-lrm für Keys mit TTL und allkeys-lrm für alle Schlüssel.

Cluster-Betreiber profitieren vom neuen HOTKEYS-Befehl. Er identifiziert CPU- oder Netzwerk-intensive Schlüssel pro Slot und ermöglicht gezielte Optimierungen. In Kombination mit der in Redis 8.4 eingeführten atomaren Slot-Migration lassen sich Hotspots im Cluster gezielt beseitigen. Die Analyse startet mit HOTKEYS START, wobei Metriken, Stichprobenrate und Dauer konfigurierbar sind.

TLS-Zertifikate zur Authentifizierung

Für mTLS-Umgebungen vereinfacht Redis 8.6 die Authentifizierung: Clients können sich automatisch über ihr TLS-Zertifikat anmelden, wenn der Common Name des Zertifikats einem ACL-Benutzer entspricht. Die Konfiguration erfolgt mit tls-auth-clients-user CN und ACL SETUSER on nopass. Damit entfällt die separate Passwort-Authentifizierung – das Zertifikat dient als einzige Credential.

Time-Series-Datenbanken unterstützt Redis 8.6 mit NaN-Werten (Not a Number) in TS.ADD und TS.MADD. Neue Aggregatoren wie COUNTNAN und COUNTALL behandeln fehlende Messwerte korrekt, während bestehende Aggregatoren NaN-Werte ignorieren.

Alle Informationen zum neuen Release finden sich im Blog des Projekts. Redis 8.6 ist als Open-Source-Software unter der AGPLv3-Lizenz verfügbar. Die Unified Distribution enthält alle Funktionen einschließlich RedisTimeSeries, RedisBloom und RedisJSON in einem Paket. Binaries stehen für Docker, Snap, Homebrew sowie als RPM- und Debian-Pakete bereit. Die Version haben die Entwickler auf Ubuntu 22.04/24.04, Rocky Linux, AlmaLinux, Debian und macOS getestet.

(fo)

Source link

Künstliche Intelligenz

Chrome 145 bringt JPEG XL zurück

Google hat Chrome 145 für Windows, macOS und Linux veröffentlicht. Die Version umfasst einige kleinere neue Features und schließt elf Sicherheitslücken, darunter drei mit hoher Priorität. Vor allem aber bringt die neue Version des Browsers den Support des Bildformats JPEG XL zurück, dem sich Google offiziell lange verweigert hatte.

Weiterlesen nach der Anzeige

JPEG XL: Von der Entfernung zur Rückkehr

Google hatte die Unterstützung für das Format Anfang 2023 in Chrome 110 entfernt – mit der Begründung, es gebe zu wenig Interesse im Ökosystem und unzureichende Vorteile gegenüber bestehenden Formaten. Die Entscheidung stieß auf massive Kritik: Über 1000 Upvotes im Chromium-Bug-Tracker protestierten gegen die Entfernung, die Free Software Foundation kritisierte die Entscheidung als Einengung von Nutzer-Wahlmöglichkeiten. Jon Sneyers, Mitentwickler von JPEG XL, vermutete einen internen Konflikt bei Google zwischen JPEG-XL-Befürwortern und Vertretern der konkurrierenden Google-Formate AVIF und WebP.

JPEG XL wurde als moderner Standard für Bildkompression entwickelt und basiert auf Googles PIK und Cloudinarys FUIF. Der Standard wurde im Dezember 2020 finalisiert und im Oktober 2021 als internationaler Standard verabschiedet. Das Format bietet höhere Kompressionsraten als JPEG, unterstützt verlustfreie Kompression und ist offen sowie lizenzgebührenfrei. Experimentell war JPEG XL bereits ab Chrome 91 mit einem Feature Flag verfügbar.

Die Neubewertung begann im November 2025, als das Chromium-Team die Wiederaufnahme ankündigte. Ausschlaggebend waren mehrere Faktoren: Apple hatte den JPEG-XL-Support in Safari implementiert, Mozilla seine neutrale Haltung aufgegeben und die PDF-Association das Format im Oktober 2025 als empfohlen in PDF-Spezifikationen aufgenommen. Technisch plant Chromium die Integration von „jxl-rs“, einem Rust-basierten JPEG-XL-Decoder. Google nutzt das Format bereits praktisch: Die Google Cloud Platform DICOM API verwendet JPEG XL für eine Reduktion der Dateigröße um 20 Prozent.

Neue Features in Chrome 145

Chrome 145 bringt außerdem diverse neue Funktionen. Column wrapping für Multicol ermöglicht vertikales Spaltenlayout und 2D-Spaltenlayout. Device Bound Session Credentials schützen Nutzer-Sessions besser. Die neue Origin API vereinfacht die Arbeit mit Origins. Bei CSS unterstützt der Browser nun das text-justify-Property für bessere Kontrolle über Textausrichtung bei Blocksatz sowie prozentuale Werte für letter-spacing und word-spacing für responsive Typografie.

Weitere Neuerungen umfassen eine optimierte Schattenberechnung bei hohen border-radius-Werten, neue Event-Handler wie onanimationcancel für CSS Animations und die focusVisible-Option zur Kontrolle über Fokusring-Anzeige. Das Customizable-select-Element verbessert das Listbox-Rendering, während Monochrome-Emoji im Forced-Colors-Modus die Darstellung verbessern.

Weiterlesen nach der Anzeige

Behobene Sicherheitslücken

Besonders kritisch sind drei als „High Severity“ eingestufte Schwachstellen. CVE-2026-2313 betrifft einen Use-after-free-Fehler in CSS, CVE-2026-2314 beschreibt einen Heap-Buffer-Overflow in den Codecs und CVE-2026-2315 eine fehlerhafte Implementierung in WebGPU. Alle drei Lücken lassen sich durch manipulierte HTML-Seiten ausnutzen und erreichen einen CVSS-Score von 8.8. Für die Meldung von CVE-2026-2313 zahlte Google 8000 US-Dollar an die Forscher Han Zheng, Wenhao Fang und Qinying Wang.

Die mittelschweren Sicherheitslücken umfassen unter anderem CVE-2026-2316, die UI-Spoofing in Frames ermöglicht, sowie CVE-2026-2317, die ein Cross-Origin-Datenleck in der Animation-Implementierung erlaubt. Eine Race-Condition in den DevTools (CVE-2026-2319) könnte Object-Corruption via bösartiger Erweiterungen ermöglichen. Insgesamt zahlte Google für die gemeldeten Schwachstellen Prämien zwischen 500 und 8000 US-Dollar.

Alle Informationen zur neuen Version 145 finden sich in den Release-Notes. Anwender sollten Chrome zeitnah aktualisieren, da die Sicherheitslücken remote über manipulierte Webseiten ausnutzbar sind. Chrome aktualisiert sich in der Regel automatisch, Nutzer können die Aktualisierung aber über „Einstellungen/Über Google Chrome“ manuell anstoßen.

(fo)

Source link

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Entwicklung & Codevor 3 Monaten

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Künstliche Intelligenzvor 1 Monat

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Apps & Mobile Entwicklungvor 3 Monaten

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Fast 5 GB pro mm²: Sandisk und Kioxia kommen mit höchster Bitdichte zum ISSCC

Apps & Mobile Entwicklungvor 3 Monaten

Fast 5 GB pro mm²: Sandisk und Kioxia kommen mit höchster Bitdichte zum ISSCC

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Entwicklung & Codevor 2 Monaten

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Syncthing‑Fork unter fremder Kontrolle? Community schluckt das nicht

Datenschutz & Sicherheitvor 2 Monaten

Syncthing‑Fork unter fremder Kontrolle? Community schluckt das nicht

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Social Mediavor 2 Monaten

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Weiter billig Tanken und Heizen: Koalition will CO₂-Preis für 2027 nicht erhöhen

Künstliche Intelligenzvor 3 Monaten

Weiter billig Tanken und Heizen: Koalition will CO₂-Preis für 2027 nicht erhöhen

Inspohub

Meta SAM 3 und 3D als offene Modelle verfügbar

Künstliche Intelligenz

Meta SAM 3 und 3D als offene Modelle verfügbar

SAM 3D als Shopping-Hilfe

Künstliche Intelligenz

Dell schließt unzählige Sicherheitslücken in Avamar, iDRAC und NetWorker

Verwundbare Backuplösungen

Weitere Gefahr

Künstliche Intelligenz

Redis 8.6 beschleunigt Durchsatz um das Fünffache

Idempotente Produktion verhindert Duplikate in Streams

Neue Eviction-Strategien für Write-Heavy-Workloads

TLS-Zertifikate zur Authentifizierung

Künstliche Intelligenz

Chrome 145 bringt JPEG XL zurück

JPEG XL: Von der Entfernung zur Rückkehr

Neue Features in Chrome 145

Behobene Sicherheitslücken

HBM4 für Nvidia Vera Rubin: Samsung startet Massenproduktion und Auslieferung

Android 17: Google macht Rückzieher bei erster Beta – das steckt drin

Dell schließt unzählige Sicherheitslücken in Avamar, iDRAC und NetWorker

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Beliebt

Inspohub

Meta SAM 3 und 3D als offene Modelle verfügbar

SAM 3D als Shopping-Hilfe

Das könnte Ihnen gefallen

Künstliche Intelligenz

Dell schließt unzählige Sicherheitslücken in Avamar, iDRAC und NetWorker

Verwundbare Backuplösungen

Weitere Gefahr

Künstliche Intelligenz

Redis 8.6 beschleunigt Durchsatz um das Fünffache

Idempotente Produktion verhindert Duplikate in Streams

Neue Eviction-Strategien für Write-Heavy-Workloads

TLS-Zertifikate zur Authentifizierung

Künstliche Intelligenz

Chrome 145 bringt JPEG XL zurück

JPEG XL: Von der Entfernung zur Rückkehr

Neue Features in Chrome 145

Behobene Sicherheitslücken

HBM4 für Nvidia Vera Rubin: Samsung startet Massenproduktion und Auslieferung

Android 17: Google macht Rückzieher bei erster Beta – das steckt drin

Dell schließt unzählige Sicherheitslücken in Avamar, iDRAC und NetWorker

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Beliebt