Künstliche Intelligenz
Grafikkartenpreise schießen hoch, GeForce RTX 5070 Ti verschwindet
Alle Desktop-Grafikkarten mit mehr als 8 GByte Speicher sind in den vergangenen Wochen teurer geworden. Am stärksten trifft es Nvidias Topmodell GeForce RTX 5090, das nur noch vereinzelt für unter 3500 Euro erhältlich ist. Seit dem Sommer 2025 sind die Preise um mehr als 50 Prozent gestiegen.
Weiterlesen nach der Anzeige
Das zweitschnellste Modell GeForce RTX 5080 kostet inzwischen mindestens 1180 Euro statt knapp über 1000. Bei der nahen verwandten RTX 5070 Ti sind die Preiserhöhungen noch nicht ganz so stark, allerdings dürfte das nur noch eine Frage der Zeit sein: Kartenhersteller sagten dem renommierten Youtube-Kanal Hardware Unboxed, dass Nvidia die RTX 5070 Ti einstellen will. In den kommenden Wochen würden demnach nur noch Lagerbestände abverkauft.
Aus Nvidias Sicht erscheint die Entscheidung nachvollziehbar: Die GeForce RTX 5070 Ti nutzt die gleiche GPU wie die RTX 5080, allerdings in einer beschnittenen Form. Die Ausbeute beim Chipauftragsfertiger TSMC sollte inzwischen aber so hoch sein, dass die Teildeaktivierung nur noch selten nötig ist und Nvidia lieber die teurere RTX-5080-Version verkauft.
8 GByte sollen wieder toll sein
Generell wollen AMD und Nvidia offenbar den Fokus auf Einstiegs- und Mittelklasse-Grafikkarten mit 8 GByte Speicher legen. Diese Behauptung von Hardware Unboxed haben wir uns von deutschen Händlern bestätigen lassen.
Passend dazu trotzt gerade die GeForce RTX 5060 dem Preistrend – die Preise sind zuletzt sogar gefallen (ab 279 €). Die RTX 5060 Ti mit 8 GByte zeigt sich stabil. Die 16-GByte-Versionen stiegen zuletzt und sollen wie die RTX 5070 Ti absehbar vom Markt verschwinden.
Weiterlesen nach der Anzeige
Die GeForce RTX 5070 mit 12 GByte Speicher steht zwischen den Stühlen. Sie soll erhältlich bleiben, dürfte aber stärker im Preis steigen als die 8-GByte-Grafikkarten.
2023 noch verpönt
Der Fokus auf 8-GByte-Modelle lässt insbesondere bei AMD die Augenbrauen aufzucken. Schon im Jahr 2023 bewarb die Firma den Vorteil der eigenen 16-GByte-Grafikkarten gegenüber Nvidias Konkurrenz mit 8 und 10 GByte.
In einem Blog-Beitrag zum Bau eines High-End-PCs schrieb AMD: „Für diesen Enthusiasten-PC empfehlen wir Grafikkarten mit mindestens 16 GByte Videospeicher für ultimatives Gaming in 1440p und 4K. Für Grafikkarten der Mittelklasse, die auf 1440p ausgerichtet sind, bietet AMD Radeon-GPUs mit 12 GByte, die sich hervorragend für QHD-Displays eignen.“
Der Blog-Beitrag ist gelöscht, lässt sich aber noch archiviert finden.
Bei AMD steigen die Preise derweil durch die Bank. Eine Radeon RX 9070 XT kostet mindestens 650 statt knapp 600 Euro. Die RX 9070 steigt noch stärker von rund 520 auf 600 Euro. Eine RX 9060 XT ist nicht mehr unter 300 Euro zu bekommen.
(mma)
Künstliche Intelligenz
Gegen Überwachung: Android-App spürt nahe Smart Glasses auf
Die Android-App „Nearby Glasses“ scannt nach Bluetooth-Signalen in der Umgebung. Erkennt sie in diesen Signalen eine Herstellerkennung von Smart Glasses der Marke Ray-Ban, Oakley und Snap, werden Nutzer darüber benachrichtigt. Der Soziologe und Gelegenheitsentwickler Yves Jeanrenaud hat die App programmiert, weil er Smart Glasses als „unzumutbaren Eingriff“ in die Privatsphäre betrachtet, wie er auf GitHub schreibt.
Weiterlesen nach der Anzeige
Jeanrenaud weist auf GitHub darauf hin, dass seine App nicht perfekt sei. Fehlalarme seien wahrscheinlich, weil die Kennung nur den Hersteller verrät, nicht das konkrete Produkt. So könne auch eine VR-Brille erkannt werden, während umgekehrt längst nicht alle Smart Glasses erfasst würden. Jeanrenaud ruft daher zu einem besonnenen Umgang mit der App auf
Wachsende Verbreitung, offene Fragen zum Datenschutz
Viele Smart Glasses sind heute oft nur aus der Nähe als solche zu erkennen. Bei Metas Modell signalisiert eine LED Außenstehenden, dass gefilmt wird. Bei hellem Tageslicht ist sie jedoch kaum wahrnehmbar. Gegen einfache Manipulationen wie das Abkleben der LED sind die Brillen allerdings geschützt und blockieren in diesem Fall die Aufnahmefunktion.
Aufgrund ihrer geringen Verbreitung spielen Smart Glasses in der öffentlichen Debatte bislang kaum eine Rolle. Das könnte sich in den nächsten Jahren ändern. Marktführer Meta und EssilorLuxottica haben im vergangenen Jahr sieben Millionen Geräte verkauft, und mit dem Markteintritt von Google und Apple in diesem und nächsten Jahr könnte die Kategorie rasch an Verbreitung gewinnen. Zudem arbeitet Meta laut einem Bericht der New York Times an einer begrenzten Gesichtserkennungsfunktion für seine Smart Glasses.
heise online XR-Briefing abonnieren
Jeden zweiten Montag, liefern wir Ihnen die wichtigsten Entwicklungen der XR-Branche. Damit Sie alles im Blick behalten.
E-Mail-Adresse
Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.
„Ich möchte weder Techniklösungen als Allheilmittel darstellen, noch ein falsches Sicherheitsgefühl vermitteln“, schreibt Jeanrenaud auf Github. „Wir brauchen bessere Lösungen, um Überwachungstechnologien und Eingriffe in die Privatsphäre einzudämmen.“
Weiterlesen nach der Anzeige
„Nearby Glasses“ ist im Google Play Store erhältlich. Alternativ ist sie auch bei GitHub verfügbar, wo es weitere Hinweise zu Funktionsweise und Einrichtung gibt. Dort nennt Jeanrenaud auch potenzielle Ausbauschritte wie die Erkennung weiterer Smart Glasses und eine iOS-App. Für Letztere fehlten ihm allerdings noch die nötigen Entwicklungskenntnisse.
(tobe)
Künstliche Intelligenz
Vision Language Model: Wie FastVLM hochauflösende Bilder im Browser analysiert
Vision Language Models (VLMs) verbinden visuelle Wahrnehmung mit natürlichen Sprachfähigkeiten und erlauben es, komplexe Aufgaben wie Bildbeschreibung, das Beantworten natürlichsprachiger Anfragen zu Bildern oder multimodale Suche zu erledigen. In den vergangenen Jahren hat sich gezeigt, dass höhere Eingabeauflösungen die Leistungsfähigkeit dieser Modelle deutlich steigern, vor allem bei textintensiven Bildern. Gleichzeitig wächst mit jeder zusätzlichen Bildzeile die Sequenzlänge des Vision-Encoders, wodurch etwa die Zahl der Vision-Token zunimmt und das Sprachmodell eine längere Eingabesequenz verarbeiten muss, was die Inferenzzeit erhöht. Diese Latenz ist für Anwendungen problematisch, die interaktiv und responsiv sein sollen, etwa in Webbrowsern oder auf mobilen Geräten mit begrenzter Rechenleistung.
Klassische VLMs basieren auf Vision-Encoder-Decoder-Architekturen. Als Vision-Encoder dienen vielfach rein Transformer-basierte Modelle wie ViT-B/16 oder Hybridvarianten mit einem Convolutional Neural Network (CNN) als Backbone. Diese Modelle teilen das Bild in Patches, beispielsweise 16 × 16 Pixel groß, projizieren jeden Patch in einen Embedding-Vektor und verarbeiten die Sequenz durch mehrere Self-Attention-Layer. Die Komplexität der Schichten wächst quadratisch mit der Anzahl der Patches (PDF), sodass eine erhöhte Bildauflösung die Latenz schnell in die Höhe treibt. Um diese Latenz zu reduzieren, haben Wissenschaftler Methoden wie Token Pruning oder Token Merging vorgeschlagen, die weniger wichtige Patches verwerfen oder zusammenfassen. Alternativ gibt es kachelbasierte Ansätze, die ein Bild in mehrere Teile zerlegen und separat verarbeiten. All diese Techniken reduzieren die Tokenanzahl, benötigen aber zusätzliche Verarbeitungsschritte oder führen zu Genauigkeitsverlusten.
- In herkömmlichen Vision Language Models führt eine erhöhte Bildauflösung zu weniger performanten Sprachmodellen.
- Durch die hohen Anforderungen an Speicher und Rechenleistung passen die Modelle für den Einsatz im Browser oder auf mobilen Geräten nicht.
- Das von Apple entwickelte Bildverarbeitungsmodell FastVLM läuft lokal im Browser und verfolgt einen anderen Ansatz: Über den hybriden Vision-Encoder FastViTHD reduziert es die Tokenanzahl bereits während der visuellen Codierung, ohne Genauigkeit einzubüßen.
Durch die hohen Anforderungen an Speicher und Rechenleistung sind herkömmliche VLMs für den Einsatz im Browser oder auf mobilen Geräten ungeeignet. Selbst wenn das Modell auf einem Server läuft, verursachen GPU-Infrastruktur und Energieverbrauch hohe Kosten. Gleichzeitig nimmt die Latenz zu, wenn eine Anwendung zwischen Client und Server Bilder übertragen muss. Diese Hürde motivierte die Entwicklung von FastVLM: einem VLM, das lokal und ressourcensparend arbeitet, ohne auf aufwendige Token-Pruning-Heuristiken zurückzugreifen, und dennoch konkurrenzfähige Genauigkeit bietet.
Das war die Leseprobe unseres heise-Plus-Artikels „Vision Language Model: Wie FastVLM hochauflösende Bilder im Browser analysiert“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Künstliche Intelligenz
ARD: KI findet Einzug in öffentlich-rechtliche Radiosendungen
Die ARD führt KI-Stimmen für Teile ihres Radioangebotes ein. Ab dem 3. März sollen die Verkehrs- und Wettermeldungen in den gemeinschaftlichen Sendungen „Pop – Die Abendshow“ und „Popnacht“ demnach von einer KI vorgetragen werden. Akute Gefahrenmeldungen übernehme weiterhin die Live-Redaktion.
Weiterlesen nach der Anzeige
Die Abend- und Nachtprogramme werden auf den öffentlich-rechtlichen Sendern hr3, rbb 88.8, MDR JUMP, NDR 2, Bremen Vier, SR 1, SWR3 und WDR 2 gesendet. Die beiden Gemeinschaftsprogramme sind Anfang 2025 entstanden und haben bisher bundesweit einheitliche Verkehrs- und Wettermeldungen gesendet. Die KI soll nun je nach Sendegebiet regionalisierte Meldungen ermöglichen. Das Sounddesign der einzelnen Sender sowie regionale Nachrichten waren schon von Beginn an individuell. Produziert werden die Gemeinschaftsprogramme von SWR3.
Die KI trage dabei lediglich Texte vor, die von den entsprechenden Redaktionen geschrieben und überprüft worden seien. Eigene Meldungen formulieren oder Geschriebenes ändern dürfe sie hingegen nicht. Die ARD gibt an, das System solle keine menschlichen Mitarbeitenden ersetzen.
Die ARD erklärt zudem, dass von der KI vertonte Meldungen nur in Kombination mit einem entsprechenden Transparenzhinweis gesendet würden. Die Stimmen der KI sollen auf denen des echten Moderationsteams beruhen. „Entwickelt und konfiguriert wurde das KI-gestützte Datenverarbeitungs- und Sprachausgabesystem in enger Kooperation von SWR und WDR“, teilte die ARD mit. Dabei stünden Datenschutz und Sicherheit im Vordergrund.
Bei heise kommt im Podcast „Kurz informiert“ bereits seit 2022 eine KI-generierte Stimme der Moderatorin Isabel Grünewald zum Einsatz.
KI-Anteil in Radios nimmt zu
Bereits Anfang des Jahres haben ARD, ZDF, Deutschlandradio und Deutsche Welle einen gemeinsamen Grundsatzkatalog für die Nutzung von KI in redaktionellen Prozessen und in der Berichterstattung veröffentlicht. Der Einsatz von KI wird dabei nicht ausgeschlossen, jedoch an einen journalistischen Mehrwert, Nachhaltigkeit und Transparenz geknüpft.
Weiterlesen nach der Anzeige
In privaten Radios ist der Einsatz von KI weiter verbreitet, wie eine Recherche von heise zeigt. Besonders in der Nacht spielen einige private Radiosender hauptsächlich KI-generierte Lieder. Dahinter stecken vor allem kommerzielle Gründe, da für KI-generierte Musik keine Abgaben an die Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte (GEMA) anfallen.
(mho)
-
Künstliche Intelligenzvor 2 MonatenSchnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt
-
Social Mediavor 3 WochenCommunity Management zwischen Reichweite und Verantwortung
-
Künstliche Intelligenzvor 2 Wochen
Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar
-
Datenschutz & Sicherheitvor 3 MonatenSyncthing‑Fork unter fremder Kontrolle? Community schluckt das nicht
-
Entwicklung & Codevor 3 MonatenKommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren
-
Künstliche Intelligenzvor 3 MonatenGame Over: JetBrains beendet Fleet und startet mit KI‑Plattform neu
-
Social Mediavor 2 MonatenDie meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights
-
Künstliche Intelligenzvor 3 MonatenDigital Health: „Den meisten ist nicht klar, wie existenziell IT‑Sicherheit ist“
