Künstliche Intelligenz
iOS 26: Apples Speech-APIs lassen Whisper in puncto Geschwindigkeit alt aussehen
Apple legt in seinen kommenden Betriebssystem-Versionen bei der Transkription von Live-Audio oder Aufnahmen deutlich zu. In verschiedenen Tests wurde die Leistung jetzt mit gängigen anderen Spracherkennungs-Modellen verglichen. Die Ergebnisse sind allerdings gemischt: Apples neue API, die in iOS 26, iPadOS 26 und macOS 26 Tahoe bereitgestellt wird, steht bei der Geschwindigkeit deutlich besser da als zum Beispiel das verbreitete Whisper-Modell von OpenAI. Allerdings gibt es bei der Genauigkeit noch Luft nach oben.
Das Apple-Nachrichten-Blog MacStories erprobte das verbesserte Speech-Framework mit einer 34-minütigen Videodatei. Zur Transkription wurde für den Test von Apples APIs ein Tool namens Yap verwendet, das auf GitHub abgerufen werden kann. Es erledigte die Aufgabe in nur 45 Sekunden, während das recht beliebte Tool MacWhisper mit seinen Large-Modellen zwischen 1:41 Minuten und 3:55 Minuten benötigte.
Wie sich die Modelle im Vergleich schlagen
Die Nachrichtenseite 9to5Mac ließ Apples API gegen NVIDIA Parakeet antreten, das als sehr schnell gilt, und gegen OpenAI Whisper Large V3 Turbo. Testrechner war ein MacBook Pro mit M2 Pro und 16 GByte Unified Memory. Während Parakeet das 7:31 Minuten lange Audio-File in 2 Sekunden schaffte, benötigte Apples Transkription 9 Sekunden. Das OpenAI-Modell war erst nach 40 Sekunden fertig. Je länger die Audiodatei war, desto weiter lagen die Modelle zeitlich auseinander.
Doch Whispers Langsamkeit zahlte sich wiederum bei der Genauigkeit aus. Dabei wurde zwischen dem Anteil an Zeichenfehlern (Character Error Rate, CER) und Wortfehlern (Word Error Rate, WER) unterschieden. Durchschnittlich erwies sich Whisper Large V3 Turbo mit einer CER von 0,3 Prozent und einer WER von 1 Prozent als die genaueste Lösung. Apple hatte bei den Zeichen eine Fehlerrate von durchschnittlich 3 Prozent und bei Wörtern von 8 Prozent. Parakeet liegt deutlich zurück mit einer CER von 7 Prozent und einer WER von 12 Prozent.
Wofür sich Apples API empfiehlt
Damit verspricht Apples Transkription im Ergebnis einen deutlichen Geschwindigkeitsvorteil gegenüber Whisper und macht dabei nicht so viele Fehler wie das NVIDIA-Modell. Die Tester kommen zu dem Ergebnis, dass die Wahl des Modells damit vor allem eine Frage des Anwendungszwecks ist. Apples Modell empfiehlt sich für zeitkritische Anwendungen wie Live-Untertitel oder die grobe Transkription längerer Inhalte zur Indexierung. Whisper hat die Nase vorn, wenn nur minimale Nachbearbeitung gewünscht ist oder bei Anwendungen, wo es auf die Genauigkeit ankommt.
(mki)
Künstliche Intelligenz
#heiseshow: Showrooming, Handyverbot an Schulen, Googles KI-Übersichten
Markus Will, heise-online-Chefredakteur Dr. Volker Zota und Malte Kirchner sprechen in dieser Ausgabe der #heiseshow unter anderem über folgende Themen:
- Verraten und verkauft? Einzelhandel ärgert sich über Beratungsmissbrauch – Der stationäre Handel leidet unter Showrooming: Kunden lassen sich beraten, kaufen dann aber online. Welche Strategien entwickeln Händler dagegen? Ist das Verhalten der Kunden unmoralisch oder einfach rational? Und wie können lokale Geschäfte ihre Beratung wieder zu einem echten Mehrwert machen?
- Kinder, bitte abschalten: Helfen Handyverbote an Schulen? – Immer mehr Schulen diskutieren über generelle Handyverbote. Können solche Verbote tatsächlich die Konzentration der Schüler verbessern? Welche Rolle spielen digitale Medien in der modernen Bildung? Und wie finden Schulen die Balance zwischen digitalem Lernen und analoger Aufmerksamkeit?
- Übersichtliche Freude: Ruinieren Googles KI-Übersichten das freie Web? – Googles AI Overviews fassen Suchergebnisse direkt zusammen, was zu deutlichen Traffic-Rückgängen bei Websites führt. Bedroht diese Entwicklung das Geschäftsmodell vieler Online-Publisher? Wie können sich Content-Anbieter an die neue Realität anpassen? Und welche Auswirkungen hat das auf die Vielfalt der Informationen im Netz?
Außerdem wieder mit dabei: ein Nerd-Geburtstag, das WTF der Woche und knifflige Quizfragen.
Jeden Donnerstag ab 17 Uhr live
Fragen an die Moderatoren und Gäste können während der Sendung im YouTube-Chat und in unserem Twitch-Kanal (twitch.tv/heiseonline) sowie vorab per E-Mail und im heise-Forum gestellt werden. Die Redaktion freut sich bereits auf zahlreiche Zuschauer und auf reges Feedback.
Die #heiseshow wird jeden Donnerstag um 17 Uhr live auf heise online gestreamt. Nach der Live-Übertragung ist die Sendung zum Nachschauen und -hören auf YouTube und als Podcast verfügbar:
(mki)
Künstliche Intelligenz
Amazons künftige Fire-Tablets wohl mit Android statt eigenem Betriebssystem
Die Tablet-Serie Amazons soll bald bedeutenden Änderungen unterzogen werden. Nach Angaben verschiedener, mit den Plänen vertrauter Quellen plant Amazon ein neues und höherpreisiges Tablet-Modell, das als Betriebssystem erstmals Android statt des selbst entwickelten Fire OS nutzen wird. Dieses Android-Tablet von Amazon könnte bereits nächstes Jahr erscheinen. Das Projekt läuft intern unter dem Namen „Kittyhawk“, aber könnte sich aufgrund verschiedener Einflüsse, vor allem von finanzieller Seite, verzögern oder sogar verworfen werden.
Amazon setzt für seine Fire-Tablets bislang auf eine hochgradig modifizierte und auf Amazon-Zwecke angepasste Version von Android namens „Fire OS“. Nutzer sind für die Installation von Apps auf Amazon angewiesen und können nicht frei aus Googles Play Store wählen. Das ermöglicht Amazon, die Hardware fast zum Selbstkostenpreis zu verkaufen. Denn der Konzern profitiert erheblich von den Apps, etwa durch den Verkauf oder die Vermietung von Filmen, Fernsehserien oder Musik.
Software-Entwickler müssen deshalb allerdings verschiedene Versionen ihrer Apps herausbringen, wollen sie neben Android- und Apple-Tablets auch Amazon bedienen. Das begrenzt die Auswahl der Apps für Fire-Tablets. Zudem beschränkt sich Amazon auf einfachere Tablets mit begrenztem Funktionsumfang, um die Kosten niedrig zu halten und Käufern den Einstieg zu erleichtern. Das wiederum schließt Nutzer aus, die nach höherwertigen und leistungsfähigeren Tablets suchen.
Amazons Android-Tablet teurer als Fire-Tablets
Vor rund zwei Jahren hat Amazon mit dem Fire Max 11 ab 270 Euro sein bislang größtes Tablet vorgestellt. Es ist nicht nur optional mit Eingabestift und Tastaturhülle erhältlich (zum Aufpreis), es ist auch Amazons erstes Tablet mit Fingerabdrucksensor. Dieses Modell sollte die letztgenannte Zielgruppe ansprechen, ein Android-Tablet wäre der nächste Schritt, wie Reuters exklusiv unter Berufung auf sechs mit dem Projekt vertraute Personen berichtet.
Demnach soll das Android-Tablet von Amazon deutlich mehr kosten als die bisherigen Fire-Tablets. Intern wurde ein Preis von 400 US-Dollar diskutiert, nahezu doppelt so viel wie das in den USA ab 230 Dollar angebotene Fire Max 11. Mit 400 Dollar würde Amazon bereits die günstigsten iPads erreichen, die Apple für 350 bis 1200 Dollar verkauft. Die Spezifikationen von Amazons erstem Android-Tablet, wie Bildschirmgröße oder Speicherausstattung, sind bislang nicht zu erfahren.
Amazon-Tablet mit Open-Source-Android
Die Quellen erklären aber auch, dass dieses Tablet-Modell die Open-Source-Version von Android nutzen wird, sodass Amazon nicht direkt auf Google angewiesen ist und das Betriebssystem zu eigenen Zwecken anpassen kann. Bevor dieses Android-Tablet erscheint, plant Amazon aber noch einige günstigere Tablets mit dem Linux-basierten Vega-Betriebssystem, das bereits verschiedene Fire-TV-Geräte antreibt. Langfristig wird die Tablet-Reihe Amazons aber komplett auf Android umgestellt, heißt es weiter.
Lesen Sie auch
Der Name dieses Projekts dürfte auf der Stadt Kitty Hawk im US-Bundesstaat North Carolina basieren, wo die Gebrüder Wright im Jahr 1903 erstmals ein selbst hergestelltes Motorflugzeug geflogen sind. Allerdings war Kittyhawk auch der Name eines gescheiterten Start-ups für fliegende Autos des Google-Mitgründers Larry Page, das Hunderte Millionen Dollar verbrannte, bevor es 2022 abgewickelt wurde.
(fds)
Künstliche Intelligenz
Pixel Watch 4: Hellere, größere Displays und einfacher reparierbar
Längere Laufzeit, hellerer Bildschirm und ein schnellerer Prozessor: Google möbelt mit der heute vorgestellten vierten Generation die Pixel Watch ordentlich auf. Doch die praktischste Neuerung dürfte eine andere sein: Akku und Frontglas sollen sich durch Endnutzer austauschen lassen.
In der vierten Generation kommt die Smartwatch wie gehabt in zwei Gehäusegrößen auf den Markt, mit 41 beziehungsweise 45 Millimetern Durchmesser. Optisch unterscheidet sich die Watch 4 nicht von ihrer Vorgängerin, doch dank schmalerer Displayränder hat es Google nach eigenen Angaben geschafft, 10 Prozent größere Bildschirme in die Gehäuse zu pressen. Die digitalen Zifferblätter wirken plastischer, denn das OLED-Panel ist nun genauso gewölbt wie das darüber liegende Glas. Die OLED-Bildschirme sollen jetzt eine maximale Helligkeit von 3000 cd/m2 erreichen. Für die Vorgänger-Uhr hatte Google noch 2000 cd/m2 angegeben – und auch deren Bildschirm war selbst in der Sonne gut ablesbar. Zur genauen Anzeigengröße macht Google keine Angaben. Unverändert sind Pixeldichte und Bildwiederholrate: Die Anzeige stellt Inhalte wie bei der Pixel Watch 3 mit 320 Pixeln pro Zoll (ppi) dar und regelt die Bildrate dynamisch zwischen 1 und 60 Hertz.
Erstmals mit Satellitenfunk, aber nur in den USA
Die Pixel Watch 4 ist die erste Uhr, die Qualcomms neues Smartwatch-System-on-Chip (SoC) in sich trägt, den W5 Gen 2. Er ermöglicht die Kommunikation per Satellitenfunk. Die Pixel Watch 4 soll laut Google so auch ohne Mobilfunkempfang Notrufe absetzen können. Allerdings teilt Google auf Nachfrage mit, dass das vorerst nur in den USA funktioniert. Von der dank Dualband-GPS besseren Positionsbestimmung sollen dagegen alle profitieren. Unverändert bleibt die Speicherausstattung der Uhr mit 2 GByte RAM und 32 GByte internem Speicher.
Mehr Display, weniger Rand: Googles Pixel Watch 4
(Bild: Google)
Sowohl in der kleinen als auch in der großen Uhr verbaut Google Akkus mit etwas höherer Kapazität (455 und 325 mAh). Die große Uhr läuft laut Google bis zu 40 Stunden lang mit einer Akkuladung, die kleine bis zu 30 Stunden. Der Ladeanschluss ist von der Unterseite an die Gehäuseseite gewandert. Über den neuen Anschluss steigt auch die Ladegeschwindigkeit: Die kleinere Pixel Watch 4 ist in 45 Minuten vollgetankt (vorher 60 Minuten), die größere in 60 Minuten (vorher 80). Alte Ladeschalen sind nicht kompatibel.
Batterie und Deckglas austauschbar
Neu ist, dass der Akku genau wie das Deckglas für Endkunden austauschbar sein soll. Über die Rückseite gelangt man ans Innere des Gehäuses. Fotos nach zu urteilen, scheint der Akku selbst ins Gehäuse geschraubt zu sein. Ob die Rückabdeckung verklebt ist oder nicht, verrät Google auf unsere Nachfrage nicht und auch nicht, wann es Ersatzteile geben wird und wie viel diese kosten werden. Abgesehen von Deckglas und Akku sollen auch weitere Komponenten austauschbar sein, allerdings empfiehlt Google „dringend, diese Arbeiten nur durchzuführen, wenn man über die erforderlichen Fähigkeiten und Werkzeuge dafür verfügt“.
Wie gehabt unterstützt die Pixel Watch Wi-Fi 6 (801.11ax) und die Kommunikation übers 5-GHz-Band. Optional ist ein LTE-Mobilfunkmodem eingebaut. Weiterhin beherrscht die Pixel Watch UWB alias Ultrabreitbandfunk. An der Sensorenphalanx für das Gesundheitstracking hat Google keine Änderungen gegenüber der Vorgängerin unternommen: Es ist ein Mehrweg-Herzfrequenzsensor an Bord, mit dem die Aktivitätszonen-Minuten bis hin zum Tracking der Körperreaktionen und der Herzgesundheit gemessen werden können. Ferner gibt es SpO2-Sensoren für die Blutsauerstoffmessung und einen cEDA-Sensor (Continuous Electrodermal Activity), der den Körper auf möglichen Stress oder Aufregung analysiert. Wie bei der Watch 3 lässt sich mit der neuen Generation ein individueller Laufplan erstellen, um die eigene Leistung im Auge zu behalten und die Laufroutine zu optimieren.
Lesen Sie auch
Neben den Fitnessfunktionen, die am Smartphone über die Firtbit-App einsehbar sind, ist es durch die tiefe Google-Integration möglich, direkt am Handgelenk auf den Livefeed der Nest-Kameras und -Türklingeln zuzugreifen. Zudem kann die Uhr als Google-TV-Fernbedienung und zur Navigation mit Offlinekarten von Google Maps genutzt werden. Softwareseitig ist WearOS 6 vorinstalliert.
Die Preise lässt Google unverändert: Die Pixel Watch startet ab 399 Euro für die Pixel Watch 4 (41 mm) mit Wi-Fi, die Pixel Watch 4 (45 mm) kostet 449 Euro. Für die Mobilfunkversionen sind jeweils 100 Euro mehr fällig.
Upgrade für die A-Klasse: Google stattet die Pixel Buds 2a jetzt auch mit ANC aus.
(Bild: Google)
Neben der Uhr hat Google mit den Pixel Buds 2a weitere tragbare Hardware vorgestellt. Sie lösen die erste Generation der A-Serie als Einsteiger-In-Ears des Konzerns ab. Im Unterschied zum Erstling beherrschen sie aktive Geräuschunterdrückung (Active Noise Cancelling, ANC). Als Budgettipp gehen sie aber nicht mehr durch: Google hat den Preis von 99 auf 149 Euro angehoben. Sowohl die Pixel Watch als auch die neuen Buds sind ab 9. Oktober erhältlich.
(rbr)
-
Datenschutz & Sicherheitvor 2 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
Apps & Mobile Entwicklungvor 2 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Online Marketing & SEOvor 2 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
Digital Business & Startupsvor 2 Monaten
10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick
-
UX/UI & Webdesignvor 2 Tagen
Der ultimative Guide für eine unvergessliche Customer Experience
-
UX/UI & Webdesignvor 2 Monaten
Philip Bürli › PAGE online
-
Digital Business & Startupsvor 2 Monaten
80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier
-
Social Mediavor 2 Monaten
Aktuelle Trends, Studien und Statistiken