Connect with us

Künstliche Intelligenz

Rasante WordPress-Seiten mit Vinyl Cache


Ein Internetbenutzer, insbesondere wenn er über eine Suchmaschine nach Informationen fahndet, hat in etwa die Aufmerksamkeitsspanne eines Eichhörnchens auf bewusstseinserweiternden Drogen. Ein kleiner Reiz und er springt zum nächsten Ast. Das ist herausfordernd für Seitenbetreiber: Lädt eine Website zu lange, sind Nutzer schneller weg, bevor der Webserver alle Inhalte ausgeliefert hat.

Schnelle Absprünge wiederum bekommt auch Google mit und die Seite sinkt in der Gunst der Suchmaschine. Gerade WordPress ist von Haus aus nicht für überragende Geschwindigkeit bekannt. Ansätze, um WordPress-Seiten zu beschleunigen, gibt es mehrere. Meistens greifen sie per Plug-in tief in die WordPress-Instanz ein.

  • WordPress ist eine PHP-Anwendung, die ihre Daten aus einer SQL-Datenbank holt. Besonders unter Last wird sie träge.
  • Ein systematischer Lasttest zeigt die Grenzen einer solchen Installation auf.
  • Der Cache-Server Vinyl hält gerenderte HTML-Seiten im Speicher vor und kommt auch mit vielen gleichzeitigen Zugriffen klar.

Ein anderer Weg: Man stellt WordPress den Cache-Server Vinyl zur Seite, der fertig gerenderte HTML-Seiten im RAM vorhält, und degradiert WordPress zum Zulieferer für den Cache. Wir versprechen nicht zu viel: Durch den Umbau, den wir in diesem Artikel beschreiben, werden Sie Ihre WordPress-Seite nicht wiedererkennen. Ganz nebenbei erfahren Sie, wie Sie Ihre Website mit dem Werkzeug k6 systematisch unter Last testen.


Das war die Leseprobe unseres heise-Plus-Artikels „Rasante WordPress-Seiten mit Vinyl Cache“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Künstliche Intelligenz

KI-Update: Chinas Aufholjagd, Clickworker, Anthropic, Apple-Updates, KI-Git-Tool


Weiterlesen nach der Anzeige

Der chinesische Konzern Meituan hat sein neues Modell LongCat-2.0 vollständig auf heimischer Hardware trainiert. Es umfasst 1,6 Billionen Parameter und Nvidia-Chips sollen dabei keine Rolle gespielt haben. Das Training lief auf einem Verbund aus über 50.000 inländischen KI-Chips. Das Team hinter LongCat existiert erst seit 2023. In zwei Programmier-Benchmarks schlägt LongCat-2.0 Googles Gemini 3.1 Pro und OpenAIs GPT-5.5, unterliegt aber Anthropics Claude-Modellen. Bei Logik und Fachwissen fällt es teils deutlich zurück.


Eigenwerbung Fachdienst heise KI PRO

Eigenwerbung Fachdienst heise KI PRO

Das Signal an Washington bleibt trotzdem deutlich. Seit 2022 verhängen die USA Exportkontrollen für moderne KI-Chips, doch China präsentiert nun offenbar erstmals ein konkurrenzfähiges Billionen-Parameter-Modell auf eigener Hardware. Welche Chips genau zum Einsatz kamen, verrät Meituan bislang nicht. Auch ist das Modell noch nicht öffentlich verfügbar, eine unabhängige Prüfung der Ergebnisse also vorerst unmöglich.

Der chinesische KI-Anbieter Z.ai hat mit GLM-5.2 ein Open-Weight-Modell veröffentlicht, das bei der Erkennung von Sicherheitslücken mit Anthropics Opus 4.8 mithalten kann. Das ergaben IDOR-Benchmark-Tests der Cybersicherheitsfirma Semgrep. Weil jeder GLM-5.2 herunterladen und lokal betreiben kann, ist das ein zweischneidiges Schwert. Sicherheitsfirmen und interne Red Teams können es in abgeschotteten Umgebungen für Code-Reviews nutzen, ohne sensible Daten an US-Clouds zu geben. Für DSGVO-konforme Umgebungen in Europa ist das ein Vorteil.

Doch auch Angreifer können das Modell ohne Aufsicht betreiben, um nach Schwachstellen in kritischen Systemen zu suchen. Die Entwicklung trifft die US-Regierung in einem heiklen Moment. Anthropics Spitzenmodell Mythos ist nur für ausgewählte Stakeholder verfügbar, Fable war kurzzeitig ganz gesperrt, weil die Trump-Administration den Zugriff durch ausländische Nutzer untersagte. GLM-5.2 hingegen ist offen verfügbar und könnte den Kampf um cybersichere Systeme verschärfen.

Weiterlesen nach der Anzeige

Dass Millionen schlecht bezahlter Arbeitskräfte im Hintergrund dafür sorgen, dass KI überhaupt funktioniert, ist oft wenig bekannt. Diese Datenarbeiter, auch Clickworker genannt, versehen Bilder, Texte und Videos mit Metadaten und filtern gefährliche Inhalte heraus. Ein Großteil arbeitet im Globalen Süden, wo die Löhne niedrig sind, oft unter schlechten Bedingungen. Im c’t-Podcast „They Talk Tech“ sprechen Svea Eckert und Eva Wolfangel mit Julia Kloiber vom Superrr Lab, einer gemeinnützigen Organisation für gemeinwohlorientierte Digitalisierung.

Bekannt wurde das Thema 2023, als eine Time-Recherche eine Firma in Kenia besuchte, deren Beschäftigte für einen Hungerlohn KI-Modellen Hass und Gewalt austreiben sollten. Viele von ihnen sahen den ganzen Tag traumatisierende Szenen. Die Weltbank schätzt, dass zwischen 150 Millionen und 430 Millionen Menschen als Datenarbeiter tätig sind. Perfide ist auch die Datengenerierung: In Kenia werden Menschen aufgefordert, private Aufnahmen ihrer Familien zu teilen, damit diese in die Trainingsdaten einfließen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Amazon bietet großen Kunden seiner Cloud-Sparte AWS an, eigene Mitarbeiter direkt vor Ort einzusetzen. Diese sollen dort KI-Agenten zusammenstellen und installieren, die auf AWS-Diensten laufen. Amazon nennt diese Fachkräfte Forward Deployed Engineers. Ziel ist es, das Geschäft anzukurbeln und Kunden langfristig zu binden. Denn sind die KI-Agenten erst tief in der IT einer Organisation verankert, wird ein Wechsel aufwendig und teuer. Eingesetzt werden die Fachkräfte vor allem bei Behörden, Geldinstituten und im Finanzwesen.

Am Anfang steht meist der Aufbau sogenannter Knowledge Graphs, die vorhandene Informationen für die KI-Agenten aufbereiten. Damit soll auch Personal leichter ersetzbar werden. Amazon investiert rund eine Milliarde US-Dollar in die neue Abteilung, die weltweit tätig sein wird, auch im deutschsprachigen Raum.


KI-Update

KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im „KI-Update“ von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Google hat Meta den Zugang zu seinen Gemini-Modellen beschnitten, weil die Nachfrage die verfügbare Rechenkapazität übersteigt. Schon im März soll Google Meta informiert haben, dass die gewünschte Kapazität nicht vollständig bereitsteht. Mehrere KI-Projekte gerieten dadurch ins Stocken. Meta kauft Zugang zu Gemini, obwohl es mit Llama eigene quelloffene Modelle besitzt. Offenbar funktioniert Googles KI bei bestimmten Aufgaben besser. Meta nutzt sie, um Betrugsmaschen aufzuspüren, schädliche Inhalte zu löschen und Chatbots zu betreiben. Auch Anthropics Claude kommt zum Einsatz.

Parallel arbeitet Meta an einer eigenen Alternative. Das Modell Muse Spark soll mit Gemini mithalten und dann auch in den neuen KI-Brillen laufen. Google wiederum mietet inzwischen Rechenkapazität bei Elon Musks SpaceX.

Die österreichische Regierung hat die EU aufgefordert, die KI-Firma Anthropic mit verschiedenen Maßnahmen nach Europa zu locken. Die Idee hängt mit dem anhaltenden Konflikt zwischen Anthropic und der US-Regierung zusammen. Laut einem Brief, über den Bloomberg berichtet, soll die EU mit Rechtssicherheit, einem großen Markt und Kapital werben, damit Anthropic seinen Hauptsitz nach Europa verlegt.

Wie realistisch das ist, bleibt zweifelhaft. Die großen KI-Firmen sitzen aus gutem Grund in den USA, wo es deutlich mehr Kapital und einen großen Markt gibt. Anthropic selbst bereitet gerade einen Börsengang in den USA vor und scheint keinen Zweifel an guten Geschäften dort zu haben. Der Brief enthält offenbar keine Vorschläge, um Europas Rückstand beim Kapital zu ändern. Es wirkt eher wie ein Versuch, Aufmerksamkeit auf den Rückstand zu lenken.

Die US-Regierung hat die Exportbeschränkungen für Anthropics Modelle Mythos und Fable aufgehoben, die zuvor für alle gesperrt waren. Parallel hat Anthropic mit Claude Sonnet 5 eine verbesserte Version veröffentlicht, die in Teildisziplinen zum High-End-Modell Opus 4.8 aufschließen oder es übertreffen soll. Anders als das leistungsfähigere Mythos richtet sich Sonnet an ein breites Anwendungsspektrum im Alltag. Verbessert wurde vor allem die agentische Funktionsweise. Das Modell soll Pläne machen, Werkzeuge wie Browser und Konsole nutzen und autonom arbeiten.

Bei agentischen Aufgaben überholt Sonnet 5 laut Anthropics Testergebnissen fast durchgehend das Spitzenmodell Opus 4.8. Es soll böswillige Anfragen besser ablehnen und seltener halluzinieren. Zusätzlich hat Anthropic Claude Science veröffentlicht, das KI-Werkzeuge für die Forschung bündelt.

Die Bank für Internationalen Zahlungsausgleich, kurz BIZ, warnt in ihrem Jahresbericht vor finanziellen Risiken durch den KI-Investitionsboom. Sie zieht Parallelen zur britischen Eisenbahn-Manie, dem Elektrifizierungsrausch der späten 1920er-Jahre und dem Dotcom-Boom der 90er. In allen Fällen zog eine neue Technik mehr Kapital an, als sich wirtschaftlich rechtfertigen ließ. Danach folgten Investitionsrückgänge und Rezessionen.

Die fünf größten Cloud-Hyperscaler, also die Betreiber riesiger KI-Rechenzentren, investieren derzeit über eine Billion US-Dollar in KI, mit ungewisser Rendite. Sie gehen langfristige Zahlungszusagen ein, die die Gewinne übersteigen, und verschulden sich stark. Zudem bremsen Engpässe bei Strom, Halbleitern und Netzwerkausrüstung den Ausbau, dessen hoher Energie- und Wasserbedarf lokale Netze belastet. Platzt die Blase, könnte das laut BIZ zu einem Einbruch an den Aktienmärkten führen, auch jenseits der Tech-Branche.

In San Francisco treibt der KI-Boom die Lebenshaltungskosten so stark nach oben, dass selbst gut bezahlte Tech-Beschäftigte sie kaum noch tragen können. Das berichtet die New York Times. Ein Paar suchte drei Monate vergeblich nach einer Wohnung unter 5000 US-Dollar Monatsmiete. Am Ende zog der Software-Ingenieur an den Lake Tahoe, seine Partnerin blieb in einer Wohngemeinschaft. Die Durchschnittsmiete liegt aktuell bei etwa 3800 US-Dollar, der mittlere Preis für ein Eigenheim bei 1,7 Millionen US-Dollar.

Der Schweizer Software-Anbieter Proton, bekannt für seinen verschlüsselten E-Mail-Dienst, hat eine neue Version seines KI-Chatbots Lumo veröffentlicht. Version 2.0 kann nun erstmals Bilder erkennen und selbst erzeugen. Neben Bildanalyse und -generierung ruft Lumo auch aktuelle Informationen aus dem Web ab, sodass etwa das reale Wetter in ein Stadtbild einfließt. Nutzer können Bereiche in Bildern markieren und gezielt bearbeiten lassen. Neu sind zudem „Custom Lumos“ für spezialisierte Aufgaben wie Datenanalyse.

Proton entwickelt keine eigenen Sprachmodelle, sondern nutzt offene Modelle wie GLM-5.2 und Qwen 3.5. In einer Demo unterlief Lumo ein Fehler, auch dieser Chatbot halluziniert also. Die Chats sind verschlüsselt und nur auf dem genutzten Gerät lesbar. Die Server stehen in der EU, aber nicht in der Schweiz, da sich Proton wegen einer geplanten Schweizer Überwachungsverordnung mit Entschlüsselungspflichten zunehmend aus dem Land zurückzieht.

Google hat zwei neue generative KI-Modelle veröffentlicht. Nano Banana 2 Lite ist auf Geschwindigkeit ausgelegt und erzeugt Bilder in vier Sekunden. Trotz des Tempos soll es zuverlässig auf Vorgaben reagieren und lesbaren Text in Bildern erzeugen. Google integriert es auch in eigene Produkte wie die Suche und Google Photos. Damit umfasst die Nano-Banana-Familie nun drei Modelle, vom schnellen Lite bis zum professionellen Pro.

Das zweite Modell, Gemini Omni Flash, erlaubt Entwicklern, Videos per natürlicher Sprache über die Programmierschnittstelle zu erstellen und zu bearbeiten. Derzeit generiert es nur Clips von zehn Sekunden Länge. Einen Mehrwert sieht Google in der Kombination beider Modelle: Entwickler erzeugen ein Bild und lassen es anschließend animieren. Beide Modelle versehen ihre Ergebnisse mit dem Wasserzeichen SynthID, sodass sich die Inhalte als KI-generiert erkennen lassen.

Apple passt seine Sicherheitsstrategie an neue KI-Bedrohungen an und hat diverse Patches vorgezogen. Sie erschienen bereits diese Woche als iOS 26.5.2, iPadOS 26.5.2 und macOS 26.5.2. Zudem gibt es eine Aktualisierung für den Browser Safari, die mehrere Lücken schließt. Laut Apple muss sich die Zeit zwischen der Ankündigung von Sicherheitsaktionen und ihrer Bereitstellung verkürzen, um gegen neue KI-Angriffsszenarien gewappnet zu sein.

In den Release-Notes finden sich bereits Hinweise, dass KI den Sicherheitsforschern geholfen hat. Einem Team von Anthropic wird eine entdeckte Lücke zugeordnet, für die es vermutlich Claude Mythos nutzte. Apple nimmt zudem am KI-Sicherheitsprojekt Glasswing teil, das KI-Systeme zum schnelleren Auffinden von Sicherheitslücken verwendet. Laut Apple wurde keines der nun gestopften Löcher bereits ausgenutzt. Da sich KI-Systeme unter Kriminellen stärker verbreiten, muss das in Zukunft aber nicht so bleiben.


Eigenwerbung Fachdienst heise KI PRO

Eigenwerbung Fachdienst heise KI PRO


(mali)



Source link

Weiterlesen

Künstliche Intelligenz

OpenAI soll Inferenzkosten um mehr als die Hälfte gesenkt haben


OpenAI-Ingenieure haben offenbar Optimierungen entwickelt, die die Inferenzkosten – also die Kosten für den Betrieb bereits trainierter Modelle – um mehr als die Hälfte senken. Angeblich konnte OpenAI die Zahl der benötigten Nvidia-GPUs für nicht eingeloggte ChatGPT-Nutzer zeitweise auf „nur ein paar hundert“ reduzieren – eine auffällig niedrige Zahl.

Weiterlesen nach der Anzeige

Das berichtet The Information unter Berufung auf interne Quellen. Welche konkreten Techniken OpenAI einsetzt, ist allerdings unklar. Mögliche Bausteine der Kostenreduktion könnten Quantisierung (Reduktion der Zahlenpräzision von Modellgewichten) sein, Key-Value-Caching (Wiederverwendung früherer Berechnungen), Batching (parallele Verarbeitung mehrerer Anfragen) sowie Routing einfacher Aufgaben an weniger rechenintensive Modelle. Solche Verfahren sind in der Branche etabliert und können in Kombination erhebliche Einsparungen erzielen.

Aggressive Inferenzoptimierungen bergen allerdings Risiken. Quantisierung kann die Genauigkeit der Ergebnisse verringern, fehlerhaftes Modellrouting kann Anfragen fälschlich als „einfach“ einstufen und an zu kleine Modelle delegieren. Kontext-Komprimierung wiederum könnte sicherheitsrelevante Signale in langen Chatverläufen beschneiden.

Die Optimierungen dürften für OpenAI auch finanziell relevant sein. Laut The Information lag die Bruttomarge des API-Geschäfts Ende des ersten Quartals bei 39 Prozent, nach 33 Prozent im Vorjahr. Das erklärte Ziel: 52 Prozent bis Jahresende. Dafür müsste das Unternehmen im Rest des Jahres durchschnittlich rund 56 Prozent erreichen. Oder die Einsparungen durch die Optimierungen könnten an Kunden weitergegeben werden – etwa durch günstigere API-Preise oder höhere Kontingente für ChatGPT-Abonnenten.

Auch die Konkurrenz arbeitet an vergleichbaren Hebeln. Anthropic bezeichnet seine Effizienzmaßnahmen als „Compute Multipliers“ und hält Details laut CEO Dario Amodei bewusst vertraulich, um Nachahmung zu erschweren.

Weiterlesen nach der Anzeige

Die Optimierungen fallen in eine Zeit akuter Kapazitätsengpässe: Wie zuletzt der Fall zeigt, dass Google Metas Gemini-Zugang wegen Kapazitätsengpässen begrenzt hat, stoßen selbst die größten Tech-Konzerne an die Grenzen verfügbarer Rechenleistung. Trotz Milliarden-Investitionen in neue Rechenzentren dauert deren Inbetriebnahme oft Monate oder Jahre – Software-Effizienz wird damit zu einem zentralen Wettbewerbsfaktor.

Für europäische Unternehmen, die KI-APIs einsetzen, bedeuten sinkende Inferenzkosten, dass der Einsatz leistungsfähigerer Modelle wirtschaftlicher wird.


(rie)



Source link

Weiterlesen

Künstliche Intelligenz

(XXL-)Speicher für Balkonkraftwerke im Test


Energiepreise kennen scheinbar nur eine Richtung: steil nach oben. Besonders frustrierend ist der Umstand, dass man als Verbraucher bei den fossilen Energieträgern nur Spielball der geopolitischen Großwetterlage ist. Auch wenn das Balkonkraftwerk längst nicht den gesamten persönlichen Energiebedarf decken kann, sorgt es doch für ein klein wenig Autarkie und gute Laune. Faustformel: Bei perfekter Ausrichtung produziert man aus einem Kilowatt installierter Solarleistung (kWp) pro Jahr 1000 kWh Strom. Für die in Deutschland geltende Balkonkraftgrenze von 2 kWp ergibt sich so ein Ertrag von 2000 kWh. Das ist eine ordentliche Entlastung für die Stromrechnung, beziehungsweise lässt ein E-Auto 10.000 Kilometer weit fahren.

Über die vergangenen Jahre haben sich die Kleinstanlagen darüber hinaus zu ernsthaften Konkurrenten professioneller Haus-PV-Anlagen gemausert. Das liegt hauptsächlich an kürzeren Vertriebswegen, schnelleren Innovationszyklen und dem knallharten Preiskampf im Einzelhandel. All-in-One-Anlagen mit Speicher gehen inzwischen beim Discounter über die Ladentheke und gerade im Hinblick auf Speichervolumen wird sich manch ein Besitzer einer Alt-Anlage verwundert die Augen reiben: Speichergrößen von 5 kWh und mehr sind längst die Regel. Mit zusätzlichen Blöcken lassen sie sich im Klemmbausteinverfahren erweitern und per Software zu virtuellen Hausspeichern mit weit über 100 kWh Kapazität bündeln.

  • Balkonkraftwerke wachsen vom Steckdosenmodul zum komplexen Energiesystem mit Speicher und App-Steuerung.
  • Vier aktuelle All-in-One-Lösungen mussten zeigen, wie gut sie Energie speichern und den Verbrauch steuern.
  • Unterschiede zeigen sich weniger bei der Hardware als bei der Software, regelkonformem Verhalten und praktischer Nutzbarkeit.

Bei unseren vier Testgeräten handelt es sich um kompakte Balkonkraftwerke mit integriertem Wechselrichter. Sie bieten jeweils Anschlussmöglichkeiten für mindestens vier diskret angesteuerte Solarpanels und sind damit auf die hierzulande vorgeschriebene Grenze für Balkonkraftwerke optimiert: Mit vier 500-Watt-Panels kommt man auf die maximale Solarleistung von 2000 Wp. Diese Kleinstanlagen lassen sich vom Kunden anschließen und müssen lediglich im sogenannten Marktstammdatenregister angemeldet werden. Wie gut diese Systeme tatsächlich funktionieren, zeigt sich erst im Detail: bei Steuerung, Messgenauigkeit und der Frage, wie viel Autarkie im Alltag wirklich ankommt.


Das war die Leseprobe unseres heise-Plus-Artikels „(XXL-)Speicher für Balkonkraftwerke im Test“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Weiterlesen

Beliebt