Entwicklung & Code

Software Testing: Effektives Testreporting ohne Overhead

In dieser Folge spricht Richard Seidl mit Matthias Groß über Testreporting und dessen Umsetzung im Projektalltag. Im Fokus steht eine pragmatische Herangehensweise: Statt überladener Dashboards setzt Matthias Groß auf eine klare 3×3-Matrix und automatisierte Datenaufbereitung mit Python und Excel.

Weiterlesen nach der Anzeige

Die beiden beleuchten, wie Testreporting nicht nur den Status sichtbar macht, sondern auch als Führungsinstrument genutzt werden kann. Das Gespräch zeigt, wie wichtig Zieldefinition, Datenqualität und flexible Sichten sind. Besonders spannend sind die Einblicke zu KI-Experimenten im Reporting und die ehrlichen Reflexionen darüber, was wirklich zählt.

Matthias Groß ist Partner der TestGilde GmbH und seit 2007 als Berater für Softwarequalitätssicherung und Testmanagement tätig. Seine Schwerpunkte liegen im operativen Testmanagement, der Einführung und Weiterentwicklung von Testmanagementstrukturen sowie der Betreuung kundenspezifischer Testservices. Er engagiert sich zudem an der Dualen Hochschule Baden-Württemberg, ist Mitgründer der Testcommunity The TestLänd und Mitglied des Programmkomitees des QS-Tags.

Software Testing im Gespräch

Bei diesem Format dreht sich alles um Softwarequalität: Ob Testautomatisierung, Qualität in agilen Projekten, Testdaten oder Testteams – Richard Seidl und seine Gäste schauen sich Dinge an, die mehr Qualität in die Softwareentwicklung bringen.

Die aktuelle Ausgabe ist auch auf Richard Seidls Blog verfügbar: „Effektives Testreporting ohne Overhead – Matthias Groß“.

Weiterlesen nach der Anzeige

(mai)

Source link

Verwandte Themen:Effektives IT ohne Overhead Python software Softwareentwicklung Softwaretest test testing Testreporting

Up Next

Programmiersprache C++26: Reflexion zur Kompilierungszeit

Nicht verpassen

PHP-Team stimmt über anerkannte Open-Source-Lizenzen ab

Entwicklung & Code

software-architektur.tv: Lernen & LLMs – Was und wie wollen wir lernen?

LLMs verändern, wie wir arbeiten. Aber verändern sie auch, wie wir lernen – und was es überhaupt bedeutet, etwas zu wissen?

Weiterlesen nach der Anzeige

Die Frage „Was sollen wir lernen, um bessere Software-Architekt:innen zu werden?“ stellt sich heute neu. Wie verändert sich die Rolle von Trainer:innen, Curricula und Zertifizierungen? Und was passiert mit unserem Verständnis von Expertise, wenn ein guter Prompt vermeintlich vieles ersetzt?

In dieser Fishbowl-Diskussion treffen LLM-Begeisterte auf LLM-Skeptiker, angehende Architekt:innen auf erfahrene Trainer:innen und iSAQB-Mitglieder – und alle bringen ihre eigene Perspektive mit. Keine Keynote, keine Slides. Nur offene Fragen, echte Meinungen und eine Diskussion, die auch unbequeme Antworten zulässt.

Fragen ohne einfache Antworten:

Was unterscheidet Wissen von Können – und was davon bleibt relevant?
Wie verändern sich Lernen, Mentoring und Wissensweitergabe im LLM-Zeitalter?
Was bedeuten die iSAQB-Zertifizierungen noch, wenn LLMs Wissensfragen beantworten?
Brauchen wir neue Lernkulturen – in Teams, Organisationen und Communities?

Das Publikum ist nicht nur Zuschauer. Vor Ort ist die Grenze zwischen Publikum und Panel fließend – wer etwas beitragen möchte, tut es einfach.

Mit Carola Lilienthal, Lars Hupel, Dr. Guido Gryczan und Dr. Gernot Starke, Moderation Eberhard Wolff. Live vom iSAQB Software Architecture Forum 2026. Wer vor Ort dabei sein will: Mit dem Code SATV15SAF gibt es 15 % Rabatt.

Livestream am 16. Juni

Weiterlesen nach der Anzeige

Die Ausstrahlung findet am Dienstag, 16. Juni 2026, live ab 17:30 Uhr statt. Die Folge steht im Anschluss als Aufzeichnung bereit. Während des Livestreams können Interessierte Fragen via Twitch-Chat, YouTube-Chat oder anonym über das Formular auf der Videocast-Seite einbringen.

software-architektur.tv ist ein Videocast von Eberhard Wolff, iX-Blogger und bekannter Softwarearchitekt, der als Head of Architecture bei SWAGLab arbeitet. Zum Team gehören außerdem Lisa Maria Schäfer (Socreatory) und Ralf D. Müller (DB Systel). Seit Juni 2020 sind über 250 Folgen entstanden, die unterschiedliche Bereiche der Softwarearchitektur beleuchten – mal mit Gästen, mal Wolff, Schäfer oder Müller solo. Seit mittlerweile mehr als zwei Jahren berichtet iX (heise Developer) über die Episoden.

(map)

Source link

Entwicklung & Code

Open Knowledge Format: KI-Wissen als Markdown-Dateien

Google Cloud hat mit dem Open Knowledge Format (OKF) eine offene Spezifikation vorgestellt, die Kontextwissen für KI-Systeme und Agenten plattformübergreifend nutzbar machen soll. Das Format richtet sich an Unternehmen, die Metadaten, Dokumentationen, Runbooks oder fachliche Definitionen zentral für den KI-Einsatz bereitstellen wollen. Google hat die Unterstützung für OKF bereits in den eigenen Knowledge Catalog integriert.

Weiterlesen nach der Anzeige

Mit dem Format greift Google einen Ansatz auf, der sich unter Entwicklern von KI-Agenten in den vergangenen Monaten verbreitet hat. Statt Agenten immer wieder dieselben Informationen aus Wikis, Datenkatalogen oder Dokumentationen heraussuchen zu lassen, legen Teams ihr Wissen strukturiert als Sammlung von Markdown-Dateien ab. KI-Forscher Andrej Karpathy hat dieses Muster als „LLM Wiki“ beschrieben. Verwandte Konzepte stecken in Obsidian-Vaults, in Konfigurationsdateien für Agenten wie AGENTS.md oder CLAUDE.md sowie in sogenannten „Metadata as Code“-Repositories.

Diese Ansätze nutzen zwar ähnliche Bausteine – Markdown-Dateien, Metadatenfelder und Querverweise –, bleiben aber meist auf einzelne Teams, Werkzeuge oder Anbieter beschränkt. Wissen lässt sich so kaum zwischen verschiedenen KI-Systemen wiederverwenden. Genau hier setzt Google an: OKF soll die nötigen Konventionen festlegen, mit denen unterschiedliche Werkzeuge dieselben Wissensbestände lesen und schreiben können – ohne Übersetzungsschicht und ohne herstellereigenes SDK.

Wissen als Markdown-Dateien

Ein OKF-Bundle besteht aus einem Verzeichnis von Markdown-Dateien. Jede Datei beschreibt genau ein Konzept, etwa eine Datenbanktabelle, einen Datensatz, eine API, eine Geschäftsmetrik, ein Runbook oder ein Playbook. Das YAML-Frontmatter enthält strukturierte Felder wie type, title, description, resource, tags und timestamp.

Die einzelnen Dateien verknüpfen sich über gewöhnliche Markdown-Links. So entsteht ein Wissensgraph, der die Beziehungen zwischen den Konzepten abbildet. Die Dokumentation einer Bestelltabelle kann etwa auf Kunden- und Produktdaten sowie auf die Definition einer Umsatzkennzahl verweisen. Ein KI-Agent bekommt damit nicht nur einzelne Dokumente, sondern auch deren fachliche Zusammenhänge.

Format statt Plattform

Weiterlesen nach der Anzeige

Google beschreibt in der Ankündigung OKF ausdrücklich als Format und nicht als Plattform. Die Spezifikation soll unabhängig von Cloud-Anbietern, Datenbanken, KI-Modellen oder Agenten-Frameworks funktionieren. Den Standard halten die Entwickler bewusst schlank: Verpflichtend ist allein ein Typfeld, alle weiteren Strukturen und Metadaten dürfen die Anwender selbst festlegen. OKF schreibt damit nur die Interoperabilität vor, nicht aber ein einheitliches Inhaltsmodell.

Zusammen mit der Spezifikation liefert Google mehrere Referenzimplementierungen aus. Dazu zählt ein Enrichment-Agent für BigQuery, der Tabellen und Views analysiert und daraus automatisch OKF-Dokumente erzeugt. In einem zweiten Durchlauf reichert ein Sprachmodell die Dokumente um Schemainformationen, Dokumentation, Quellenangaben und Join-Beziehungen an. Hinzu kommt ein statischer HTML-Viewer, der einen OKF-Bestand als interaktiven Wissensgraphen darstellt, ganz ohne Backend.

Zum Ausprobieren stellt Google Beispielbestände für Datensätze aus GA4 E-Commerce, Stack Overflow und öffentlichen Bitcoin-Datensätzen bereit. Spezifikation, Beispielcode und Referenzimplementierungen liegen auf GitHub.

Die Spezifikation liegt bislang in Version 0.1 vor. Google bezeichnet sie als Ausgangspunkt und will sie gemeinsam mit der Community rückwärtskompatibel weiterentwickeln. Produzenten und Konsumenten des Formats – etwa Datenkataloge, Suchsysteme oder KI-Agenten – sollen dabei unabhängig voneinander entstehen.

(fo)

Source link

Entwicklung & Code

US-Regierung erzwingt Abschaltung von Anthropics KI Fable 5 und Mythos 5

Anthropic muss seine KI-Modelle Fable 5 und Mythos 5 für alle Kunden weltweit abschalten. Auslöser ist nach Darstellung des Unternehmens eine Exportkontrolldirektive der US-Regierung, die am 12. Juni 2026 eingegangen sei und ausländischen Staatsangehörigen den Zugriff auf beide Modelle untersagt – auch ausländischen Anthropic-Mitarbeitern innerhalb der USA. Alle übrigen Claude-Modelle seien von der Anordnung nicht betroffen. Die Maßnahme reiht sich in eine bereits zuvor eskalierte Auseinandersetzung zwischen Anthropic und Teilen der US-Sicherheitsbürokratie ein.

Weiterlesen nach der Anzeige

Wie Anthropic in einer Stellungnahme erklärt, habe die Behörde keine konkreten technischen Details zu den angeführten nationalen Sicherheitsbedenken genannt. Nach dem Verständnis des Unternehmens geht die Regierung davon aus, dass eine Methode existiere, um Fable 5 zu „jailbreaken“, also dessen Schutzmechanismen zu umgehen. Anthropic bezeichnet die Maßnahme als „Missverständnis“ und arbeitet an der Wiederherstellung des Zugangs.

Screenshot der Startseite von Claude. — Beim Start von Claude verweist Anthropic auf die Erklärung, warum Fable 5 derzeit für alle Kunden deaktiviert ist.

Die beanstandete Technik beschreibt Anthropic als verbal überlieferten, potenziell nicht-universellen Jailbreak. Im Kern bestehe er darin, das Modell anzuweisen, eine bestimmte Codebasis zu lesen und Softwarefehler zu beheben. Eine Demonstration dieser Technik habe man geprüft und dabei lediglich eine kleine Zahl bereits bekannter, geringfügiger Schwachstellen gefunden, die auch andere öffentlich verfügbare Modelle aufspüren könnten – das Unternehmen nennt in diesem Zusammenhang ausdrücklich OpenAIs GPT-5.5.

Aus Sicht von Anthropic handelt es sich dabei um eine alltägliche Fähigkeit, wie sie Sicherheitsfachleute täglich bei legitimen Code-Reviews und beim Bugfixing nutzen. Der entscheidende Unterschied liege nicht in der Funktion selbst, sondern im Kontext: Derselbe Vorgang könne in einem Sicherheitsreview erwünscht sein, in einem anderen Szenario aber als potenzieller Missbrauch gewertet werden. Einen universellen Jailbreak, der die Schutzmechanismen von Fable 5 grundsätzlich aushebelt, habe man bislang nicht gefunden.

„Defense in Depth“ und mehrstufige Classifier

Anthropic verweist auf eine sogenannte „Defense-in-Depth-Strategie“: Jailbreaks sollen entweder eng begrenzt oder sehr aufwendig sein und werden durch Monitoring ergänzt, das erfolgreiche Angriffe schnell erkennen soll. Für Fable 5 gelte zudem eine 30-tägige Datenspeicherungspflicht, um Umgehungsversuche analysieren und eindämmen zu können. Unser Test von Fable 5 bestätigt, dass Anthropic Classifier vor das eigentliche Modell schaltet und bei heiklen Eingaben teils auf das Vorgängermodell Opus 4.8 zurückfällt.

Weiterlesen nach der Anzeige

Die zuvor kommunizierten Schutzmaßnahmen seien in einer Vorabprüfung über Tausende Stunden Red-Teaming getestet worden – gemeinsam mit der US-Regierung, dem britischen AI Safety Institute (UK AISI), privaten Organisationen und internen Teams. Die Ergebnisse hätten deutlich über denen früherer Modelle gelegen. Eine vollständig unabhängige Auditierung, etwa durch europäische Forschungseinrichtungen, ist nach derzeitigem Stand allerdings nicht belegt: Eine komplette Offenlegung der Schutzlogik oder der internen Classifier-Architektur gab es nicht. Während Fable 5 mit zusätzlichen Schutzmechanismen für die öffentliche Nutzung versehen wurde, gilt Mythos als restriktivere Variante.

Anthropic räumt ein, dass perfekte Jailbreak-Resistenz für kein Modell erreichbar sei. Zugleich widerspricht das Unternehmen der Auffassung, dass ein einzelner „unwahrscheinlicher Jailbreak den Widerruf eines kommerziellen Modells mit Hunderten Millionen Nutzern rechtfertige“. Würde man diesen Maßstab branchenweit anlegen, käme das einem Stopp neuer Frontier-Modelle gleich.

Vorbelastetes Verhältnis zum Pentagon

Die jetzige Anordnung trifft auf ein bereits angespanntes Verhältnis. Anfang März 2026 hatte das US-Verteidigungsministerium Anthropic als „supply chain risk“ eingestuft. In einem aktuellen Blogbeitrag erklärte CEO Dario Amodei, man halte die Einstufung als „supply chain risk“ für rechtlich nicht tragfähig und wolle sie vor Gericht anfechten. Der zugrunde liegende US‑Statut 10 U.S.C. § 3252 sei eng auf spezifische Lieferkettenrisiken bei nationalen Sicherheitssystemen zugeschnitten und verlange, dass das Ministerium darlegt, warum weniger eingriffsintensive Maßnahmen („less intrusive measures“) nicht vernünftigerweise zur Verfügung stehen.

Der Konflikt drehte sich nach Anthropics Darstellung um die Weigerung, Claude uneingeschränkt für massenhafte inländische Überwachung und vollautonome Waffensysteme freizugeben. Ob die aktuelle Exportdirektive primär eine Sicherheitsmaßnahme oder politischer Druck auf einen renitenten Anbieter ist, lässt sich aus den veröffentlichten Quellen nicht beweisen. Plausibel erscheint jedoch, dass der vorangegangene Streit das Verhältnis erheblich verschlechtert und die Eskalation begünstigt hat.

Für hiesige Anbieter ist ein direkt vergleichbarer, einzelmodellbezogener Eingriff in der EU nicht ersichtlich. Während das US-Exportkontrollrecht auf außenwirtschaftliche Zugriffssperren zielt, verfolgt der EU AI Act einen risikobasierten Ansatz mit Marktaufsicht, Transparenz- und Dokumentationspflichten. In Deutschland soll die Bundesnetzagentur die zentrale Marktüberwachungsbehörde werden; den entsprechenden Gesetzentwurf (KI-MIG) hat der Bundestag am 11. Juni 2026 beschlossen, die Zustimmung des Bundesrats steht noch aus. Eine globale Abschaltung eines einzelnen Modells als Maßnahme der Exportkontrolle ist in dieser Logik so nicht vorgesehen.

Lesen Sie auch

(vza)

Source link

JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears

Künstliche Intelligenzvor 3 Monaten

JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears

Oscars 2026: Was die heise‑Leser anders entschieden hätten

Künstliche Intelligenzvor 3 Monaten

Oscars 2026: Was die heise‑Leser anders entschieden hätten

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

Künstliche Intelligenzvor 3 Monaten

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

Von Kennzeichnung bis Plattformpflichten: Was die EU-Regeln für Influencer Marketing bedeuten – Katy Link im AllSocial Interview

Social Mediavor 3 Monaten

Von Kennzeichnung bis Plattformpflichten: Was die EU-Regeln für Influencer Marketing bedeuten – Katy Link im AllSocial Interview

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Künstliche Intelligenzvor 2 Monaten

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Weitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen

Künstliche Intelligenzvor 2 Monaten

Weitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

Künstliche Intelligenzvor 2 Monaten

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

Kine‑Exakta: Die erste Spiegelreflexkamera fürs Kleinbild

Künstliche Intelligenzvor 2 Monaten

Kine‑Exakta: Die erste Spiegelreflexkamera fürs Kleinbild

Inspohub

Software Testing: Effektives Testreporting ohne Overhead

Entwicklung & Code

Software Testing: Effektives Testreporting ohne Overhead

Software Testing im Gespräch

Entwicklung & Code

software-architektur.tv: Lernen & LLMs – Was und wie wollen wir lernen?

Livestream am 16. Juni

Entwicklung & Code

Open Knowledge Format: KI-Wissen als Markdown-Dateien

Wissen als Markdown-Dateien

Format statt Plattform

Entwicklung & Code

US-Regierung erzwingt Abschaltung von Anthropics KI Fable 5 und Mythos 5

„Defense in Depth“ und mehrstufige Classifier

Vorbelastetes Verhältnis zum Pentagon

Lesen Sie auch

Die Gilde – Europa 1410: Klassisches Gameplay in moderner Grafik als Demo erhältlich

Krieg per Algorithmus: Zivilgesellschaft fordert Stopp von KI-Waffen

Werbung in Videospielen: EA Advertising platziert Banner und Marken im Gameplay

JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears

Oscars 2026: Was die heise‑Leser anders entschieden hätten

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

Beliebt

Inspohub

Software Testing: Effektives Testreporting ohne Overhead

Software Testing im Gespräch

Das könnte Ihnen gefallen

Entwicklung & Code

software-architektur.tv: Lernen & LLMs – Was und wie wollen wir lernen?

Livestream am 16. Juni

Entwicklung & Code

Open Knowledge Format: KI-Wissen als Markdown-Dateien

Wissen als Markdown-Dateien

Format statt Plattform

Entwicklung & Code

US-Regierung erzwingt Abschaltung von Anthropics KI Fable 5 und Mythos 5

„Defense in Depth“ und mehrstufige Classifier

Vorbelastetes Verhältnis zum Pentagon

Die Gilde – Europa 1410: Klassisches Gameplay in moderner Grafik als Demo erhältlich

Krieg per Algorithmus: Zivilgesellschaft fordert Stopp von KI-Waffen

Werbung in Videospielen: EA Advertising platziert Banner und Marken im Gameplay

JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears

Oscars 2026: Was die heise‑Leser anders entschieden hätten

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

Beliebt