Entwicklung & Code

KI unterliegt im Coding-Duell: Mensch gewinnt nach zehn Stunden

Bei der AtCoder World Tour Finals 2025 hat der polnische Entwickler Przemysław Dębiak eine KI von OpenAI besiegt. In einem zehnstündigen Wettkampf setzte sich der ehemalige OpenAI-Mitarbeiter knapp gegen das System durch – ein Ergebnis, das sowohl die aktuellen Grenzen als auch das Potenzial Künstlicher Intelligenz (KI) im Programmieren sichtbar macht.

Mensch gewinnt nach zehn Stunden gegen KI

Im Rahmen eines Sonderwettbewerbs mit dem Titel „Humans vs AI“ trat Dębiak – unter dem Pseudonym „Psyho“ bekannt – gegen ein eigens angepasstes Modell von OpenAI an. Das KI-System belegte am Ende den zweiten Platz, noch vor zehn weiteren menschlichen Finalisten. Dębiak selbst zeigte sich nach dem Wettkampf erschöpft, da er offenbar während mehrerer Wettbewerbe in drei Tagen kaum geschlafen habe. Auf der Plattform X schrieb er: „Die Menschheit hat (vorerst) gesiegt“.

Besonders an dem Wettbewerb war das direkte Aufeinandertreffen eines KI-Modells mit menschlichen Teilnehmenden unter gleichen technischen Bedingungen. In einem zehnstündigen Finale mussten alle Beteiligten ein schwieriges Optimierungsproblem lösen, das keine exakte Lösung erlaubt. Stattdessen ging es darum, in 600 Minuten möglichst gute Näherungen zu finden. Der Wettbewerb bot damit einen seltenen Vergleich zwischen menschlicher Problemlösungsfähigkeit und maschineller Effizienz im Bereich des kompetitiven Programmierens.

Gleiche Ausgangsbedingungen für Mensch und Maschine

Alle Teilnehmenden arbeiteten auf identischer Hardware, bereitgestellt von AtCoder, einer japanischen Online-Plattform für Programmierwettbewerbe mit globalem Ranking. Als Programmiersprachen standen alle auf der Plattform unterstützten Optionen offen. Das mehrmalige Einreichen von Lösungsvorschlägen (Resubmissions) waren erlaubt, allerdings nur im Abstand von fünf Minuten.

Laut Arstechnica erreichte Dębiak am Ende rund 1,81 Billionen Punkte, während das OpenAI-Modell auf etwa 1,65 Billionen kam – ein Unterschied von rund 9,5 Prozent. Damit belegte die KI Rang zwei in einem Feld aus insgesamt zwölf Teilnehmenden. Dębiak gewann 500.000 Yen, umgerechnet etwa 2.900 Euro.

Ranking Wettbewerb Mensch gegen KI — Ergebnisliste des AtCoder-Finales 2025: „Psyho“ siegt knapp vor OpenAIs KI-Modell.

(Bild: atcoder)

Fortschritte bei KI im Bereich Programmierung

OpenAI bezeichnete das Ergebnis als „Meilenstein“, so Arstechnica. Das verwendete Modell sei vergleichbar mit „o3“, einem System, das für strategisches Denken und langfristige Planung trainiert wurde. In der Vergangenheit hätten ähnliche Modelle zwar gute Ergebnisse erzielt, aber bislang noch keinen Podestplatz bei einem solchen Wettbewerb erreicht.

Tatsächlich zeigen viele aktuelle Studien deutliche Fortschritte bei KI-gestütztem Programmieren. Laut dem AI Index Report 2025 von Stanford konnten KI-Modelle im Jahr 2024 bereits über 70 Prozent der Aufgaben in einem gängigen Benchmark lösen – im Jahr zuvor waren es noch unter 5 Prozent. Auch im Alltag vieler Entwicklerinnen und Entwickler sind KI-Tools wie GitHub Copilot längst etabliert.

(mdo)

Source link

Verwandte Themen:CodingDuell gewinnt IT Künstliche Intelligenz Mensch nach Programmierung Programmierwettbewerb Softwareentwicklung Stunden unterliegt zehn

Up Next

Künstliche Neuronale Netze im Überblick 1: Das künstliche Neuron

Nicht verpassen

Nach Strafe: EU-Kommission nickt Apples App-Gebührenmodell angeblich ab

Kommentar schreiben

Entwicklung & Code

Neu in .NET 9.0 [31]: Verbesserte Ausgabe bei Debug.Assert()

Die altbekannte Methode Debug.Assert() bietet eine kleine Verbesserung in .NET 9.0: Beim Fehlschlagen der übergebenen Bedingung sehen Entwicklerinnen und Entwickler in der Ausgabe die komplette fehlgeschlagene Bedingung.

Der Dotnet-Doktor – Holger Schwichtenberg

Dr. Holger Schwichtenberg ist technischer Leiter des Expertennetzwerks www.IT-Visions.de, das mit 53 renommierten Experten zahlreiche mittlere und große Unternehmen durch Beratungen und Schulungen sowie bei der Softwareentwicklung unterstützt. Durch seine Auftritte auf zahlreichen nationalen und internationalen Fachkonferenzen sowie mehr als 90 Fachbücher und mehr als 1500 Fachartikel gehört Holger Schwichtenberg zu den bekanntesten Experten für .NET und Webtechniken in Deutschland.

So kam beispielsweise bei

var x = 42;
var y = 42;
…
Debug.Assert(x > 0 && y < 0);

vor .NET 9.0 diese Nachricht:

Assertion failed.
at Program.SomeMethod(Int32 a, Int32 b)

Nun sehen Entwicklerinnen und Entwickler seit .NET 9.0 eine ausführlichere Information:

Assertion failed.
x > 0 && y < 0
at Program.SomeMethod(Int32 a, Int32 b)

Damit dies funktioniert, gibt es eine neue Überladung der Methode Debug.Assert() mit der Annotation [CallerArgumentExpression] vor dem zweiten Parameter:

public static void Assert([DoesNotReturnIf(false)] bool condition, 
  [CallerArgumentExpression("condition")] string? message = null);

Vor .NET 9.0 konnte man dies nur erreichen, indem man die Bedingung noch einmal explizit als Zeichenkette angab:

Debug.Assert(x > 0 && y < 0, "x > 0 && y < 0");

(rme)

Source link

Entwicklung & Code

Drei Fragen und Antworten: Welche Testmanagement-Tools lohnen sich?

Erst die Software entwickeln und das Ergebnis testen – das funktioniert nicht mehr. Die Qualitätssicherung beginnt heute frühzeitig im Entwicklungsprozess und benötigt gute Testmanagement-Tools. Aber wo trennt sich die Spreu vom Weizen? Wie findet man die Tools, die nicht bremsen, sondern unterstützen? Unser Titelautor Waldemar Klassen erklärt, wie sich der Markt entwickelt hat und worauf es ankommt.

Waldemar Klassen ist Analyst bei der techconsult GmbH, einem Unternehmen der Heise Group, und beschäftigt sich mit den Themenfeldern IoT, Big Data, digitale Nachhaltigkeit (CSR/ESG) und SAP S/4HANA.

Was sollte ein zeitgemäßes Testmanagement-Tool mitbringen?

Die Grundanforderungen haben sich nicht stark verändert. Testfälle verwalten, Ergebnisse dokumentieren, Anforderungsbezug sicherstellen. Was sich aber verändert hat, ist das Umfeld. Teams arbeiten heute iterativ, oft verteilt und mit vielen Tools parallel. Ein Testmanagement-Tool muss deshalb anschlussfähig sein, quasi ein Integrationshub. Das heißt einerseits technisch über Schnittstellen und andererseits organisatorisch den Prozess abdecken. Denn was ich beobachte, ist, dass die Tool-Landschaft fragmentierter wird. An sich kein Problem, wenn die Testprozesse ebenfalls hybrid werden und das Testmanagement-Tool andockfähig ist.

Wenn ich es jetzt in einem Satz beantworten soll: In DevOps-Umgebungen kommt es auf Echtzeit-Transparenz, offene Schnittstellen und eine stabile API an. Und gute Tools denken den gesamten Dev-Prozess mit, nicht nur das Testen.

Wie haben sich DevSecOps-Ansätze, die Security im Entwicklungsprozess von Anfang an mitdenken, auf Testabläufe und die Tools dafür ausgewirkt?

Security ist vom Rand in den Kern gerückt. Tests für Sicherheitsanforderungen, Compliance-Vorgaben oder Audits sind keine nachgelagerten Aktivitäten mehr, sondern integraler Bestandteil von Release-Zyklen. Testmanagement-Tools müssen also in der Lage sein, auch Security-Scans, statische Codeanalysen oder Schwachstellenprüfungen zu erfassen und nachvollziehbar zu dokumentieren. Wer heute DevSecOps ernst meint, braucht auch ein Testmanagement, das klassische Funktionstests mit Security-Anforderungen zusammenbringt. Einige Anbieter gehen inzwischen weiter und verknüpfen Findings aus SAST- oder DAST-Tools direkt mit dem Teststatus. Das funktioniert technisch aber nur wenn der Integrationsgedanke gelebt wird und kein Reibungskampf zwischen den Security- und Dev-Tools vorherrscht.

Gefühlt wird künstliche Intelligenz derzeit in so ziemlich jede Software integriert – welche Rolle spielt sie in diesem Bereich?

Noch eine zu starke Nebenrolle, wie ich finde, aber mit viel Potenzial. Testfälle automatisch vorzuschlagen, Logs zu analysieren oder Priorisierungen vorzunehmen – das erleichtert die Arbeit und steigert die Effizienz. Das funktioniert auch in vielen Pilotprojekten bereits, skaliert aber noch nicht flächendeckend. Die Anbieter sind da unterschiedlich weit. Viele arbeiten an KI-Funktionen, aber eher im Hintergrund. Die Dev-Teams sind zwar offen dafür, haben jedoch auch immer Sorgen, dass sie nicht mehr benötigt werden.

Ich finde, KI ohne Mensch dahinter funktioniert nicht und ist ein Werkzeug zur Unterstützung. „Nicht ersetzen, sondern entlasten“, ist meine Einstellung dazu, wie in der Marktübersicht auch gezeigt. Dazu zählt etwa das Auffinden redundanter Tests oder die Auswertung von Ergebnissen. Die Umsetzung und das Qualitätsmanagement bleiben beim Entwickler.

Herr Klassen, vielen Dank für die Antworten! Interessierte Leser finden im Titel der neuen iX alles zum Testmanagement: Wir beleuchten, was gutes Testmanagement ausmacht, zeigen in einer umfangreichen Marktübersicht, welche Software fürs Testmanagement es gibt, und erklären anhand des Open-Source-Tools TestLink, wie modernes Testmanagement funktioniert. Das August-Heft ist ab sofort im heise shop und am Kiosk erhältlich.

In der Serie „Drei Fragen und Antworten“ will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie uns gerne oder hinterlassen Sie einen Kommentar im Forum.

(fo)

Source link

Entwicklung & Code

Bitte ohne KI: Sourcecode-Editor Zed bietet Ausschalter für KI-Funktionen

Wer den Sourcecode-Editor Zed verwendet, kann künftig mit einer Einstellung alle KI-Funktionen ausschalten. Damit reagieren die Projektverantwortlichen auf Wünsche aus der Community.

Das Team hinter dem Open-Source-Editor hatte im Mai 2025 in einem Blogbeitrag Zed zum schnellsten KI-Code-Editor erklärt. Zed ist von Grund auf in Rust geschrieben und seit Januar 2024 als Open-Source-Projekt unter GPL-Lizenz verfügbar. Seine Anfänge lagen auf macOS, im Juli 2024 folgte Linux und eine offizielle Windows-Version ist ebenfalls in Planung.

KI-Editor ohne KI

Auch wenn die oft nützlichen KI-Hilfen inzwischen für viele zum Alltag der Softwareentwicklung gehören, gibt es berechtigte Bedenken bezüglich der Codequalität und potenziell generierter Schwachstellen oder wegen der Daten und des Sourcecodes, die beim Einsatz der KI-Tools das Unternehmen verlassen.

Im GitHub-Repository des Editors finden sich bereits seit 2024 Diskussionen und Issues, die einen Ausschalter für KI-Funktionen wünschen.

Nun haben die Projektverantwortlichen reagiert und in der aktuellen Preview eine Einstellung in der settings.json-Datei eingeführt, die sämtliche KI-Funktionen deaktiviert:

{
  "disable_ai": true
}

In Kürze ist zusätzlich ein Switch in den KI-Einstellungen innerhalb der UI des Editors geplant, der ebenfalls alle KI-Funktionen abschaltet.

Ein einzelner Klick in den Settings genügt demnächst, um die KI-Unterstützung zu deaktivieren.

(Bild: Zed)

Datenschutz trotz KI

Der Blogbeitrag zum Deaktivieren der KI-Funktionen betont, dass diejenigen, die vor allem Bedenken bezüglich des Datenschutzes haben, die KI-Funktionen nicht unbedingt deaktivieren müssen.

Zed lässt bei der Auswahl des KI-Anbieters freie Wahl und ermöglicht auch den Einsatz lokaler KI-Modelle mittels Ollama, damit der Code und die Daten den Rechner nicht verlassen.

Weitere Details zu den Hintergründen lassen sich dem Zed-Blog entnehmen.

(rme)

Source link

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Datenschutz & Sicherheitvor 1 Monat

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Online Marketing & SEOvor 1 Monat

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Apps & Mobile Entwicklungvor 1 Monat

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

UX/UI & Webdesignvor 1 Monat

Philip Bürli › PAGE online

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Digital Business & Startupsvor 4 Wochen

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen

Apps & Mobile Entwicklungvor 1 Monat

Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen

LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten

Social Mediavor 1 Monat

LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten

Aktuelle Trends, Studien und Statistiken

Social Mediavor 1 Monat

Aktuelle Trends, Studien und Statistiken

Inspohub

KI unterliegt im Coding-Duell: Mensch gewinnt nach zehn Stunden

Entwicklung & Code

KI unterliegt im Coding-Duell: Mensch gewinnt nach zehn Stunden

Mensch gewinnt nach zehn Stunden gegen KI

Gleiche Ausgangsbedingungen für Mensch und Maschine

Fortschritte bei KI im Bereich Programmierung

Leave a Reply
Antworten abbrechen

Leave a Reply

Entwicklung & Code

Neu in .NET 9.0 [31]: Verbesserte Ausgabe bei Debug.Assert()

Entwicklung & Code

Drei Fragen und Antworten: Welche Testmanagement-Tools lohnen sich?

Entwicklung & Code

Bitte ohne KI: Sourcecode-Editor Zed bietet Ausschalter für KI-Funktionen

KI-Editor ohne KI

Datenschutz trotz KI

Ämter mit digitalen Passfotos überlastet – vor allem auf dem Land

Kluft, Creators, KI: Diese fünf Trends prägen das Konsumverhalten 2025

Dachgeschoss-Hölle? Dieser Shark-Ventilator nutzt eine geniale Technik!

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt

Inspohub

KI unterliegt im Coding-Duell: Mensch gewinnt nach zehn Stunden

Mensch gewinnt nach zehn Stunden gegen KI

Gleiche Ausgangsbedingungen für Mensch und Maschine

Fortschritte bei KI im Bereich Programmierung

Das könnte Ihnen gefallen

Leave a Reply Antworten abbrechen

Leave a Reply

Entwicklung & Code

Neu in .NET 9.0 [31]: Verbesserte Ausgabe bei Debug.Assert()

Entwicklung & Code

Drei Fragen und Antworten: Welche Testmanagement-Tools lohnen sich?

Entwicklung & Code

Bitte ohne KI: Sourcecode-Editor Zed bietet Ausschalter für KI-Funktionen

KI-Editor ohne KI

Datenschutz trotz KI

Ämter mit digitalen Passfotos überlastet – vor allem auf dem Land

Kluft, Creators, KI: Diese fünf Trends prägen das Konsumverhalten 2025

Dachgeschoss-Hölle? Dieser Shark-Ventilator nutzt eine geniale Technik!

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt

Leave a Reply
Antworten abbrechen