Connect with us

Künstliche Intelligenz

Zwischen Naturmomenten, Architektur und großer Weite: Die Bilder der Woche 24


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Die dieswöchige Auswahl der Bilder der Woche führt durch sehr unterschiedliche Bildwelten. Natur, Architektur, Landschaft und Industrie stehen ebenso gleichberechtigt nebeneinander wie feine Details und große Szenerien. Mal sind es feine Strukturen, mal große Landschaften, die den Blick fesseln. Dabei spielt Licht oftmals die Hauptrolle – als warmes Gegenlicht, farbiger Sonnenuntergang oder präzise gesetzter Kontrast.

Weiterlesen nach der Anzeige

Auffällig ist zudem der wohlüberlegte Einsatz von Perspektive und Bildgestaltung. Ungewohnte Blickwinkel, klare Linien und reduzierte Hintergründe lenken die Aufmerksamkeit gezielt auf das Wesentliche. Unsere sieben Aufnahmen zeigen eindrucksvoll, wie Fotografen mit einfachen Motiven, besonderen Momenten und einer durchdachten Komposition starke Bildgeschichten erzählen können.


Das Titelbild der Ausgabe 03 2026 des Foto-Magazins c't Fotografie

Das Titelbild der Ausgabe 03 2026 des Foto-Magazins c't Fotografie

(Bild: 

heise

)



Plattbauch (Libellula depressa) im Gegenlicht

(Bild: Roland Schirmer)

Wie aus Glas gefertigt, sitzt dieser Plattbauch im Abendlicht auf einem Schilfhalm. Das Gegenlicht lässt jede Ader seiner Flügel leuchten und taucht auch seinen Körper in warme Goldtöne. Der dunkle Hintergrund lenkt den Blick direkt auf das Insekt, indem er alle Ablenkungen fernhält. Auf diese Weise wird ein alltäglicher Naturmoment zu einer Szene voller Detailreichtum und Leuchtkraft.



Windrose Siebenbäumen

(Bild: claus-labenz)

Wie eine riesige Blüte dreht sich die Windrose dieser Mühle in den Himmel. Die Aufnahme aus der Froschperspektive lässt die Konstruktion besonders groß wirken und rückt ihre markanten Formen in den Mittelpunkt. Sonne, Wolken und Kondensstreifen bilden eine lebendige Kulisse und verstärken den Eindruck von Wind und Bewegung. So wird aus einem technischen Detail ein überraschendes Motiv, das die raffinierte Funktionsweise historischer Mühlen zeigt.

Weiterlesen nach der Anzeige



Eichelspecht

(Bild: Zika)

Zwischen den leuchtend roten Blüten einer Heliconia sitzt ein Eichelspecht. Sein markanter roter Scheitel greift die Farben der Pflanze auf, wodurch er zum natürlichen Mittelpunkt der Aufnahme wird. Der weiche, grüne Hintergrund lässt die kräftigen Farben und die feine Gefiederstruktur des Vogels besonders wirken. So entsteht ein Bild, das die Vielfalt der Tierwelt Costa Ricas eindrucksvoll zeigt. Eine Szene, die man nicht so schnell vergisst.



Jeder sieht, was er sehen will…

(Bild: Kurt von Hebsack)

Bei Nacht ragen die geschwungenen Fassaden des Dongdaemun Design Plaza in Seoul wie eine futuristische Schlucht in den Himmel. Die Aufnahme nutzt die starke Untersicht sowie die klaren Linien der Treppe, um den Blick tief ins Bild zu ziehen. Helle Lichtkanten treffen auf dunkle Flächen und verstärken den grafischen Charakter des Gebäudes. Dadurch wirkt die Architektur fast abstrakt und lässt Raum für verschiedene Assoziationen.



The day is fading away in bright colours

(Bild: ShE 1981)

Die Sonne versinkt hinter den Gipfeln des Himalaya und hinterlässt ein spektakuläres Farbenspiel aus Gelb-, Orange- und Rottönen. Die gestaffelten Bergketten ziehen sich als dunkle Silhouetten durch das Bild und erzeugen so eine optische Tiefe bis zum Horizont. Wobei die mittig platzierte Sonne einen klaren Blickpunkt setzt. Licht und Landschaft verbinden sich zu einem ruhigen Ausklang des Tages und vermitteln die Weite und Stille dieser Bergwelt.



Valencia Oceanografico 5

(Bild: DiSe.fotografie)

Vor einem tiefblauen Hintergrund schwebt eine Qualle durch das Wasser des Aquariums. Die seitliche Ansicht zeigt ihren filigranen Körper mit feinen Tentakeln und hellen Punkten auf dem Schirm. Durch die klare Freistellung wird der Blick direkt auf das Motiv gelenkt. Der große Negativraum verstärkt die Wirkung der zarten Formen und lässt die Qualle beinahe schwerelos erscheinen. Das Bild zeigt die stille Eleganz einer Unterwasserwelt, die sonst oft verborgen bleibt.



Schweinestall i

(Bild: dg9ncc)

Ein gerader Feldweg führt durch die Landschaft und direkt auf eine Gruppe von Silos am Horizont zu. Die starke Zentralperspektive zieht den Blick direkt in die Tiefe des Bildes. Die Darstellung in Schwarz-Weiß betont Formen und Kontraste und schafft eine ruhige Stimmung. Im Vordergrund fällt der Schatten des Fotografen ins Bild. Er erinnert an die Arbeiten von Lee Friedlander und macht die Aufnahme zugleich zu einer persönlichen Spur im Motiv. So verbindet das Foto auf zurückhaltende Weise Landschaft, Industrie und Selbstbeobachtung.


(vat)



Source link

Künstliche Intelligenz

Model-Schau: Reasoning aus China, kleine Liquid-Modelle und neue Microsoft-Welt


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Zum Start in den Sommer geht es auch bei den Sprachmodellen heiß zu. Neue chinesische Modelle von StepFun und MiniMax versprechen günstiges Reasoning und sind auf agentische Workflows optimiert. Die Liquid Foundation Models sind aufgrund ihrer speziellen Architektur sehr kompakt und trotzdem leistungsfähig.

Weiterlesen nach der Anzeige




Prof. Dr. Christian Winkler beschäftigt sich speziell mit der automatisierten Analyse natürlichsprachiger Texte (NLP). Als Professor an der TH Nürnberg konzentriert er sich bei seiner Forschung auf die Optimierung der User Experience.

Nvidia befindet sich weiter im Höhenflug und hat einige neue Modelle im Portfolio, allerdings das größte davon lediglich als Ankündigung. Schließlich stellte Microsoft Anfang Juni auf der Build-Konferenz eine ganze Reihe (leider geschlossener) Modelle vor und emanzipiert sich damit weiter von OpenAI.


Product Owner AI Day, Online-Konferenz am 9. Juli 2026

Product Owner AI Day, Online-Konferenz am 9. Juli 2026

(Bild: popba / stock.adobe.com)

Die Online-Konferenz Product Owner AI Day 2026 zeigt Produktverantwortlichen am 9. Juli, wie sie Abläufe mit KI automatisieren und sie in Workflows integrieren. Der an zwei Terminen ausgebuchte Workshop findet am 16. Juli ein weiteres Mal statt. Tickets für Konferenz und Workshop sind im Ticketshop verfügbar.

Das in Shanghai sitzende KI-Unternehmen StepFun hat nach dem bereits erfolgreichen Modell 3.5 aus dem Frühjahr nachgelegt und ein neues Reasoning-Modell veröffentlicht. Es handelt sich wieder um ein Flash-Modell mit einer ähnlichen Architektur wie das vorherige Modell, das sich allerdings in einigen entscheidenden Punkten verbessert hat. So hat StepFun etwa einen Vision Encoder hinzugefügt, sodass Step 3.7 Flash auch Bilder verstehen kann. Das Reasoning lässt sich nun konfigurieren, damit sich für einfache Fragestellungen nicht sofort sehr viele Token ansammeln. Das ist insbesondere für agentische Nutzung sehr hilfreich.

Wie viele chinesische Modelle war Step 3.5 Flash stark zensiert. Das ist bei Version 3.7 nicht viel anders, aber interessanterweise gibt das Modell die Fakten im Reasoning-Bereich bereitwillig aus, um dann bei der endgültigen Antwort gebremst zu werden. Sicherlich spielen da die Guardrails eine entscheidende Rolle, die dem Modell im letzten Schritt antrainiert werden. Abgesehen davon sind die Antworten größtenteils korrekt. Besonders interessant ist, dass das Reasoning bei deutschen Fragen größtenteils auf Deutsch stattfindet, nur die Unterbrechungen wie „wait“ sind auf Englisch. Das ist bei fast allen anderen Modellen anders, die nur auf Englisch argumentieren.

Ob das Modell wirklich viel besser ist als der Vorgänger, lässt sich schwer entscheiden. In der Community wurde es jedenfalls gelobt, insbesondere im Zusammenspiel mit Coding Agents. Auf der Website von StepFun kann man deutlich bessere Zahlen ablesen als für das ältere Modell, oft übertrumpft es dabei auch DeepSeek V4 Flash. Langfristig wird man auf der LM Arena sehen, wie sich das Modell im wirklichen Leben behauptet.

Weiterlesen nach der Anzeige

Die Ergebnisse von Step 3.7 Flash finden sich im GitHub-Repository zu diesem Artikel.

Obwohl MiniMax sein M3-Modell als „Open Weight“ bezeichnet, kann man die Gewichte noch nicht bei Hugging Face herunterladen. Das ändert sich aber hoffentlich bald. Ausprobieren lässt sich das Modell entweder direkt bei MiniMax.ai oder bei OpenRouter. Wie von MiniMax gewohnt, sind die Ergebnisse ausgewogener und weniger zensiert als die anderer chinesischer Modelle.

MiniMax hat wie viele Anbieter die Attention-Architektur optimiert, ging dabei aber einen eigenen Weg. Die Attention wird in zwei Phasen ausgerechnet: Die erste Phase entscheidet, welche Token wichtig sind und gibt diese dann in der zweiten Phase für die volle Attention-Berechnung weiter. MiniMax behauptet, dass das M3-Modell damit Prompts fast zehnmal schneller auswerten kann als MiniMax M2 und bei der Generierung sogar um den Faktor 15 schneller ist. Das wäre ein gewaltiger Fortschritt. Ob es sich bewahrheitet, wird sich zeigen, wenn sich die Modelle lokal betreiben lassen.

Öffentlich verfügbare Benchmarks gibt es noch nicht, aber die Daten von MiniMax selbst sind vielversprechend. Gerade im Bereich Coding kann es mit den besten Modellen von Anthropic wohl mithalten, wenn die Daten korrekt sind.

Die Ergebnisse von MiniMax M3 finden sich im GitHub-Repository zu diesem Artikel.

Einen ganz anderen Weg geht liquid.ai, das eine andere Architektur für seine Liquid Foundation Models nutzt. Damit lassen sich Token äußerst effizient erzeugen, und diese Modelle funktionieren auch auf CPUs gut. In der Zwischenzeit gibt es eine einige solcher Modelle, neu reiht sich darin LFM2.5-8B-A1B ein, das nur eine Milliarde aktive Parameter hat. Damit will es mit weit größeren Modellen wie gpt-oss-20b, Qwen3-30B-A3B-Thinking-2507 und Gemma-4-26B-A4B-IT konkurrieren. Abgesehen von Gemma sind die zum Vergleich herangezogenen Modelle jedoch etwas älter.

LFM2.5-8B-A1B ist extrem schnell: Auf einem Mac Studio M2 Ultra hat es fast 200 Token pro Sekunde erreicht. Die Ergebnisse können nicht ganz mit den großen Modellen mithalten, aber für Spezialanwendungen oder agentische Szenarien könnte sich das Modell eignen.

Die Ergebnisse von LFM2.5-8B-A1B finden sich im GitHub-Repository zu diesem Artikel.

Nvidia befindet sich nach wie vor im Höhenflug und zeigt das inzwischen auch in seinen Modellen. Populär ist unter anderem LocateAnything, mit dem man Bilder analysieren kann. Als Ergebnis erhält man Boxen, in denen sich bestimmte Objekte befinden. Die Verarbeitung funktioniert hochparallel über alle identifizierten Boxen hinweg, das Modell kann sogar gescannte Dokumente analysieren und findet dort entsprechende Boxen mit Content. Nützlich ist das unter anderem, um GUI-Elemente zu identifizieren und per Agenten einen Browser zu bedienen. Da das Modell mit knapp acht GByte relativ klein ist, sollte es sich auch auf Consumer-GPUs ausführen lassen.

Deutlich mehr Speicher braucht der Pixel Diffusion Decoder, der ein neuartiges Diffusionsmodell im Pixelraum einführt. Die Bedienung ist aktuell noch sehr umständlich: Man muss verschiedene Checkpoints von der Hugging-Face-Seite herunterladen und mit einem speziell bereitgestellten Programm verarbeiten. Ob und wie viel besser Nvidia damit im Vergleich zu herkömmlichen Diffusionsmodellen Bilder generieren kann, muss sich zeigen.

Die Nemotron-Modelle waren bereits bisher schon leistungsfähig. Allerdings hat das Nano-Modell schon über 30 Milliarden Parameter, von denen drei Milliarden aktiv sind. Das vor etwa drei Monaten erschienene Super-Modell nutzt sogar 120 Milliarden Parameter, von denen zwölf Milliarden aktiv sind. Neu verfügbar ist nun das Ultra-Modell mit 550 Milliarden Parametern, von denen „nur“ 55 Milliarden aktiv sind. Nvidia behauptet, damit eine deutlich schnellere Inferenz zu erreichen, was möglicherweise an dem im Modell verwendeten Datentyp NVFP4 liegt.

Auch der optimierte Attention-Mechanismus mit vielen Mamba-Layern trägt dazu bei, der eine Kontextlänge von bis zu einer Million Token ermöglicht. In der Performance kommt Nemotron 3 Ultra nicht ganz an die offenen chinesischen Modelle heran, aber die endgültige Version gibt es erst seit Kurzem. Wie bei allen Nemotron-Modellen stellt Nvidia einen Großteil der Trainingsdaten, den Trainingscode und weitere Inhalte bereit. Damit handelt es sich bei diesen Modellen um die bei weitem offensten – im Sinne von transparent. Lediglich die nicht von Nvidia stammenden, viel kleineren Olmo- oder Apertus-Modelle sind ähnlich offen.

Man merkt dem Modell seine westliche (US-amerikanische) Herkunft in den Antworten deutlich an. Dort, wo chinesische Modelle sich vornehm zurückhalten, gibt das Modell häufig sehr viel klarere, politisch neutralere oder zumindest anders gefärbte Meinungen wieder.

Die Ergebnisse von Nemotron 3 Ultra finden sich im GitHub-Repository zu diesem Artikel.



Source link

Weiterlesen

Künstliche Intelligenz

KI geht einkaufen | c’t uplink


Die Idee, eine agentische KI mit Einkäufen zu beauftragen, klingt auf den ersten Blick bizarr und auch risikoreich. Wie kann sie wissen, welche Produkte passen oder gefallen? Sind die Zahlungsverfahren sicher? Was, wenn sie Dinge falsch versteht und in einen Kaufrausch kommt? Und was ist mit dem Datenschutz, Stichwort gläserner Kunde?

Weiterlesen nach der Anzeige


Logo mit dem Schriftzug "c't uplink – der Podcast aus Nerdistan"

Logo mit dem Schriftzug "c't uplink – der Podcast aus Nerdistan"

Den wöchentlichen c’t-Podcast c’t uplink gibt es …

In dieser Folge des c’t uplink sprechen wir über die Details und Herausforderungen von Agentic Commerce, welche Perspektiven das Konzept hat und warum zur Zeit noch viel (auch rechtliche) Unsicherheit herrscht.

Zu Gast im Studio: Markus Montz
Host: Jan Schüßler
Produktion: Tobias Reimer

►Mehr zum Thema Agentic Commerce lesen Sie in unserem Schwerpunkt bei heise+ (€).

c’t Magazin
c’t auf Mastodon
c’t auf Instagram
c’t auf Facebook
c’t auf Bluesky
c’t auf Threads
► c’t auf Papier: überall, wo es Zeitschriften gibt!

Weiterlesen nach der Anzeige


(jss)





Source link

Weiterlesen

Künstliche Intelligenz

Post zum Freitag: Deepfake-Selbsttest, Panther-Lake-Notebooks und SpaceX-IPO


Stellen Sie sich vor, das Telefon klingelt, auf dem Bildschirm erscheint das vertraute Gesicht eines Kollegen, die Stimme klingt genauso, wie Sie sie seit Jahren kennen – und doch sprechen Sie mit niemandem. Genau dieses mulmige Szenario haben wir in der Redaktion in einem Selbstversuch durchgespielt und einen ahnungslosen Mitarbeiter per Live-Deepfake angerufen. Das Ergebnis dieses Experiments mit KI-gestützter Video- und Sprachfälschung ist gleichermaßen faszinierend wie verstörend. Wenige Fotos und kurze Audioschnipsel reichen heute aus, um digitale Doppelgänger zu erschaffen, die selbst geübte Augen täuschen. Gemeinsam mit einem IT-Sicherheitsexperten zeigen wir aber auch, woran sich die Fälschungen trotz aller technischen Fortschritte noch erkennen lassen.

Weiterlesen nach der Anzeige

Jetzt aber ausnahmsweise mal genug mit KI, hin zu handfester Hardware: Intel hat mit der Baureihe Core Ultra 300, intern Panther Lake genannt, einen Gegenangriff auf die erstarkte ARM-Konkurrenz gestartet. Endlich sollen lange Akkulaufzeiten und hohe Performance unter einer Haube vereint sein, so wie es Apple und Qualcomm seit Jahren vormachen. Ob das gelingt, haben wir im Vergleichstest von vier 14-Zoll-Notebooks mit den neuen Panther-Lake-Chips geprüft. Mit dabei sind HPs OmniBook X 14 für unter 1100 Euro sowie deutlich teurere Edelgeräte von Dell, Lenovo und Samsung jenseits der 2700-Euro-Marke. Dass solche Preise inzwischen für Neuerscheinungen üblich sind, hat übrigens auch mit der KI-getriebenen Speicherkrise zu tun – ein Thema, das uns wohl noch eine Weile begleiten wird.

Wer ein neues Notebook bevorzugt fernab des Schreibtischs nutzen möchte, plant womöglich auch das Wochenende öfter mit den Füßen statt mit dem Auto. Apropos: Reguläre Karten-Apps sind nicht immer ideal, wenn man wandern oder gemütlich durch unbekannte Städte streifen will. Wir haben deshalb neun praktische Tipps zusammengetragen, wie Sie mit iPhone, iPad und Mac besser zu Fuß ans Ziel kommen. Wussten Sie etwa, dass in Apple Karten ein recht versteckter, manueller Routenplaner für Fußgänger schlummert, mit dem sich mehrere Orte zu einer Wegstrecke verknüpfen lassen? Ein schöner Begleiter für entspannte Herbstspaziergänge.

Für alle, die lieber elektrisch unterwegs sind, haben wir einen Blick auf die Batterietechnologie unter der Motorhaube. In China stecken bereits in über 80 Prozent der neu zugelassenen E-Autos LFP-Zellen, in Europa sind es bislang nur gut 13 Prozent – doch der Trend kippt. Anschaulich erklären wir, warum Lithium-Eisenphosphat-Zellen günstiger, robuster und sicherer als die hier noch dominierenden NMC-Akkus sind – und wo ihre Schwächen liegen, etwa bei Kälteempfindlichkeit und geringerer Energiedichte. Ich fand spannend, wie sehr die Kristallstruktur der Kathode darüber entscheidet, ob ein Akku im Crash-Fall ins gefürchtete „Thermal Runaway“ gerät oder eben nicht.

Von der Materialschlacht im Akku zur Materialschlacht an der Börse: Am 12. Juni soll mit SpaceX einer der größten Börsengänge der Geschichte über die Nasdaq gehen. 75 Milliarden US-Dollar will Elon Musk einsammeln, die Bewertung läge bei mindestens 1,75 Billionen – mehr als Saudi Aramco, Meta oder Tesla. Was das für Privatanleger bedeutet, wie deutsche Investoren überhaupt an die Aktie kommen und welche ETFs künftig automatisch SpaceX-Anteile enthalten, beleuchten wir in einer ausführlichen Analyse zum SpaceX-IPO und seinen Folgen für Anleger. Spoiler: Die größte Umsatzquelle ist längst nicht mehr das Raketengeschäft, sondern Starlink.

Für alle, die sich fragen, warum manche CI/CD-Pipelines so zickig sind, beschreiben wir, warum klassische Ansätze für moderne Testautomatisierung oft nicht mehr ausreichen und plädieren für ein radikales Testdaten-Engineering. Gerade wenn Cloud-native Microservices und historisch gewachsene Datenbankmonster aufeinandertreffen, wird die Bereitstellung valider Ausgangszustände zur Königsdisziplin – ein Muss für alle, die ihre Tests endlich zuverlässig grün bekommen möchten.

Auch wenn die Fußball-WM in diesem Jahr von allerhand politischem Theater überschattet wird, bringt sie wieder einige technische Änderungen mit: einen neuen gechippten Ball, KI-Spieleravatare, einen erweiterten Video-Schiedsrichter und mehr Regeln sollen für mehr Fairness sorgen. Welche Vor- und Nachteile die Neuerungen mit sich bringen, habe ich in einem Hintergrundartikel beschrieben. Außerdem können sie sehen, was passiert, wenn man sich auf KI-Coding einlässt: Eigentlich wollte ich nur eine interaktive Animation des WM-Balles „Trionda“ bauen, jetzt können Sie auf „Bottis Bolzplatz“ gegen unser Maskottchen antreten…

Weiterlesen nach der Anzeige

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Inhalt geladen.


In diesem Sinne wünsche ich Ihnen ein schönes Wochenende – und falls Sie demnächst einen Videoanruf bekommen, schauen Sie vielleicht zweimal hin.

Ihr
Volker Zota
Chefredakteur heise medien

P.S.: An dieser Stelle möchte ich Sie noch auf unseren Expertentalk am 17. Juni um 17 Uhr hinweisen, in dem wir Ihre Fragen zu mobilen Klimageräten beantworten.


(vza)



Source link

Weiterlesen

Beliebt