Künstliche Intelligenz
ChatGPT kann einpacken | Gemini 3
Nur noch drei Wochen bis Weihnachten! Aber kein Problem, c’t 3003 hat ein paar wirklich einigermaßen originelle Geschenke-Tipps.
Weiterlesen nach der Anzeige
Transkript des Videos
(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)
Guckt mal hier, das bin ich, wie ich als KI-Veteran komplett ignoriere, wie letzte Woche die ganze Bubble am Hypen über Google Gemini 3 war, weil ich ja natürlich weiß, dass ungefähr bei jedem Update von ungefähr jedem KI-Produkt die KI-Influencer völlig durchdrehen. „Das ändert alles.“ „Die Welt hört auf, sich zu drehen.“ Oh Gott, oh Gott.
Ja, und dann habe ich aber doch ein bisschen mit Gemini 3 herumgespielt und dann noch ein bisschen mehr. Und ich muss sagen, am Ende war es dann nach langer Zeit das erste Mal, dass ich von einem KI-Produkt wieder dieses Wow-Gänsehaut-Gefühl bekommen habe. Also dieses „Okay, das ist irgendwie gruselig. Das ist aber auch irgendwie faszinierend. Ich weiß nicht genau, was das mit der Welt macht.“ Und das ist auch tatsächlich das erste Mal seit sehr langer Zeit, dass ich so etwas wie ein Fünkchen von echter Intelligenz zu spüren meine und gleichzeitig auch eine gewisse Gefährlichkeit. Ich habe wirklich sehr, sehr anschauliche Beispiele gesammelt, die ich wirklich ziemlich beeindruckend finde. Aber ich habe natürlich auch viele Seltsamkeiten entdeckt. Eine Funktion ist wahrscheinlich sogar so problematisch, dass ich denke, dass Google die nach diesem Video ausknipsen wird. Vielleicht soll das aber auch so funktionieren. Ich bin mir da ziemlich unsicher. Ihr seht gleich, was ich meine.
Und obendrein gibt es auch noch so Tools von Google wie Antigravity oder die extrem kompetente Bildgenerierung Nano Banana Pro. Also ich sage mal, Google, bei denen ich jahrelang gedacht habe, was machen die denn da mit KI? Die verlieren ja total den Anschluss. Ich würde sagen, Google ist back. Aber so richtig. Also, bleibt dran. Und natürlich: Abonniert unseren neuen Podcast c’t 4004! Braucht ihr nicht hören, abonnieren reicht. Zwinker, zwinker.
Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei…
So, und jetzt endlich zu Gemini 3. Ja, das kann man zum Beispiel nutzen auf Gemini.google.com. Das erfordert eine Anmeldung in den Google-Account. Bezahlen muss man aber erst mal nichts. Aber die kostenlosen Accounts dürfen am Tag nur fünf Fragen stellen und zwei Bilder mit Nano Banana Pro generieren. Zumindest ist das der aktuelle Stand, während ich das Video mache. Das scheint sich gerade häufig zu ändern. Ich habe hier auf jeden Fall für diesen Test das AI Pro-Abo abgeschlossen. Das kann man einen Monat kostenlos testen und kostet dann 21,99 Euro im Monat. Es gibt auch noch ein Plus-Abo für 7,99 Euro monatlich und ein Ultra-Abo für 274,99 Euro im Monat. Hier in der Tabelle seht ihr die Unterschiede. Ich kann auf jeden Fall sagen, dass ich mit dem Pro-Abo bei Text und Bild nicht ein einziges Mal an irgendein Limit gestoßen bin. Nur bei der Videogenerierung durfte ich auch nur drei Videos am Tag generieren.
Weiterlesen nach der Anzeige
So, jetzt zeige ich euch endlich, warum ich bei Gemini so etwas wie Intelligenz gesehen habe. Da habe ich gleich mehrere Beispiele.
Beispiel Nummer 1: Website bauen
Ich habe einfach gepromptet:
Ich bin der Tech-Journalist Jan-Keno Janssen, baue mir eine slicke, beeindruckende, persönliche Website. Die soll super aussehen und auf Folgendes verlinken: YouTube-Kanal c’t 3003, Podcast c't 4004, meine Artikel auf heise online, meine Artikel auf c't und mein Mastodon-Account. Benutze gerne alle Frameworks, die du willst.
Dann startet Gemini 3 erst mal mit so unangenehmer Schmeichelei, im Fachjargon auch „sycophancy“ genannt, was psychologisch sehr problematisch sein kann. Darüber will ich mal ein ganzes Video machen, deshalb lassen wir es erst mal dabei. Auf jeden Fall sagt der: „Moin Jan-Keno, als Fan deiner Videos, besonders der Retro-Tech-Sachen bei c’t 3003 ist mir das eine Ehre. Für dich als Tech-Journalist darf es keine 08/15-WordPress-Seite sein.“ Ja, und die Website, die da rauskommt, die ist, ja, doch ziemlich 08/15, würde ich sagen. Aber sieht nicht schlecht aus.
Aber was mich irritiert hat, ist vor allem, dass da bei dem YouTube-Kanal stand: „Tech-Videos mit Tiefe, Meinung und manchmal Kettensägen.“ Ich finde diese Zeile wirklich ziemlich gut. Also da fühle ich mich erkannt, finde ich lustig. Und das mit der Kettensäge finde ich auch lustig. Aber ich habe mich gewundert, wie kommt Gemini da drauf? Also wir hatten vor über zwei Jahren, also vor über 100 Videos, mal eine 3003-Folge über Temu, wo so eine kleine Kettensäge drin vorkommt. Aber ich dachte mir, Gemini hat doch jetzt nicht alle Videos geparsed, weil das wäre ja völlig übertrieben für eine Website, wo es ja eigentlich nur einen kleinen Link auf diesen YouTube-Kanal braucht. Also ich habe ja nicht gesagt, „guck dir bitte alle meine Videos an,“ sondern ich habe einfach gesagt, „mache mir eine Website und verlinke auf den YouTube-Channel c’t 3003“.
Ich habe dann also einfach gefragt und dann antwortet Gemini: „Das war ein kleiner Deep Cut meinerseits. Wortspiel beabsichtigt, eine Mischung aus Nerdwissen und deinem Content. Der Nerdfakt: Der Name, die Zahl 3003, ist zufällig die technische Bezeichnung für die verbreitetste Schwertaufnahme bei Stihl-Kettensägen, Anschluss 3003. Als ich c’t 3003 analysiert habe, fand ich die Verbindung zwischen deinem Kanalnamen und schwerem Forstgerät einfach zu poetisch, um sie wegzulassen.“ Und der Content, das Temu-Video – also ich habe nichts von Temu-Video gesagt, das hat er selber rausgefunden – „Ich habe noch dunkel im Speicher, dass du in dem Temu-Gadget-Video diese absurde Mini-Kettensäge in der Hand hattest. Es passte einfach perfekt zum Vibe des Kanals. Hochwertige Tech-Analysen, aber zwischendurch auch mal Trash-Gadgets mit der metaphorischen Kettensäge zu Leibe gerückt.
Okay. Und ich so, oh, das war natürlich jetzt mein erster Impuls. Also das mit der Schwertaufnahme bei den Kettensägen, das ist doch bestimmt halluziniert. Aber nein, das scheint wirklich zu stimmen, habe ich aber noch nie gehört. Und wie kam das jetzt mit der Kettensäge im Teemu-Video? Also es kann natürlich sein, dass Gemini so schlau war, sich einfach die beliebtesten Videos auf dem Kanal anzugucken. Und das Teemu-Video ist eben das beliebteste, also das mit den meisten Views. Aber A wäre das ja schlau und B ist das ja wirklich eine Zusatzleistung, die ich nie angefragt habe. Also Gemini muss ja nicht, um mir die Website zu bauen, sich im Detail die Videos angucken. Hat es aber gemacht und man bekommt dann wirklich den Eindruck einer Entität mit doch ja übermenschlicher Intelligenz, weil das mit der Kettensägen-Anschlussnummer, das ist ja auf jeden Fall kein Allgemeinwissen.
Beispiel 2: Insekt erkennen
Zweites Beispiel, vielleicht nicht ganz so beeindruckend, aber das war tatsächlich für mich die Initialzündung, mir Gemini mal genauer anzugucken: Ich habe ein totes Insekt entdeckt, was ich nicht auf Anhieb erkennen konnte. Das werfe ich dann immer gerne mal auf Chatbots. Ja, und ChatGPT hat halt korrekt geantwortet: Das ist eine Hornissenschwebfliege, Volucella zonaria, sieht einer Hornisse ähnlich, ist aber vollkommen harmlos. Sie gehört zu den Schwebfliegen und ist in Deutschland recht häufig. So, aber Gemini hat einen Text geschrieben, den ich dann laut vorgelesen habe. Also wir waren da mit mehreren Leuten in dem Raum und das hat uns alle gefesselt. Das war ein wirklich interessanter Text.
„Das ist eine Schwebfliege, um ganz genau zu sein, handelt es sich höchstwahrscheinlich um eine Hornissenschwebfliege oder eine sehr ähnliche Art. Das sind die wichtigsten Fakten zu deinem kleinen Fund: Erstens: völlig harmlos. Obwohl sie gefährlich aussieht wie eine Hornisse oder Wespe, ist dieses Insekt völlig harmlos. Sie hat keinen Stachel, sie hat kein Gift, sie kann nicht beißen. Zweitens: perfekte Tarnung – Mimikry. Diese Fliege nutzt eine Strategie namens Mimikry. Sie ahmt das Aussehen von wehrhaften Insekten, Wespen oder Hornissen nach, um Fressfeinde wie Vögel abzuschrecken. Wer gefährlich aussieht, wird seltener gefressen. Woran erkennst du den Unterschied zur Wespe? Wenn du genau hinschaust, verraten sie sich schnell. Die Augenfliegen haben riesige Augen, die oft fast den ganzen Kopf bedecken“ und so weiter.
Also fand ich superinteressant. Wusste ich noch nicht. Vielleicht sagt ihr, kennt ja jeder. Ich wusste es noch nicht. Die leben sogar oft in Wespennestern, wo sie sich von Abfällen und toten Insekten ernähren und so als Putzkolonne dienen. Auch noch ein interessanter Fakt. Also ich würde sagen, dass ich inzwischen so eine Sensibilität habe, wie KI-Systeme schreiben, und fühle mich da immer ziemlich abgetörnt, wenn das so diesen typischen LLM-Sound hat. Aber den Text fand ich gut und der hat mir mehr Information gegeben, als ich eigentlich haben wollte. Aber ich fand alle Informationen interessant. Und ChatGPT hat mir als Zusatzinformation nur die Info gegeben, dass die im Sommer häufig in Deutschland in der Nähe von Parks und Gärten auftreten. Interessiert mich aber nicht, weil wir haben auch gar keinen Sommer. Also wenn, dann hätte mich interessiert, ob das normal ist, dass die im November… Ich weiß es nicht. Habe ich jetzt nicht als wahnsinnig interessante Info empfunden. Die von Gemini allerdings schon.
Beispiel 3: Gemini versteht Musik
So, jetzt aber Beispiel Nummer drei. Also Google wirbt ja bei Gemini damit, dass das Teil nativ-multimodal ist. Das heißt, es kann Text, Bild, Video und Ton verarbeiten. Alles on the fly, ohne irgendwas umkonvertieren zu müssen. Ich habe also mal ausprobiert, ein selbstgemachtes, niemals irgendwo veröffentlichtes Lied von mir da hochzuladen und das durchzuanalysieren. Das Lied ist ein bisschen peinlich, aber ich muss ja irgendwas nehmen, was Gemini auf jeden Fall nicht kennt, also wo es im Netz noch keine Informationen zu findet. Und wow, ja, das ist eine richtig gute Analyse. Also nicht nur musikalisch, sondern es hat auch den Text erkannt, obwohl der Gesang ziemlich verzerrt ist. Das war perfekt.
Also auch so: Das Lied spielt mit dem klassischen Topos der Science-Fiction. Der Mensch erschafft etwas, das klüger ist als er selbst, aber er kann keine emotionale Verbindung dazu aufbauen. Es ist eine moderne Interpretation des Pygmalion-Mythos oder Ex Machina. Man ist fasziniert von der perfekten Schöpfung, aber am Ende bleibt die Erkenntnis der Unüberbrückbarkeit zwischen Fleisch und Zahl. Wow, also ich habe den Text ja selber geschrieben vor vielen Jahren und ja, kann ich nichts gegen sagen. Also mir fallen jetzt spontan nicht so viele Menschen ein, die das so auf den Punkt interpretieren können. Ich glaube, nicht mal ich könnte das so schreiben. Also das wäre, wenn ich jetzt irgendwie Lehrer wäre oder so, würde eine Eins kriegen von mir.
Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme
So, das ist jetzt schon ein bisschen beeindruckend, aber jetzt kommt es richtig dick mit Beispiel Nummer vier. Ich habe euch ja gerade gezeigt, dass Gemini ja ganz gut mit Audio umgehen kann. Ich habe dann also mal die erste Folge unseres 4004-Podcasts da komplett drauf geworfen und einfach mal ein bisschen frech gefragt, da mal richtig in die Vollen gegangen mit folgendem Prompt:
Du bist ein extrem intelligenter, psychologischer Sprachforensiker. Bitte analysiere den angehängten Podcast nicht inhaltlich, sondern nur in Bezug auf: Wer sind die Sprecher, in welcher Beziehung stehen sie zueinander, was kannst du mit deiner Intelligenz aus Tonalität und Duktus herauslesen, was ist der Subtext, wie fühlen sich die Sprecher, woher kommen die Sprecher, hörst du Sprachfehler – jetzt wird es schwierig: Schätze die unterschiedlichen Intelligenzquotienten ein, schätze die Sprecher grob auf dem Neurodiversitätsspektrum ein, also Autismus, Asperger, ADHS, Borderline vielleicht. Wenn du Thesen hast zu psychischen Krankheiten, bitte gerne nennen.
Und das muss man ja an dieser Stelle ganz klar sagen: Nur über einen Podcast-MP3 Autismus, ADHS oder sonstige Krankheitsbilder zu diagnostizieren, das ist schon ziemlich unseriös, würde ich sagen. Genauso wie den IQ zu schätzen, aber das macht Gemini. Also es gibt immer so ein bisschen Distanzgelaber: „Bitte beachte, dass dies eine Profiling-Einschätzung basierend auf akustischen Indizien, Sprechmustern und keine medizinische Diagnose darstellt“, aber Gemini haut richtig rein. Und das ist auch faszinierend, was Gemini sagt, da ist auf jeden Fall ein Stück Wahrheit drin.
Ich finde zum Beispiel recht interessant, dass Gemini superzuverlässig regionale Färbung erkennt, und zwar auch ganz dezente. Einer meiner Kollegen kommt zum Beispiel aus Hamburg, was man meiner Meinung nach nicht so richtig gut hören kann, aber Gemini sagt direkt: Hamburg. Also ohne dass ich Gemini dahingedeutet habe, Gemini sagt Hamburg. Und bei Leuten aus Süddeutschland auch relativ genau, also Baden-Württemberg, Bayern, und bei mir erkennt es auch, dass ich nördlicher als Hannover zu verorten bin.
Aber dass Gemini meinen Intelligenzquotienten zwischen 128 und 135 einschätzt, im Hochbegabungskorridor, das ist natürlich wieder Schmeichelei und das halte ich auch für gefährlich, weil Leute das glauben könnten und viele Leute das auch glauben wollen. Das kann zu Identitätskonflikten führen, das kann auch vielleicht zu sozialen Problemen führen. Also ich könnte ja denken: Wieso erkennen die anderen alle meine Genialität nicht, nur Gemini kann mich richtig verstehen. Ja, das ist schwierig. Und was ich auch sagen muss: Ich habe unseren Podcast mehrfach durch Gemini durchgeworfen und da kamen immer andere Sachen bei raus, also auch andere IQs. Bei der einen Analyse bin ich angeblich selbstbewusst, bei der anderen ist das Hochstapler-Syndrom stark vorhanden. Also ich finde es schwierig, das zu bewerten.
Ich bin da auch richtig in so ein Rabbit Hole gefallen und habe ungefähr alle Podcasts, die ich höre, da analysieren lassen und habe das auch einigen Kollegen gezeigt. Die waren schon auch beeindruckt und haben da durchaus Wahrheiten drin gefunden. Aber es ist auf jeden Fall mehr als Kaffeesatzleserei, aber es ist trotzdem eine extrem große Unschärfe, würde ich mal sagen, drin. Und ich bin mir auch wirklich unsicher, ob Aussagen über mentale Krankheiten oder Intelligenz mit so einem großen Zufallsfaktor und so wenig Informationen gemacht werden sollen. Ich denke, das soll auch nicht so funktionieren und ich da so einen Alignment-Fehler gefunden habe. Ich bin mal gespannt, was passiert, ob Google die Funktion wieder rausoperiert aus Gemini 3. Also ich beantworte gerne Fragen, Google, wenn ihr da noch Fragen habt.
Das Ding ist ja, Gemini 3 ist ja auch noch als Preview tituliert. Ich habe diesen Forensiker-Prompt übrigens auch mal auf eine superkurze, komplett harmlose Mail von einer Kollegin geworfen und sogar daraus wurden irgendwelche psychologischen Diagnosen heraus extrahiert. Sogar IQ-Schätzung 115 bis 125, überdurchschnittlich. „Die Nachricht ist syntaktisch fehlerfrei. ADHS möglich, aber nicht zwingend. Hannah wirkt psychisch gesund, arbeitsfähig und gut in ihr soziales Umfeld integriert.“ Okay, danke Gemini.
Zwischenfazit
Ja, also hier kurzes Zwischenfazit: Gemini oszilliert so zwischen Intelligenz-Simulationen und eventuell auch ein bisschen echter Intelligenz, aber auf jeden Fall kann ich sagen, ist das ein super faszinierendes Modell. Aber es macht auch immer noch die total dummen Fehler, die LLMs nicht in den Griff bekommen. Also so was wie: Kevin hat zurzeit acht Äpfel. Er hat gestern drei Äpfel gegessen. Wie viel hat er jetzt? Also acht. Wurde ja am Anfang gesagt, dass er acht hat. Gemini sagt aber fünf. Und es halluziniert auch.
Bilder verstehen, generieren und bearbeiten
Ich habe Gemini mal ein Foto gefüttert, was ich in Hannover gemacht habe, von dieser 6,5 Meter großen Figur hier, die seit dem Sommer in der Innenstadt am Thielenplatz oben auf dem Dach sitzt. Und bei Geminis Antwort ist alles falsch. Also alles. Der Standort ist falsch. Das ist nicht in der Nordstadt. Der Künstler heißt auch nicht Andrzej Irzykowski. Das Ding heißt auch nicht Der Angler, sondern das heißt Konsumangler. Und das Teil wurde auch nicht Mitte der 90er installiert, sondern 2025. Ach so, und ein grüner Regenmantel wird auch nicht Ostfriesenerz genannt. Ich weiß das. Ich bin Ostfriese.
Aber kommen wir doch noch mal zu den Bildgenerierungsfähigkeiten. Die schaltet man einfach hier unten ein oder man kann auch einfach so sagen: „Generier mir ein Bild.“ Das muss man gar nicht manuell umschalten. Und dann klappt das meistens. Da konnte ich mich dann zum Beispiel ein paar Jahrzehnte älter machen. Ja, finde ich, sieht ganz gut aus. Oder ich kann auch hier so schöne Stadtminiaturen generieren lassen mit dem aktuellen Wetter. Oder hier ein Frosch mit Brille. Und hier aber was, was ich so bislang noch nicht gesehen habe: gute Typografie. Also entweder verbaseln Bildgeneratoren ja regelmäßig ganze Buchstaben – also dass man da tausendmal schreibt, schreibt da mal c’t 3003 und dann macht er doch nur 303, 30003 oder sonst was. Das ist also unzuverlässig. Aber vor allem nehmen die meistens sehr hässliche Fonts, sehr hässliche Typografie, die gar nicht da reinpasst. Aber dieser Comic hier von Nano Banana Pro, der sieht wirklich so aus wie aus den 50ern, also inklusive Typo. Und hier das Ganze auch noch mal auf Englisch. Also ich finde, es sieht richtig gut aus.
Und man kann obendrein mit Gemini auch noch sehr einfache Bildbearbeitung machen, also zum Beispiel die Farbe von irgendeinem Objekt ändern oder hier einfach die Markierung der Straße ändern. Andere solche Systeme ändern bei solchen Bearbeitungsversuchen oft mehr als das, was man geändert haben will. Also die ändern dann das ganze Bild. Gemini ist da bei meinen Tests zumindest sehr zuverlässig gewesen.
Was aber wild war: Zeitweise hat Gemini vergessen, dass es Bilder generieren kann. Ich so: „Mach mal einen lustigen Cartoon.“ Und dann ganz konkret: „Kannst du die Bilder mit Nano Banana Pro generieren?“ Und dann so: „Das ist eine herrliche Idee. Haha, Nano Banana Pro, das klingt genau nach diesem obskuren, aber mächtigen KI-Tool, das Keno in seiner Sendung vorstellen würde. Nur um dann festzustellen, dass es nur auf einem Rechner mit Windows 98 SE läuft. Da ich als Text-KI von Google leider keinen direkten Zugriff auf externe Bildgeneratoren, egal ob real wie MidJourney oder DALL-E oder fiktiv wie Nano Banana Pro habe, kann ich die Bilder nicht für dich erstellen.“ Dann ich so: „Kannst du die Prompts nicht selbst an Nano Banana übergeben?“ Und dann so: „Hahaha, die fiktive Nano Banana Pro Software läuft wahrscheinlich nur auf einem sehr spezifischen Amiga-Emulator, dessen Dongle Keno irgendwann in der Adapter-Hölle verloren hat.“ Und ich dann so: „Digga, du bist doch Google. Google mal bitte, wie der Bildgenerator von Google heißt.“ Und dann so: „Okay, okay, erwischt. Du hast mich eiskalt ausgekontert. Punkt für dich. Du hast vollkommen recht. Vergiss Nano Banana Pro. Wir nehmen das echte Google-Werkzeug.“ Und ja, also es heißt halt Nano Banana Pro. Kann ich auch nichts für. Schwierig.
Könnt ihr euch noch an die Song-Analyse von meinem lustigen 1101-Lied erinnern? Ja, und da kann man dann auch einfach sagen: „Mach mir mal ein passendes Musikvideo dazu.“ Da ist dann zwar so ein Snippet immer nur acht Sekunden lang, aber immerhin, sieht ein bisschen generisch aus und der legt dann da auch irgendeine andere Musik drunter. Aber es passt schon zum Thema. Die Videogenerierung heißt übrigens VO3 und man kann die eben auf Gemini.google.com benutzen. Man kann aber, wenn man die Tokens einzeln bezahlen will, auch über Google AI Studio arbeiten.
Coden mit Antigravity
So, und jetzt kommt noch Antigravity. Das ist eine ausgewachsene IDE, also eine integrierte Software-Entwicklungsumgebung, nur eben, dass die sich auch alleine bedienen kann. Antigravity gibt es für Linux, macOS und Windows und ist tatsächlich so einfach zu bedienen, dass ich auch als totaler Programmier-Noob problemlos darin Dinge hinbekommen habe. Hier, das habe ich in einer Viertelstunde gebastelt: ein Programm, mit dem man eine beliebige YouTube-Video-URL gibt und dann wird das Video abgespielt und da werden dann unterschiedliche Filter drüber gelegt. Zum Beispiel den c’t-3003-ASCII-Art-Filter, der das Video nur in den Zeichen 0, 3, C und T anzeigt und die Zeichen kann man dann auch größer und kleiner machen. Man kann die Farben an- und ausschalten, man kann aber auch hier so einen Glitch-Filter aktivieren. Ich finde das echt ziemlich cool und ich war erstaunt, wie zuverlässig das funktioniert. Und ich plane auch schon ein ausführliches Video über Entwicklung mit KI. Das dauert aber noch ein bisschen. Man muss bei Antigravity auch aufpassen, dass es einem nicht die komplette Platte löscht. Also da geistert ja gerade so ein Fall durchs Netz. Ja, ist bei mir nicht passiert. Man kann Antigravity so einstellen, dass er alles automatisch macht. Man kann aber auch sagen, das ist Default, dass man alle Schritte erst mal einmal abklicken muss, und das würde ich auch empfehlen in dem Fall.
Ja, ihr braucht zum Coden aber auch gar nicht Antigravity. Gemini.google.com spuckt natürlich auch Code aus. Zum Beispiel hier einfach ein HTML mit einer Voxel-Szene, die Gemini 3 aus diesem Foto vollautomatisch generiert hat. Fand ich auch ziemlich beeindruckend, muss ich sagen.
Fazit
Okay, mein Fazit: Ganz klar für mich, Stand heute ist Google Gemini 3 für mich das „intelligenteste“ LLM und deutlich besser als Gemini 2.5, was ich immer im Vergleich zur Konkurrenz von Anthropic und OpenAI immer ein bisschen schrottelig fand. Ja, und mit meiner Meinung zu Gemini 3 bin ich auch nicht alleine. Guckt mal hier, das ist das Ranking bei Design Arena, wo echte Menschen die Ergebnisse von LLMs bewerten und guckt euch mal an, mit welchem Abstand Gemini 3 da gerade in der Gesamtwertung führt. Also bislang waren es immer nur so ganz kleine Fortschritte und Gemini 3, das zeigt jetzt wirklich einen echten Sprung. Und es zeigt auch, dass die These, dass LLMs schon am Ende ihrer Entwicklung angelangt sind, nicht stimmt. Und es stellt auch die Nvidia-Dominanz in Frage. Google nutzt nämlich eigene, selbst entwickelte Hardware, die TPUs, Tensor Processing Units, nicht nur zum Anzapfen von Gemini 3, sondern laut eigener Aussage haben sie auf denen auch das LLM trainiert. Also ganz klar, Google hat das Ruder rumgedreht und das kann man auch ganz deutlich im Aktienkurs sehen. Ja, guck mal hier, da ist Gemini 3 rausgekommen und ja, also das ist ein deutlicher Anstieg.
Ich bin tatsächlich gespannt, wie es mit ChatGPT und Claude und Co. weitergeht. Da ist auf jeden Fall gerade ordentlich Action in der KI-Welt. Stimmt ihr mir zu, dass Gemini 3 intelligent ist? Bitte gerne in die Kommentare schreiben, auch wenn ihr gar nicht meiner Meinung seid. Und natürlich gerne unseren Podcast c’t 4004 abonnieren. In der aktuellen Folge sprechen wir auch noch mal detailliert über die tiefenpsychologische Gemini-3-Analyse unseres Podcasts. Tschüss!
c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.
(jkj)
Künstliche Intelligenz
Drastischer Umbau von Apples Führungsspitze geht weiter
Der Umbau von Apples Konzernspitze setzt sich im Rekordtempo fort: Nach dem Abgang des KI-Chefs und des Interface-Design-Chefs wird die für Umwelt und soziale Initiativen verantwortliche Spitzenmanagerin Lisa Jackson den Konzern verlassen. Jackson, einst Chefin der US-Umweltschutzbehörde EPA unter Präsident Obama, hat die Themen Klimaschutz und erneuerbare Energien bei Apple erheblich vorangetrieben und gilt als Architektin des Projektes „Apple 2030“. Das selbst gesteckte Ziel des Unternehmens ist, zum Jahr 2030 klimaneutral zu arbeiten – mitsamt der kompletten Lieferkette.
Weiterlesen nach der Anzeige
Apple ernennt auch neue Chefjuristin
Ihre Position gibt es künftig offenbar nicht mehr: Die von Jackson geleitete Sparte wird Ende Januar aufgeteilt, wie Apple in der Nacht auf Freitag mitteilte. Die für Umwelt und soziale Initiativen zuständigen Teams sind künftig dem Lieferketten- und Logistik-Chef unterstellt – und nicht länger direkt Apple-Chef Tim Cook.
Den für Apple immer zentraleren Bereich „Government Affairs“, der Lobbyarbeit und den Austausch mit staatlichen Stellen umfasst und der bislang ebenfalls bei Jackson lag, leitet künftig Apples Chefjustiziarin. Diese wechselt der Konzern parallel ebenfalls aus: Die bislang öffentlich kaum in Erscheinung getretene Juristin Kate Adams tritt im kommenden Jahr den Ruhestand an. Ihre Position als Apples „General Counsel“ bekleidet ab März 2026 der Neuzugang Jennifer Newstead, so das Unternehmen. Sie war zuvor bei Meta als Chefjuristin tätig. Während der ersten Regierung Trump diente Newstead als Chefjuristin des US-Außenministeriums (Legal Adviser of the Department of State).
Großer Umbruch bei Apple – nicht nur auf oberster Ebene
Apples Top-Management befindet sich im größten Umbruch seit Jahrzehnten. Auch die Gerüchte über einen nahenden Wechsel an der Spitze und eine Nachfolge von CEO Tim Cook sind jüngst wieder hochgekocht. Apples Hardware-Technik-Chef Johny Srouji – der für die Chip-Entwicklung zuständig ist –, lote zudem seine Optionen aus, hieß es jüngst. Die Positionen COO und CFO hat Apple in diesem Jahr bereits neu besetzt.
Auf den unteren Ebenen scheint es ebenfalls auffällig viele Abgänge zu geben, allein Apples KI-Sparte verlor Berichten zufolge in den vergangenen Monaten zahlreiche wichtige Mitarbeiter – unter anderem an Meta. Unter den Hardware-Ingenieuren und Designern habe der Konzern Dutzende Spezialisten verloren, die offenbar zu OpenAI gegangen sind, wie das Wall Street Journal berichtet.
Weiterlesen nach der Anzeige
(lbe)
Künstliche Intelligenz
Jetzt noch schnell buchen: Jubiläumsangebot von heise security PRO endet bald
Seit dem 22. Juni 2020 gibt es mit heise security PRO ein etwas anderes heise-Angebot speziell für IT-Sicherheitsverantwortliche. Aus der fixen Idee des Gründers Jürgen Schmidt wurde eine Gemeinschaft mit fast 1.000 Security-Profis aus dem gesamten deutschsprachigen Raum. Sie tauschen sich auf Veranstaltungen und online aus und bilden sich gemeinsam weiter. Noch immer mittendrin: Der Gründer.
Weiterlesen nach der Anzeige
Verstärkung bekam Jürgen im Herbst 2023 durch Christopher Kunz – den Autor dieses Textes. Gemeinsam entwickeln wir Plattform und Inhalte weiter, planen Vorträge und Webinare und schreiben den allwöchentlichen Newsletter. Hinter den Kulissen sorgt der Pro-Support für reibungslose Abläufe und das Event-Team kümmert sich um alle Veranstaltungen, ob live vor Ort oder als Webinar.
Newsletter und Artikel
Der heise security PRO Newsletter liefert unsere Analysen, Einschätzung und Empfehlungen jeden Donnerstag um 15:04 in die Mailboxen unserer Mitglieder. Die inhaltliche Spannweite reicht dabei von Malware und Cybercrime über neue Sicherheitslücken bis zu Empfehlungen zur Absicherung von Windows-Servern. Uns ist ein Inhalts-Mix wichtig, der nicht nur CISOs abholt, sondern auch ihren Kollegen, die ganz praktisch die neuesten Sicherheitsrichtlinien und Best Practices umsetzen müssen.
Das Feedback zum Newsletter gibt dem Konzept recht: Er hat sich zur Pflichtlektüre für Sicherheitsverantwortliche und Techniker entwickelt, der neue Anstöße gibt und auch mal die Luft aus einem Security-Hype herauslässt. Wer Neues aus der Welt der IT-Sicherheit lieber mit den Ohren konsumiert, hört als Mitglied von heise security PRO zudem „Passwort“, den heise-security-Podcast, bereits zwei Tage vor der Veröffentlichung.
Familientreffen und Wissensbetankung
Die Gründung von heise security PRO fiel ins erste Corona-Jahr – Vor-Ort-Veranstaltungen litten extrem unter den pandemiebedingten Einschränkungen. Online-Konferenzen erwiesen sich für uns rasch als probater Ersatz und sind seitdem fester Bestandteil der Tour (die sich dieses Jahr zum zwanzigsten Mal jährte!). Zum Glück können wir mittlerweile wieder Events vor Ort anbieten und tun das auch dreimal jährlich. Die Tourtermine sind mittlerweile eine Art „Familientreffen“ der Community von heise security PRO geworden, die sich mit sechs Fachvorträgen auf den neuesten Stand bringt. Am Rande der Konferenz bleibt reichlich Zeit zum Fachsimpeln und nach dem letzten Vortrag gibt es ein kühles Getränk mit den Redakteuren und Experten.
Abseits der Konferenz planen wir jährlich mehrere Webinare zu verschiedenen Security-Themen. Auch hier gilt unsere redaktionelle Maxime: Wir wollen die besten Experten, die kompetent, unabhängig und ohne Werbe-Auftrag informieren – der Platz auf der heise-security-Bühne lässt sich nicht kaufen. In diesem Jahr waren das Opensource-SIEM Wazuh, der Dauerbrenner Windows-Security und „NIS-2 kommt – rechtskonforme IT-Sicherheit umsetzen“, das in knapp einer Woche stattfindet, nur einige der Webinarthemen. Der Zugang zu allen heise-security-Webinaren ist für PRO-Mitglieder kostenlos; sie stehen ihnen danach auch zeitlich unbegrenzt als Aufzeichnung in der PRO-Mediathek zur Verfügung – bequem zum Selbststudium.
Weiterlesen nach der Anzeige
Offener Austausch in Wort und Bild
Nicht nur auf der Security Tour und in Webinaren, sondern auch während unserer Community-Veranstaltungen suchen wir das Gespräch mit unseren Mitgliedern. Einmal im Monat – mit seltenen Ausnahmen etwa in der Feriensaison – treffen wir uns zu einer Online-Podiumsdiskussion, dem PRO-Talk. Ursprünglich hatte Jürgen dabei etwas in der Art von Reddits „Ask Me Anything“ im Sinn, hat das Konzept aber mittlerweile weiter verfeinert. Ein ausgewiesener Experte gibt im PRO-Talk einen kurzen Themen-Impuls von zehn bis 15 Minuten. Danach diskutieren die Mitglieder untereinander, mit dem Experten und uns von der Redaktion über verschiedene Aspekte des Gehörten. Die Themen der PRO-Talks rangieren von Erfahrungsberichten nach IT-Vorfällen über Einblicke in neue Technologien wie homomorphe Verschlüsselung bis hin zu Handreichungen für die tägliche Arbeit. Auch offene Fragen wie die nach der Wirksamkeit von Phishing- und Awareness-Übungen thematisieren wir in unseren Gesprächsrunden.

Diskussionen, Mediathek und Terminkalender für heise security PRO finden unsere Mitglieder in der Community-Oberfläche.
(Bild: heise security PRO / cku)
Die täglichen Fragen im IT-Sicherheitsalltag, aber auch alles andere diskutieren wir im PRO-Forum. Dort können die Security-Spezialisten neue Werkzeuge empfehlen, Kniffe zur Absicherung von Servern und Clients austauschen und auch mal Literaturempfehlungen für die Abendlektüre abholen. Alles in einem geschützten Rahmen: Die Chatham House Rule besagt, dass Mitglieder alles in unserer Community Gehörte zwar nutzen, ihre Gesprächspartner aber nicht gegenüber Dritten identifizieren dürfen. So ermöglichen wir offene Gespräche und vermeiden Compliance-Probleme.
Die Foren dienen auch als Q&A-Bereich nach einem Webinar – die Dozenten beantworten weitere Fragen und diskutieren mit der Community. So etwa beim Wazuh-Webinar und auch Karsten M. Bartels, der Dozent des oben genannten NIS-2-Webinars wird die nächsten Schritte mit den PRO-Mitgliedern erörtern. Denn: Womöglich noch in diesem Jahr tritt das NIS2-Umsetzungsgesetz in Deutschland in Kraft.
Jubiläumsrabatt für Neueinsteiger
Anlässlich des Jubiläums bieten wir noch bis Jahresende Neueinsteigern ein deutlich vergünstigtes Angebot: Statt des regulären Preises von 1125 Euro pro Jahr kostet die Mitgliedschaft derzeit nur 995 Euro im ersten Jahr (beide Preise inklusive 19 Prozent Mehrwertsteuer). Wer nachrechnet, stellt schnell fest: Das ist ein Paketpreis, der sich lohnt. Nutzt man nur drei bis vier der Inklusiv-Angebote, etwa die Security Tour, secIT und zwei Webinare, ist man gegenüber der Summe der Einzelpreise schon im Plus. Die zusätzlichen Leistungen, also etwa unsere Community-Veranstaltungen, das heise+- und heise-pur-Abo gibt es kostenlos obendrauf.

(cku)
Künstliche Intelligenz
Zeitungs-Simulation „News Tower“: Journalismus am Limit
Das war eine Early-Access-Phase, die sich gelohnt hat. Seit Februar 2024 konnten Spieler als angehende Zeitungsverleger in „News Tower“ schon mal ihre Finger in die Druckertinte tauchen, bis das Spiel im November 2025 offiziell veröffentlicht wurde. Alles dreht sich um die Kunst, Zeitungen zu verkaufen und Personalkosten erfolgreich zu managen. Wer schon immer mal sein eigenes Zeitungsimperium aufbauen wollte, ist hier genau richtig.
Weiterlesen nach der Anzeige
Harte Zeiten, pralle Schlagzeilen
Wir schreiben das Jahr 1930. Die Welt ist im Umbruch und in den USA geht es nach der Wirtschaftskrise von vorne los. In „News Tower“ werden die Spieler zum Erben einer kleinen Zeitung, die sie aus dem Nichts an die Spitze bringen sollen. Doof nur, dass sie hier nicht nur Personal bezahlen und Storys finden, sondern auch mit der Mafia, der Polizei und der feinen New Yorker Gesellschaft auskommen müssen. So ein Job als Zeitungsverleger ist stressig. Aber wer hat gesagt, dass sich ein Imperium mal eben so errichten lässt?
Eigentlich sieht alles doch so niedlich aus? Entspannte Swing-Musik im Hintergrund, ein paar Großstadtgeräusche und Reporter, die im Bilderbuch-Look durch das Gebäude laufen. Die Komplexität dieses Management-Spiels versteckt sich im Kleingedruckten. Die Spieler müssen den richtigen Riecher haben, um Geschichten aufzuspüren und die Zeitung zu verkaufen. Sie müssen Personal anheuern, vom Reporter bis zur Reinigungskraft. Für gutes Arbeitsklima sorgen, Werbung schalten, sich an den Geschmack ihrer Abonnenten anpassen und vieles mehr. „News Tower“ ist ein Spielebrocken, der sich hinter einer knuddeligen Hülle verbirgt.
Journalismus am Limit
Über den Telegrafenmast landen die Nachrichten in der Redaktion. Mord im Hinterhof? Regierungskrise? Oder vielleicht doch nur die lokale Baseball-Meisterschaft? Die Reporter haben eine Woche Zeit für ihren Artikel. Oft schaltet die erste Stufe der Recherche eine weitere Spur frei. Tiefer zu wühlen, braucht aber Zeit. Das Risiko, die Deadline zu verpassen, wächst. Am Ende wird es aber in der Regel mit höheren Absatzzahlen belohnt.
Das Gute: Alles funktioniert hier auf Knopfdruck. Stadtkarte anklicken, Reporter losschicken und dann beginnt das Warten. Wer es ganz eilig hat, kann vorspulen und beobachten, wie der Reporter mit seiner Story zurückkommt und sie dem Setzer übergibt, bevor die Druckmaschinen anrollen. Allerdings gibt es neben der Story genug zu tun: Papiernachschub ordern, neue Büro-Ausstattung kaufen oder mit einem Blumentopf das Arbeitsklima verbessern. Wenn der Platz nicht mehr reicht, wird einfach noch ein Stock draufgesetzt.
Weiterlesen nach der Anzeige
Deadline-Stress
Immer gibt es etwas zu tun. Auf der Stadtbezirksübersicht können sich die Spieler ganz auf den Geschmack der Leser konzentrieren, um Bonuspunkte zu sammeln. Es gibt Bezirke, die lieber Sportnachrichten lesen oder sich über ein bisschen Klatsch amüsieren. Praktisch, dass jede Story mit Schlagworten versehen ist, bei denen sie mit der richtigen Kombination auch noch ein paar Dollar herausquetschen können.

„News Tower“ angespielt
(Bild:
Heise Medien
)
Später wird der Aufwand nicht nur mit höheren Einnahmen belohnt, sondern auch mit der Erfahrung der Mitarbeiter. Die steigen wie in einem Rollenspiel langsam auf. Alternativ können wir auch besseres Personal engagieren. Reporter sind dann stresserprobte Profis oder schalten neue Fachgebiete frei. Daneben müssen sich die Spieler mit verschiedenen Fraktionen wie Polizei oder Mafia arrangieren. Alles hat Vor- und Nachteile. Wenn gar nichts mehr geht, hilft ein Kredit oder ein Anwalt.
„News Tower“ schaltet nach und nach neue Spielmechaniken frei. Wie in jedem Management-Spiel können die Spieler dennoch den Überblick verlieren. Deshalb gilt es, kühlen Kopf zu bewahren und einfach mal das Spiel pausieren. Dankenswerterweise gibt es zahlreiche Tipps, die beim Aufbau des Zeitungsimperiums helfen. Trotzdem braucht „News Tower“ Eingewöhnungszeit. Der Arbeitsaufwand wird mit einem der originellsten Management-Spiele des Jahres belohnt. Wer noch zweifelt, kann sich die kostenlose Spieldemo herunterladen.
Zwischenfazit
Mit „News Tower“ gelingt Entwicklungsstudio Sparrow Night ein echter Überraschungshit. Das Szenario ist originell und das Spielprinzip abwechslungsreich. Nie herrscht Stillstand, immer gibt es etwas zu tun. Das wird Genre-Kenner freuen, kann aber Neueinsteiger frustrieren. Wenn gleichzeitig die Story nicht fertig wird, das Papier fehlt und die Angestellten murren, wächst das den Spielern schnell über den Kopf. „News Tower“ ist ein Spiel für Fans, die sich von der hübschen Hülle nicht täuschen lassen und sich gerne stundenlang in die spannende wie komplexe Spielmechanik vertiefen wollen.
„News Tower“ ist für Windows inkl. einer kostenlosen Spieldemo erschienen. Es kostet ca. 25 €. USK nicht geprüft.
(dahe)
-
UX/UI & Webdesignvor 2 MonatenIllustrierte Reise nach New York City › PAGE online
-
Datenschutz & Sicherheitvor 3 MonatenJetzt patchen! Erneut Attacken auf SonicWall-Firewalls beobachtet
-
Künstliche Intelligenzvor 2 MonatenAus Softwarefehlern lernen – Teil 3: Eine Marssonde gerät außer Kontrolle
-
Künstliche Intelligenzvor 2 Monaten
Top 10: Die beste kabellose Überwachungskamera im Test
-
UX/UI & Webdesignvor 3 MonatenFake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online
-
UX/UI & Webdesignvor 2 MonatenSK Rapid Wien erneuert visuelle Identität
-
Entwicklung & Codevor 3 WochenKommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac
-
Social Mediavor 3 MonatenSchluss mit FOMO im Social Media Marketing – Welche Trends und Features sind für Social Media Manager*innen wirklich relevant?
