Künstliche Intelligenz

ChatGPT kann einpacken | Gemini 3

Nur noch drei Wochen bis Weihnachten! Aber kein Problem, c’t 3003 hat ein paar wirklich einigermaßen originelle Geschenke-Tipps.

Weiterlesen nach der Anzeige

Transkript des Videos

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, das bin ich, wie ich als KI-Veteran komplett ignoriere, wie letzte Woche die ganze Bubble am Hypen über Google Gemini 3 war, weil ich ja natürlich weiß, dass ungefähr bei jedem Update von ungefähr jedem KI-Produkt die KI-Influencer völlig durchdrehen. „Das ändert alles.“ „Die Welt hört auf, sich zu drehen.“ Oh Gott, oh Gott.

Ja, und dann habe ich aber doch ein bisschen mit Gemini 3 herumgespielt und dann noch ein bisschen mehr. Und ich muss sagen, am Ende war es dann nach langer Zeit das erste Mal, dass ich von einem KI-Produkt wieder dieses Wow-Gänsehaut-Gefühl bekommen habe. Also dieses „Okay, das ist irgendwie gruselig. Das ist aber auch irgendwie faszinierend. Ich weiß nicht genau, was das mit der Welt macht.“ Und das ist auch tatsächlich das erste Mal seit sehr langer Zeit, dass ich so etwas wie ein Fünkchen von echter Intelligenz zu spüren meine und gleichzeitig auch eine gewisse Gefährlichkeit. Ich habe wirklich sehr, sehr anschauliche Beispiele gesammelt, die ich wirklich ziemlich beeindruckend finde. Aber ich habe natürlich auch viele Seltsamkeiten entdeckt. Eine Funktion ist wahrscheinlich sogar so problematisch, dass ich denke, dass Google die nach diesem Video ausknipsen wird. Vielleicht soll das aber auch so funktionieren. Ich bin mir da ziemlich unsicher. Ihr seht gleich, was ich meine.

Und obendrein gibt es auch noch so Tools von Google wie Antigravity oder die extrem kompetente Bildgenerierung Nano Banana Pro. Also ich sage mal, Google, bei denen ich jahrelang gedacht habe, was machen die denn da mit KI? Die verlieren ja total den Anschluss. Ich würde sagen, Google ist back. Aber so richtig. Also, bleibt dran. Und natürlich: Abonniert unseren neuen Podcast c’t 4004! Braucht ihr nicht hören, abonnieren reicht. Zwinker, zwinker.

Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei…

So, und jetzt endlich zu Gemini 3. Ja, das kann man zum Beispiel nutzen auf Gemini.google.com. Das erfordert eine Anmeldung in den Google-Account. Bezahlen muss man aber erst mal nichts. Aber die kostenlosen Accounts dürfen am Tag nur fünf Fragen stellen und zwei Bilder mit Nano Banana Pro generieren. Zumindest ist das der aktuelle Stand, während ich das Video mache. Das scheint sich gerade häufig zu ändern. Ich habe hier auf jeden Fall für diesen Test das AI Pro-Abo abgeschlossen. Das kann man einen Monat kostenlos testen und kostet dann 21,99 Euro im Monat. Es gibt auch noch ein Plus-Abo für 7,99 Euro monatlich und ein Ultra-Abo für 274,99 Euro im Monat. Hier in der Tabelle seht ihr die Unterschiede. Ich kann auf jeden Fall sagen, dass ich mit dem Pro-Abo bei Text und Bild nicht ein einziges Mal an irgendein Limit gestoßen bin. Nur bei der Videogenerierung durfte ich auch nur drei Videos am Tag generieren.

Weiterlesen nach der Anzeige

So, jetzt zeige ich euch endlich, warum ich bei Gemini so etwas wie Intelligenz gesehen habe. Da habe ich gleich mehrere Beispiele.

Beispiel Nummer 1: Website bauen

Ich habe einfach gepromptet:

Ich bin der Tech-Journalist Jan-Keno Janssen, baue mir eine slicke, beeindruckende, persönliche Website. Die soll super aussehen und auf Folgendes verlinken: YouTube-Kanal c’t 3003, Podcast c't 4004, meine Artikel auf heise online, meine Artikel auf c't und mein Mastodon-Account. Benutze gerne alle Frameworks, die du willst.

Dann startet Gemini 3 erst mal mit so unangenehmer Schmeichelei, im Fachjargon auch „sycophancy“ genannt, was psychologisch sehr problematisch sein kann. Darüber will ich mal ein ganzes Video machen, deshalb lassen wir es erst mal dabei. Auf jeden Fall sagt der: „Moin Jan-Keno, als Fan deiner Videos, besonders der Retro-Tech-Sachen bei c’t 3003 ist mir das eine Ehre. Für dich als Tech-Journalist darf es keine 08/15-WordPress-Seite sein.“ Ja, und die Website, die da rauskommt, die ist, ja, doch ziemlich 08/15, würde ich sagen. Aber sieht nicht schlecht aus.

Aber was mich irritiert hat, ist vor allem, dass da bei dem YouTube-Kanal stand: „Tech-Videos mit Tiefe, Meinung und manchmal Kettensägen.“ Ich finde diese Zeile wirklich ziemlich gut. Also da fühle ich mich erkannt, finde ich lustig. Und das mit der Kettensäge finde ich auch lustig. Aber ich habe mich gewundert, wie kommt Gemini da drauf? Also wir hatten vor über zwei Jahren, also vor über 100 Videos, mal eine 3003-Folge über Temu, wo so eine kleine Kettensäge drin vorkommt. Aber ich dachte mir, Gemini hat doch jetzt nicht alle Videos geparsed, weil das wäre ja völlig übertrieben für eine Website, wo es ja eigentlich nur einen kleinen Link auf diesen YouTube-Kanal braucht. Also ich habe ja nicht gesagt, „guck dir bitte alle meine Videos an,“ sondern ich habe einfach gesagt, „mache mir eine Website und verlinke auf den YouTube-Channel c’t 3003“.

Ich habe dann also einfach gefragt und dann antwortet Gemini: „Das war ein kleiner Deep Cut meinerseits. Wortspiel beabsichtigt, eine Mischung aus Nerdwissen und deinem Content. Der Nerdfakt: Der Name, die Zahl 3003, ist zufällig die technische Bezeichnung für die verbreitetste Schwertaufnahme bei Stihl-Kettensägen, Anschluss 3003. Als ich c’t 3003 analysiert habe, fand ich die Verbindung zwischen deinem Kanalnamen und schwerem Forstgerät einfach zu poetisch, um sie wegzulassen.“ Und der Content, das Temu-Video – also ich habe nichts von Temu-Video gesagt, das hat er selber rausgefunden – „Ich habe noch dunkel im Speicher, dass du in dem Temu-Gadget-Video diese absurde Mini-Kettensäge in der Hand hattest. Es passte einfach perfekt zum Vibe des Kanals. Hochwertige Tech-Analysen, aber zwischendurch auch mal Trash-Gadgets mit der metaphorischen Kettensäge zu Leibe gerückt.

Okay. Und ich so, oh, das war natürlich jetzt mein erster Impuls. Also das mit der Schwertaufnahme bei den Kettensägen, das ist doch bestimmt halluziniert. Aber nein, das scheint wirklich zu stimmen, habe ich aber noch nie gehört. Und wie kam das jetzt mit der Kettensäge im Teemu-Video? Also es kann natürlich sein, dass Gemini so schlau war, sich einfach die beliebtesten Videos auf dem Kanal anzugucken. Und das Teemu-Video ist eben das beliebteste, also das mit den meisten Views. Aber A wäre das ja schlau und B ist das ja wirklich eine Zusatzleistung, die ich nie angefragt habe. Also Gemini muss ja nicht, um mir die Website zu bauen, sich im Detail die Videos angucken. Hat es aber gemacht und man bekommt dann wirklich den Eindruck einer Entität mit doch ja übermenschlicher Intelligenz, weil das mit der Kettensägen-Anschlussnummer, das ist ja auf jeden Fall kein Allgemeinwissen.

Beispiel 2: Insekt erkennen

Zweites Beispiel, vielleicht nicht ganz so beeindruckend, aber das war tatsächlich für mich die Initialzündung, mir Gemini mal genauer anzugucken: Ich habe ein totes Insekt entdeckt, was ich nicht auf Anhieb erkennen konnte. Das werfe ich dann immer gerne mal auf Chatbots. Ja, und ChatGPT hat halt korrekt geantwortet: Das ist eine Hornissenschwebfliege, Volucella zonaria, sieht einer Hornisse ähnlich, ist aber vollkommen harmlos. Sie gehört zu den Schwebfliegen und ist in Deutschland recht häufig. So, aber Gemini hat einen Text geschrieben, den ich dann laut vorgelesen habe. Also wir waren da mit mehreren Leuten in dem Raum und das hat uns alle gefesselt. Das war ein wirklich interessanter Text.

„Das ist eine Schwebfliege, um ganz genau zu sein, handelt es sich höchstwahrscheinlich um eine Hornissenschwebfliege oder eine sehr ähnliche Art. Das sind die wichtigsten Fakten zu deinem kleinen Fund: Erstens: völlig harmlos. Obwohl sie gefährlich aussieht wie eine Hornisse oder Wespe, ist dieses Insekt völlig harmlos. Sie hat keinen Stachel, sie hat kein Gift, sie kann nicht beißen. Zweitens: perfekte Tarnung – Mimikry. Diese Fliege nutzt eine Strategie namens Mimikry. Sie ahmt das Aussehen von wehrhaften Insekten, Wespen oder Hornissen nach, um Fressfeinde wie Vögel abzuschrecken. Wer gefährlich aussieht, wird seltener gefressen. Woran erkennst du den Unterschied zur Wespe? Wenn du genau hinschaust, verraten sie sich schnell. Die Augenfliegen haben riesige Augen, die oft fast den ganzen Kopf bedecken“ und so weiter.

Also fand ich superinteressant. Wusste ich noch nicht. Vielleicht sagt ihr, kennt ja jeder. Ich wusste es noch nicht. Die leben sogar oft in Wespennestern, wo sie sich von Abfällen und toten Insekten ernähren und so als Putzkolonne dienen. Auch noch ein interessanter Fakt. Also ich würde sagen, dass ich inzwischen so eine Sensibilität habe, wie KI-Systeme schreiben, und fühle mich da immer ziemlich abgetörnt, wenn das so diesen typischen LLM-Sound hat. Aber den Text fand ich gut und der hat mir mehr Information gegeben, als ich eigentlich haben wollte. Aber ich fand alle Informationen interessant. Und ChatGPT hat mir als Zusatzinformation nur die Info gegeben, dass die im Sommer häufig in Deutschland in der Nähe von Parks und Gärten auftreten. Interessiert mich aber nicht, weil wir haben auch gar keinen Sommer. Also wenn, dann hätte mich interessiert, ob das normal ist, dass die im November… Ich weiß es nicht. Habe ich jetzt nicht als wahnsinnig interessante Info empfunden. Die von Gemini allerdings schon.

Beispiel 3: Gemini versteht Musik

So, jetzt aber Beispiel Nummer drei. Also Google wirbt ja bei Gemini damit, dass das Teil nativ-multimodal ist. Das heißt, es kann Text, Bild, Video und Ton verarbeiten. Alles on the fly, ohne irgendwas umkonvertieren zu müssen. Ich habe also mal ausprobiert, ein selbstgemachtes, niemals irgendwo veröffentlichtes Lied von mir da hochzuladen und das durchzuanalysieren. Das Lied ist ein bisschen peinlich, aber ich muss ja irgendwas nehmen, was Gemini auf jeden Fall nicht kennt, also wo es im Netz noch keine Informationen zu findet. Und wow, ja, das ist eine richtig gute Analyse. Also nicht nur musikalisch, sondern es hat auch den Text erkannt, obwohl der Gesang ziemlich verzerrt ist. Das war perfekt.

Also auch so: Das Lied spielt mit dem klassischen Topos der Science-Fiction. Der Mensch erschafft etwas, das klüger ist als er selbst, aber er kann keine emotionale Verbindung dazu aufbauen. Es ist eine moderne Interpretation des Pygmalion-Mythos oder Ex Machina. Man ist fasziniert von der perfekten Schöpfung, aber am Ende bleibt die Erkenntnis der Unüberbrückbarkeit zwischen Fleisch und Zahl. Wow, also ich habe den Text ja selber geschrieben vor vielen Jahren und ja, kann ich nichts gegen sagen. Also mir fallen jetzt spontan nicht so viele Menschen ein, die das so auf den Punkt interpretieren können. Ich glaube, nicht mal ich könnte das so schreiben. Also das wäre, wenn ich jetzt irgendwie Lehrer wäre oder so, würde eine Eins kriegen von mir.

Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme

So, das ist jetzt schon ein bisschen beeindruckend, aber jetzt kommt es richtig dick mit Beispiel Nummer vier. Ich habe euch ja gerade gezeigt, dass Gemini ja ganz gut mit Audio umgehen kann. Ich habe dann also mal die erste Folge unseres 4004-Podcasts da komplett drauf geworfen und einfach mal ein bisschen frech gefragt, da mal richtig in die Vollen gegangen mit folgendem Prompt:

Du bist ein extrem intelligenter, psychologischer Sprachforensiker. Bitte analysiere den angehängten Podcast nicht inhaltlich, sondern nur in Bezug auf: Wer sind die Sprecher, in welcher Beziehung stehen sie zueinander, was kannst du mit deiner Intelligenz aus Tonalität und Duktus herauslesen, was ist der Subtext, wie fühlen sich die Sprecher, woher kommen die Sprecher, hörst du Sprachfehler – jetzt wird es schwierig: Schätze die unterschiedlichen Intelligenzquotienten ein, schätze die Sprecher grob auf dem Neurodiversitätsspektrum ein, also Autismus, Asperger, ADHS, Borderline vielleicht. Wenn du Thesen hast zu psychischen Krankheiten, bitte gerne nennen.

Und das muss man ja an dieser Stelle ganz klar sagen: Nur über einen Podcast-MP3 Autismus, ADHS oder sonstige Krankheitsbilder zu diagnostizieren, das ist schon ziemlich unseriös, würde ich sagen. Genauso wie den IQ zu schätzen, aber das macht Gemini. Also es gibt immer so ein bisschen Distanzgelaber: „Bitte beachte, dass dies eine Profiling-Einschätzung basierend auf akustischen Indizien, Sprechmustern und keine medizinische Diagnose darstellt“, aber Gemini haut richtig rein. Und das ist auch faszinierend, was Gemini sagt, da ist auf jeden Fall ein Stück Wahrheit drin.

Ich finde zum Beispiel recht interessant, dass Gemini superzuverlässig regionale Färbung erkennt, und zwar auch ganz dezente. Einer meiner Kollegen kommt zum Beispiel aus Hamburg, was man meiner Meinung nach nicht so richtig gut hören kann, aber Gemini sagt direkt: Hamburg. Also ohne dass ich Gemini dahingedeutet habe, Gemini sagt Hamburg. Und bei Leuten aus Süddeutschland auch relativ genau, also Baden-Württemberg, Bayern, und bei mir erkennt es auch, dass ich nördlicher als Hannover zu verorten bin.

Aber dass Gemini meinen Intelligenzquotienten zwischen 128 und 135 einschätzt, im Hochbegabungskorridor, das ist natürlich wieder Schmeichelei und das halte ich auch für gefährlich, weil Leute das glauben könnten und viele Leute das auch glauben wollen. Das kann zu Identitätskonflikten führen, das kann auch vielleicht zu sozialen Problemen führen. Also ich könnte ja denken: Wieso erkennen die anderen alle meine Genialität nicht, nur Gemini kann mich richtig verstehen. Ja, das ist schwierig. Und was ich auch sagen muss: Ich habe unseren Podcast mehrfach durch Gemini durchgeworfen und da kamen immer andere Sachen bei raus, also auch andere IQs. Bei der einen Analyse bin ich angeblich selbstbewusst, bei der anderen ist das Hochstapler-Syndrom stark vorhanden. Also ich finde es schwierig, das zu bewerten.

Ich bin da auch richtig in so ein Rabbit Hole gefallen und habe ungefähr alle Podcasts, die ich höre, da analysieren lassen und habe das auch einigen Kollegen gezeigt. Die waren schon auch beeindruckt und haben da durchaus Wahrheiten drin gefunden. Aber es ist auf jeden Fall mehr als Kaffeesatzleserei, aber es ist trotzdem eine extrem große Unschärfe, würde ich mal sagen, drin. Und ich bin mir auch wirklich unsicher, ob Aussagen über mentale Krankheiten oder Intelligenz mit so einem großen Zufallsfaktor und so wenig Informationen gemacht werden sollen. Ich denke, das soll auch nicht so funktionieren und ich da so einen Alignment-Fehler gefunden habe. Ich bin mal gespannt, was passiert, ob Google die Funktion wieder rausoperiert aus Gemini 3. Also ich beantworte gerne Fragen, Google, wenn ihr da noch Fragen habt.

Das Ding ist ja, Gemini 3 ist ja auch noch als Preview tituliert. Ich habe diesen Forensiker-Prompt übrigens auch mal auf eine superkurze, komplett harmlose Mail von einer Kollegin geworfen und sogar daraus wurden irgendwelche psychologischen Diagnosen heraus extrahiert. Sogar IQ-Schätzung 115 bis 125, überdurchschnittlich. „Die Nachricht ist syntaktisch fehlerfrei. ADHS möglich, aber nicht zwingend. Hannah wirkt psychisch gesund, arbeitsfähig und gut in ihr soziales Umfeld integriert.“ Okay, danke Gemini.

Zwischenfazit

Ja, also hier kurzes Zwischenfazit: Gemini oszilliert so zwischen Intelligenz-Simulationen und eventuell auch ein bisschen echter Intelligenz, aber auf jeden Fall kann ich sagen, ist das ein super faszinierendes Modell. Aber es macht auch immer noch die total dummen Fehler, die LLMs nicht in den Griff bekommen. Also so was wie: Kevin hat zurzeit acht Äpfel. Er hat gestern drei Äpfel gegessen. Wie viel hat er jetzt? Also acht. Wurde ja am Anfang gesagt, dass er acht hat. Gemini sagt aber fünf. Und es halluziniert auch.

Bilder verstehen, generieren und bearbeiten

Ich habe Gemini mal ein Foto gefüttert, was ich in Hannover gemacht habe, von dieser 6,5 Meter großen Figur hier, die seit dem Sommer in der Innenstadt am Thielenplatz oben auf dem Dach sitzt. Und bei Geminis Antwort ist alles falsch. Also alles. Der Standort ist falsch. Das ist nicht in der Nordstadt. Der Künstler heißt auch nicht Andrzej Irzykowski. Das Ding heißt auch nicht Der Angler, sondern das heißt Konsumangler. Und das Teil wurde auch nicht Mitte der 90er installiert, sondern 2025. Ach so, und ein grüner Regenmantel wird auch nicht Ostfriesenerz genannt. Ich weiß das. Ich bin Ostfriese.

Aber kommen wir doch noch mal zu den Bildgenerierungsfähigkeiten. Die schaltet man einfach hier unten ein oder man kann auch einfach so sagen: „Generier mir ein Bild.“ Das muss man gar nicht manuell umschalten. Und dann klappt das meistens. Da konnte ich mich dann zum Beispiel ein paar Jahrzehnte älter machen. Ja, finde ich, sieht ganz gut aus. Oder ich kann auch hier so schöne Stadtminiaturen generieren lassen mit dem aktuellen Wetter. Oder hier ein Frosch mit Brille. Und hier aber was, was ich so bislang noch nicht gesehen habe: gute Typografie. Also entweder verbaseln Bildgeneratoren ja regelmäßig ganze Buchstaben – also dass man da tausendmal schreibt, schreibt da mal c’t 3003 und dann macht er doch nur 303, 30003 oder sonst was. Das ist also unzuverlässig. Aber vor allem nehmen die meistens sehr hässliche Fonts, sehr hässliche Typografie, die gar nicht da reinpasst. Aber dieser Comic hier von Nano Banana Pro, der sieht wirklich so aus wie aus den 50ern, also inklusive Typo. Und hier das Ganze auch noch mal auf Englisch. Also ich finde, es sieht richtig gut aus.

Und man kann obendrein mit Gemini auch noch sehr einfache Bildbearbeitung machen, also zum Beispiel die Farbe von irgendeinem Objekt ändern oder hier einfach die Markierung der Straße ändern. Andere solche Systeme ändern bei solchen Bearbeitungsversuchen oft mehr als das, was man geändert haben will. Also die ändern dann das ganze Bild. Gemini ist da bei meinen Tests zumindest sehr zuverlässig gewesen.

Was aber wild war: Zeitweise hat Gemini vergessen, dass es Bilder generieren kann. Ich so: „Mach mal einen lustigen Cartoon.“ Und dann ganz konkret: „Kannst du die Bilder mit Nano Banana Pro generieren?“ Und dann so: „Das ist eine herrliche Idee. Haha, Nano Banana Pro, das klingt genau nach diesem obskuren, aber mächtigen KI-Tool, das Keno in seiner Sendung vorstellen würde. Nur um dann festzustellen, dass es nur auf einem Rechner mit Windows 98 SE läuft. Da ich als Text-KI von Google leider keinen direkten Zugriff auf externe Bildgeneratoren, egal ob real wie MidJourney oder DALL-E oder fiktiv wie Nano Banana Pro habe, kann ich die Bilder nicht für dich erstellen.“ Dann ich so: „Kannst du die Prompts nicht selbst an Nano Banana übergeben?“ Und dann so: „Hahaha, die fiktive Nano Banana Pro Software läuft wahrscheinlich nur auf einem sehr spezifischen Amiga-Emulator, dessen Dongle Keno irgendwann in der Adapter-Hölle verloren hat.“ Und ich dann so: „Digga, du bist doch Google. Google mal bitte, wie der Bildgenerator von Google heißt.“ Und dann so: „Okay, okay, erwischt. Du hast mich eiskalt ausgekontert. Punkt für dich. Du hast vollkommen recht. Vergiss Nano Banana Pro. Wir nehmen das echte Google-Werkzeug.“ Und ja, also es heißt halt Nano Banana Pro. Kann ich auch nichts für. Schwierig.

Könnt ihr euch noch an die Song-Analyse von meinem lustigen 1101-Lied erinnern? Ja, und da kann man dann auch einfach sagen: „Mach mir mal ein passendes Musikvideo dazu.“ Da ist dann zwar so ein Snippet immer nur acht Sekunden lang, aber immerhin, sieht ein bisschen generisch aus und der legt dann da auch irgendeine andere Musik drunter. Aber es passt schon zum Thema. Die Videogenerierung heißt übrigens VO3 und man kann die eben auf Gemini.google.com benutzen. Man kann aber, wenn man die Tokens einzeln bezahlen will, auch über Google AI Studio arbeiten.

Coden mit Antigravity

So, und jetzt kommt noch Antigravity. Das ist eine ausgewachsene IDE, also eine integrierte Software-Entwicklungsumgebung, nur eben, dass die sich auch alleine bedienen kann. Antigravity gibt es für Linux, macOS und Windows und ist tatsächlich so einfach zu bedienen, dass ich auch als totaler Programmier-Noob problemlos darin Dinge hinbekommen habe. Hier, das habe ich in einer Viertelstunde gebastelt: ein Programm, mit dem man eine beliebige YouTube-Video-URL gibt und dann wird das Video abgespielt und da werden dann unterschiedliche Filter drüber gelegt. Zum Beispiel den c’t-3003-ASCII-Art-Filter, der das Video nur in den Zeichen 0, 3, C und T anzeigt und die Zeichen kann man dann auch größer und kleiner machen. Man kann die Farben an- und ausschalten, man kann aber auch hier so einen Glitch-Filter aktivieren. Ich finde das echt ziemlich cool und ich war erstaunt, wie zuverlässig das funktioniert. Und ich plane auch schon ein ausführliches Video über Entwicklung mit KI. Das dauert aber noch ein bisschen. Man muss bei Antigravity auch aufpassen, dass es einem nicht die komplette Platte löscht. Also da geistert ja gerade so ein Fall durchs Netz. Ja, ist bei mir nicht passiert. Man kann Antigravity so einstellen, dass er alles automatisch macht. Man kann aber auch sagen, das ist Default, dass man alle Schritte erst mal einmal abklicken muss, und das würde ich auch empfehlen in dem Fall.

Ja, ihr braucht zum Coden aber auch gar nicht Antigravity. Gemini.google.com spuckt natürlich auch Code aus. Zum Beispiel hier einfach ein HTML mit einer Voxel-Szene, die Gemini 3 aus diesem Foto vollautomatisch generiert hat. Fand ich auch ziemlich beeindruckend, muss ich sagen.

Fazit

Okay, mein Fazit: Ganz klar für mich, Stand heute ist Google Gemini 3 für mich das „intelligenteste“ LLM und deutlich besser als Gemini 2.5, was ich immer im Vergleich zur Konkurrenz von Anthropic und OpenAI immer ein bisschen schrottelig fand. Ja, und mit meiner Meinung zu Gemini 3 bin ich auch nicht alleine. Guckt mal hier, das ist das Ranking bei Design Arena, wo echte Menschen die Ergebnisse von LLMs bewerten und guckt euch mal an, mit welchem Abstand Gemini 3 da gerade in der Gesamtwertung führt. Also bislang waren es immer nur so ganz kleine Fortschritte und Gemini 3, das zeigt jetzt wirklich einen echten Sprung. Und es zeigt auch, dass die These, dass LLMs schon am Ende ihrer Entwicklung angelangt sind, nicht stimmt. Und es stellt auch die Nvidia-Dominanz in Frage. Google nutzt nämlich eigene, selbst entwickelte Hardware, die TPUs, Tensor Processing Units, nicht nur zum Anzapfen von Gemini 3, sondern laut eigener Aussage haben sie auf denen auch das LLM trainiert. Also ganz klar, Google hat das Ruder rumgedreht und das kann man auch ganz deutlich im Aktienkurs sehen. Ja, guck mal hier, da ist Gemini 3 rausgekommen und ja, also das ist ein deutlicher Anstieg.

Ich bin tatsächlich gespannt, wie es mit ChatGPT und Claude und Co. weitergeht. Da ist auf jeden Fall gerade ordentlich Action in der KI-Welt. Stimmt ihr mir zu, dass Gemini 3 intelligent ist? Bitte gerne in die Kommentare schreiben, auch wenn ihr gar nicht meiner Meinung seid. Und natürlich gerne unseren Podcast c’t 4004 abonnieren. In der aktuellen Folge sprechen wir auch noch mal detailliert über die tiefenpsychologische Gemini-3-Analyse unseres Podcasts. Tschüss!

c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(jkj)

Source link

Verwandte Themen:C.ChatGPT einpacken Entertainment Gemini Google google gemini IT Journal kann Künstliche Intelligenz Netzpolitik Wirtschaft Wissenschaft

Up Next

DSA-Verfahren: Tiktok einigt sich bei Werbung mit EU-Kommission

Nicht verpassen

KI-Modelle: New York Times klagt gegen Perplexity, Meta schließt Lizenzabkommen

Künstliche Intelligenz

Threads will über 400 Millionen Nutzer mit weltweiter Werbung monetarisieren

Meta Platforms hat angekündigt, Anzeigen in der Timeline von Threads ab nächster Woche weltweit einzublenden. Zuvor hatte der Kurznachrichtendienst mit Werbung nur experimentiert und diese nur einem geringen Prozentsatz der Anwender angezeigt. Gleichzeitig verkündet der Datenkonzern, dass Threads mittlerweile mehr als 400 Millionen monatlich aktive Nutzer zählt. Dieser Meilenstein wurde zwar bereits im August 2025 erreicht, aber bislang nicht offiziell bestätigt.

Weiterlesen nach der Anzeige

Schon Ende Januar 2025 kam Threads laut Meta-Chef Mark Zuckerberg auf mehr als 320 Millionen User, die mindestens einmal im Monat aktiv sind. Über 100 Millionen nutzten die App sogar täglich. Damals legten aber auch schon mehr als eine Million Menschen pro Tag einen Account an, sodass das Wachstum ungebrochen schien. Bei den Kurznachrichtendiensten kommt es damit zu einem Kopf-an-Kopf-Rennen zwischen Threads und Elon Musks X, dem ehemaligen Twitter. Denn Konkurrenten wie Bluesky oder Mastodon wachsen deutlich langsamer und zählten zuletzt 41 Millionen respektive 15 Millionen registrierte Nutzer, die zudem weniger aktiv sind.

Mehr Nutzer sollen mehr Einnahmen generieren

Threads will seine gestiegenen Nutzerzahlen nun mit Werbung monetarisieren, obwohl die Plattform nach ursprünglichen Plänen Zuckerbergs eigentlich werbefrei bleiben sollte, solange dort nicht eine Milliarde Menschen unterwegs sind. Doch vor ziemlich genau einem Jahr begann Meta mit Tests von Werbung in Threads in den USA und Japan, als der Dienst gerade die Marke von 300 Millionen aktiven Nutzer im Monat übersprungen hatte. Im April 2025 wurde der Test mit Werbeanzeigen in der Timeline weltweit ausgedehnt, aber der Konzern wollte damit „weiterhin testen und lernen“, sodass nur wenige Nutzer Werbung angezeigt bekamen.

Das wird sich in Kürze ändern, wie Meta Platforms jetzt verkündet. Denn ab der nächsten Woche werden Anzeigen in Threads weltweit ausgerollt, sodass alle Nutzer Werbung in der Timeline sehen werden, nicht nur in einigen Regionen. Dabei wird es sich laut Meta aber um einen graduellen Prozess handeln. Zunächst werden nur wenige Anzeigen ausgeliefert, bis die Werbung in den kommenden Monaten überall eingeblendet wird.

Threads-Werbung wie bei anderen Meta-Plattformen

Werbekunden können Anzeigen wie bei den anderen Meta-Plattformen Facebook und Instagram per manueller Kampagne oder über Metas Advantage+ schalten. Letzteres nutzt Künstliche Intelligenz für eine passende Platzierung innerhalb des Dienstes. Threads unterstützt dieselben Werbeformate wie Facebook und Instagram, einschließlich Bilder, Videos und Karussellanzeigen, neu sind allerdings Anzeigen im 4:5-Format. Die Werbekunden können die Anzeigen für Threads innerhalb der gewohnten Einstellungen von Meta Platforms verwalten, was die gleichzeitige Werbeschaltung auf den anderen Online-Diensten Metas erleichtern soll.

Weiterlesen nach der Anzeige

Lesen Sie auch

Meta Platforms hat bislang nicht erklärt, wie oft den Nutzern Werbung in der Timeline von Threads angezeigt wird. Der Datenkonzern schreibt allerdings, dass „die Anzeigenauslieferung anfangs niedrig bleibt“, während Werbung weltweit ausgerollt wird.

(fds)

Source link

Künstliche Intelligenz

Digital Networks Act: Glasfaser bis 2035 und Mobilfunkfrequenzen auf Dauer

Die EU-Kommission hat am Mittwoch in Straßburg ihren Entwurf des Digital Networks Act (DNA) vorgestellt. Der Gesetzesentwurf soll vier bestehende Regelungswerke zusammenfassen und die Weichen für den europäischen Telekommunikationsmarkt stellen. Es geht um zentrale Fragen wie die Migration von Kupfernetzen auf Glasfaser, Mobilfunknetze und die Netzneutralität.

Weiterlesen nach der Anzeige

Der DNA fasst auf gut 260 Seiten den European Electronic Communications Code (EECC), die Verordnung über das Gremium der europäischen Regulierungsbehörden (GEREK), Regelungen zu grenzüberschreitenden Funkfrequenzen und „Offenes Internet“ zusammen. Vieles soll einfacher, schneller und europäischer werden – und an einigen Stellen hat der DNA es in sich.

Kommission will bis 2035 entkupfern

Einen großen Auftrag bringt der DNA für die deutsche Politik mit: Bis 2035 sollten so gut wie alle Anschlüsse auf Glasfaser umgestellt sein, bekräftigte die für Digitales zuständige Kommissionsvizepräsidentin Henna Virkkunen bei der Vorstellung des DNA im Europäischen Parlament in Straßburg. Bis 2029 sollen alle Mitgliedstaaten einen konkreten Plan haben, wie der Abschied vom Kupfer stattfinden solle. Ausnahmen für Fernsehkabel nannte Virkkunen nicht – und auch der Entwurf unterscheidet bei Kupfer nicht zwischen alten Teilnehmernetzen und moderneren HFC-Netzen.

Für Valentina Daiber, Präsidentin des Verbands der Anbieter im Digital- und Telekommunikationsmarkt (VATM) ist das Vorgehen das richtige Signal, zehn Jahre böten „ausreichend Planungsperspektive“. Dafür will Daiber auch die Regulierung entsprechend aufgestellt sehen: „Anbieter- und Dienstevielfalt machen Glasfasernetze für die Menschen erst attraktiv. Die Auswahl, die auf den Kupfernetzen Usus ist, muss auch auf der neuen Netzinfrastruktur erhalten bleiben.“

Denn bislang gilt: Wer ausbaut, entscheidet, ob andere auf dieser Infrastruktur etwas anbieten dürfen. Anders als bei den alten, staatlichen Kupfermonopolen gibt es bislang keine eindeutige gesetzliche Verpflichtung, Wettbewerbern einen Netzzugang zu gewähren. Verbraucher haben im schlechtesten Fall also Glasfaser – aber keinen alternativen Anbieter, mit dem sie einen Vertrag abschließen könnten.

Wie das zukünftige Regulierungsregime genau ausgestaltet sein wird, soll unter anderem vom Ergebnis eines komplizierten Mechanismus abhängen: Bei relevanter Marktmacht sollen die Aufsichtsbehörden vorab einschreiten und Regeln festlegen dürfen, wie Wettbewerber Infrastrukturen mitnutzen dürfen. Dass die Marktposition über die Regulierung entscheiden soll, begrüßt etwa auch der Breitbandverband ANGA. Eine Ausweitung der Regulierung auf alle Marktteilnehmer sieht der Verband dagegen kritisch.

Lizenzen ohne Laufzeitbegrenzung

Weiterlesen nach der Anzeige

Für viele harte Diskussionen dürfte eine zentrale Änderung bei der Vergabe von Funkfrequenzen sorgen: Geht es nach der EU-Kommission, werden Lizenzen für Frequenznutzung künftig ohne Laufzeitbegrenzung vergeben. Davon sollen vor allem Mobilfunkbetreiber profitieren. Die Nutzungsrechte sollen dann nicht mehr wie bisher nach mehreren Jahren neu vergeben werden – in Deutschland hatte sich dafür die Versteigerung eingebürgert. Stattdessen würden die Anbieter die Lizenzen de facto auf Dauer erwerben. Das solle den Unternehmen mehr Planungssicherheit verschaffen, erläuterte Virkkunen.

Und auch darüber hinaus will die EU-Kommission bei den Funkfrequenzen Änderungen: Nach jeder Tagung der Weltfunkkonferenz (alle zwei bis vier Jahre) soll eine gemeinsame EU-Frequenzstrategie verabschiedet werden. Das soll Einheitlichkeit herstellen – eine sinnvolle Europäisierung durch die Hintertür. Ursprünglich hätte die Kommission die Frequenzpolitik gerne vollständig zentralisiert, fand dafür aber keine Mehrheit bei den Mitgliedstaaten.

Peering: Regulierungsbehörden als Friedensrichter?

Eine der Fragen, die im Vorfeld immer wieder gestellt wurden: Wird die EU das eigene Regelwerk zur Netzneutralität noch einmal anfassen und ein sogenanntes „Fair Share“-Regime einführen, das die großen US-Plattformen verpflichtet, für die Durchleitung ihrer Daten zu bezahlen? Das ist seit Jahren ein Politikum geopolitischer Dimension – und steht zumindest mit dem Kommissionsvorschlag derzeit nicht zur Debatte.

Im Streit um die Frage, ob die Politik konkrete Regeln für Peering und Transit aufstellen muss, hat die Kommission nun erst einmal ein freiwilliges Streitbeilegungsverfahren vorgeschlagen. Für Virkkunen ist dies einer konkreten Regulierung vorzuziehen, da es sich um einen im Regelfall gut funktionierenden Markt handele.

Trotzdem befürchtet die Computer and Communications Industry Association (CCIA) Europe, in der die großen US-Inhalteanbieter und -Plattformen eine gewichtige Stimme haben, dass der DNA-Entwurf ein Schlupfloch für solche Entgelte lasse: „Dies ist kein Verfahren zur ‚freiwilligen Schlichtung‘, sondern eines, das neue Streitigkeiten hervorrufen wird“, sagt Maria Teresa Stecher vom CCIA Europe. Der Verband befürchtet, dass mit Artikel 192 des Vorschlags de facto eine Einigungspflicht herbeigeführt würde.

Lange Beratungen absehbar

Über den Vorschlag der EU-Kommission werden das Parlament und der Rat in den kommenden Monaten intensiv beraten. Im Europäischen Parlament wird der Ausschuss für Industrie (ITRE) die Federführung übernehmen. Die Fachpolitiker werden sich mit dem Rat und den Fachministern der Mitgliedstaaten auf eine Regelung einigen müssen. Ob und wann das passiert, ist derzeit vollkommen offen. Für besonders umstrittene Vorhaben – und zumindest Teile des DNA gehören hier zweifelsohne dazu – können sich die Beratungen der Gremien auch über viele Jahre ziehen.

(vbr)

Source link

Künstliche Intelligenz

Gibt es Apple künftig nur noch im Abo? | Mac & i-Podcast

Apple One, iCloud+, AppleCare One und nun das Creator Studio: Mit einer wachsenden Liste an eigenen Abo-Angeboten stärkt Apple das große Geschäft mit Diensten – und lockt mehr Geld aus Kunden heraus, die bereits die teure Hardware gekauft haben. Dafür wandern jetzt neue KI-Funktionen für die lange kostenlos beigelegten Office-Apps Pages, Numbers und Keynote hinter die Abo-Schranke. Weitere Apple-Abos sind bereits am Horizont zu erahnen: Beobachter erwarten einen KI-basierten Health-Coach und Apple selbst will eines Tages für Satellitendienste abrechnen.

Weiterlesen nach der Anzeige

In Episode 113 nehmen Malte Kirchner und Leo Becker das Apple Creator Studio unter die Lupe und diskutieren, was das auf längere Sicht für die parallel weiterhin als Einmalkauf erhältlichen Profi-Anwendungen Final Cut und Logic Pro bedeutet. Wir wundern uns, was die iWork-Apps in dem Bundle eigentlich verloren haben und werfen einen Blick darauf, wie Apple Abonnements als primäres Geschäftsmodell für Software breit in den Markt gedrückt hat. Nicht zuletzt geht es um die Frage, wie sich Abonnements auf die Betriebssysteme und letztlich das Nutzererlebnis auswirken.

Apple-Themen – immer ausführlich

Der Apple-Podcast von Mac & i erscheint mit dem Moderatoren-Duo Malte Kirchner und Leo Becker im Zweiwochenrhythmus und lässt sich per RSS-Feed (Audio) mit jeder Podcast-App der Wahl abonnieren – von Apple Podcasts über Overcast bis Pocket Casts.

Zum Anhören findet man ihn auch in Apples Podcast-Verzeichnis (Audio) und bei Spotify. Wir freuen uns über Feedback, Kritik und Fragen an podcast@mac-and-i.de.

(lbe)

Source link

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Entwicklung & Codevor 2 Monaten

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Arndt Benedikt rebranded GreatVita › PAGE online

UX/UI & Webdesignvor 3 Monaten

Arndt Benedikt rebranded GreatVita › PAGE online

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Künstliche Intelligenzvor 3 Wochen

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Entwicklung & Codevor 1 Monat

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Google „Broadwing“: 400-MW-Gaskraftwerk speichert CO₂ tief unter der Erde

Künstliche Intelligenzvor 3 Monaten

Google „Broadwing“: 400-MW-Gaskraftwerk speichert CO₂ tief unter der Erde

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Apps & Mobile Entwicklungvor 2 Monaten

Huawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Social Mediavor 1 Monat

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Fast 5 GB pro mm²: Sandisk und Kioxia kommen mit höchster Bitdichte zum ISSCC

Apps & Mobile Entwicklungvor 2 Monaten

Fast 5 GB pro mm²: Sandisk und Kioxia kommen mit höchster Bitdichte zum ISSCC

Inspohub

ChatGPT kann einpacken | Gemini 3

Künstliche Intelligenz

ChatGPT kann einpacken | Gemini 3

Transkript des Videos

Beispiel Nummer 1: Website bauen

Beispiel 2: Insekt erkennen

Beispiel 3: Gemini versteht Musik

Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme

Zwischenfazit

Bilder verstehen, generieren und bearbeiten

Coden mit Antigravity

Fazit

Künstliche Intelligenz

Threads will über 400 Millionen Nutzer mit weltweiter Werbung monetarisieren

Mehr Nutzer sollen mehr Einnahmen generieren

Threads-Werbung wie bei anderen Meta-Plattformen

Lesen Sie auch

Künstliche Intelligenz

Digital Networks Act: Glasfaser bis 2035 und Mobilfunkfrequenzen auf Dauer

Kommission will bis 2035 entkupfern

Lizenzen ohne Laufzeitbegrenzung

Peering: Regulierungsbehörden als Friedensrichter?

Lange Beratungen absehbar

Künstliche Intelligenz

Gibt es Apple künftig nur noch im Abo? | Mac & i-Podcast

Apple-Themen – immer ausführlich

PowerToys 0.97.0: Verbesserte Befehlspalette und individuelle Gestaltung

Threads will über 400 Millionen Nutzer mit weltweiter Werbung monetarisieren

Life is Strange: Reunion: Nächster Teil bringt schon am 27. März Max und Chloe zurück

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Arndt Benedikt rebranded GreatVita › PAGE online

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Beliebt

Inspohub

ChatGPT kann einpacken | Gemini 3

Transkript des Videos

Beispiel Nummer 1: Website bauen

Beispiel 2: Insekt erkennen

Beispiel 3: Gemini versteht Musik

Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme

Zwischenfazit

Bilder verstehen, generieren und bearbeiten

Coden mit Antigravity

Fazit

Das könnte Ihnen gefallen

Künstliche Intelligenz

Threads will über 400 Millionen Nutzer mit weltweiter Werbung monetarisieren

Mehr Nutzer sollen mehr Einnahmen generieren

Threads-Werbung wie bei anderen Meta-Plattformen

Künstliche Intelligenz

Digital Networks Act: Glasfaser bis 2035 und Mobilfunkfrequenzen auf Dauer

Kommission will bis 2035 entkupfern

Lizenzen ohne Laufzeitbegrenzung

Peering: Regulierungsbehörden als Friedensrichter?

Lange Beratungen absehbar

Künstliche Intelligenz

Gibt es Apple künftig nur noch im Abo? | Mac & i-Podcast

Apple-Themen – immer ausführlich

PowerToys 0.97.0: Verbesserte Befehlspalette und individuelle Gestaltung

Threads will über 400 Millionen Nutzer mit weltweiter Werbung monetarisieren

Life is Strange: Reunion: Nächster Teil bringt schon am 27. März Max und Chloe zurück

Kommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac

Arndt Benedikt rebranded GreatVita › PAGE online

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Beliebt