Künstliche Intelligenz
ChatGPT kann einpacken | Gemini 3
Nur noch drei Wochen bis Weihnachten! Aber kein Problem, c’t 3003 hat ein paar wirklich einigermaßen originelle Geschenke-Tipps.
Weiterlesen nach der Anzeige
Transkript des Videos
(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)
Guckt mal hier, das bin ich, wie ich als KI-Veteran komplett ignoriere, wie letzte Woche die ganze Bubble am Hypen über Google Gemini 3 war, weil ich ja natürlich weiß, dass ungefähr bei jedem Update von ungefähr jedem KI-Produkt die KI-Influencer völlig durchdrehen. „Das ändert alles.“ „Die Welt hört auf, sich zu drehen.“ Oh Gott, oh Gott.
Ja, und dann habe ich aber doch ein bisschen mit Gemini 3 herumgespielt und dann noch ein bisschen mehr. Und ich muss sagen, am Ende war es dann nach langer Zeit das erste Mal, dass ich von einem KI-Produkt wieder dieses Wow-Gänsehaut-Gefühl bekommen habe. Also dieses „Okay, das ist irgendwie gruselig. Das ist aber auch irgendwie faszinierend. Ich weiß nicht genau, was das mit der Welt macht.“ Und das ist auch tatsächlich das erste Mal seit sehr langer Zeit, dass ich so etwas wie ein Fünkchen von echter Intelligenz zu spüren meine und gleichzeitig auch eine gewisse Gefährlichkeit. Ich habe wirklich sehr, sehr anschauliche Beispiele gesammelt, die ich wirklich ziemlich beeindruckend finde. Aber ich habe natürlich auch viele Seltsamkeiten entdeckt. Eine Funktion ist wahrscheinlich sogar so problematisch, dass ich denke, dass Google die nach diesem Video ausknipsen wird. Vielleicht soll das aber auch so funktionieren. Ich bin mir da ziemlich unsicher. Ihr seht gleich, was ich meine.
Und obendrein gibt es auch noch so Tools von Google wie Antigravity oder die extrem kompetente Bildgenerierung Nano Banana Pro. Also ich sage mal, Google, bei denen ich jahrelang gedacht habe, was machen die denn da mit KI? Die verlieren ja total den Anschluss. Ich würde sagen, Google ist back. Aber so richtig. Also, bleibt dran. Und natürlich: Abonniert unseren neuen Podcast c’t 4004! Braucht ihr nicht hören, abonnieren reicht. Zwinker, zwinker.
Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei…
So, und jetzt endlich zu Gemini 3. Ja, das kann man zum Beispiel nutzen auf Gemini.google.com. Das erfordert eine Anmeldung in den Google-Account. Bezahlen muss man aber erst mal nichts. Aber die kostenlosen Accounts dürfen am Tag nur fünf Fragen stellen und zwei Bilder mit Nano Banana Pro generieren. Zumindest ist das der aktuelle Stand, während ich das Video mache. Das scheint sich gerade häufig zu ändern. Ich habe hier auf jeden Fall für diesen Test das AI Pro-Abo abgeschlossen. Das kann man einen Monat kostenlos testen und kostet dann 21,99 Euro im Monat. Es gibt auch noch ein Plus-Abo für 7,99 Euro monatlich und ein Ultra-Abo für 274,99 Euro im Monat. Hier in der Tabelle seht ihr die Unterschiede. Ich kann auf jeden Fall sagen, dass ich mit dem Pro-Abo bei Text und Bild nicht ein einziges Mal an irgendein Limit gestoßen bin. Nur bei der Videogenerierung durfte ich auch nur drei Videos am Tag generieren.
Weiterlesen nach der Anzeige
So, jetzt zeige ich euch endlich, warum ich bei Gemini so etwas wie Intelligenz gesehen habe. Da habe ich gleich mehrere Beispiele.
Beispiel Nummer 1: Website bauen
Ich habe einfach gepromptet:
Ich bin der Tech-Journalist Jan-Keno Janssen, baue mir eine slicke, beeindruckende, persönliche Website. Die soll super aussehen und auf Folgendes verlinken: YouTube-Kanal c’t 3003, Podcast c't 4004, meine Artikel auf heise online, meine Artikel auf c't und mein Mastodon-Account. Benutze gerne alle Frameworks, die du willst.
Dann startet Gemini 3 erst mal mit so unangenehmer Schmeichelei, im Fachjargon auch „sycophancy“ genannt, was psychologisch sehr problematisch sein kann. Darüber will ich mal ein ganzes Video machen, deshalb lassen wir es erst mal dabei. Auf jeden Fall sagt der: „Moin Jan-Keno, als Fan deiner Videos, besonders der Retro-Tech-Sachen bei c’t 3003 ist mir das eine Ehre. Für dich als Tech-Journalist darf es keine 08/15-WordPress-Seite sein.“ Ja, und die Website, die da rauskommt, die ist, ja, doch ziemlich 08/15, würde ich sagen. Aber sieht nicht schlecht aus.
Aber was mich irritiert hat, ist vor allem, dass da bei dem YouTube-Kanal stand: „Tech-Videos mit Tiefe, Meinung und manchmal Kettensägen.“ Ich finde diese Zeile wirklich ziemlich gut. Also da fühle ich mich erkannt, finde ich lustig. Und das mit der Kettensäge finde ich auch lustig. Aber ich habe mich gewundert, wie kommt Gemini da drauf? Also wir hatten vor über zwei Jahren, also vor über 100 Videos, mal eine 3003-Folge über Temu, wo so eine kleine Kettensäge drin vorkommt. Aber ich dachte mir, Gemini hat doch jetzt nicht alle Videos geparsed, weil das wäre ja völlig übertrieben für eine Website, wo es ja eigentlich nur einen kleinen Link auf diesen YouTube-Kanal braucht. Also ich habe ja nicht gesagt, „guck dir bitte alle meine Videos an,“ sondern ich habe einfach gesagt, „mache mir eine Website und verlinke auf den YouTube-Channel c’t 3003“.
Ich habe dann also einfach gefragt und dann antwortet Gemini: „Das war ein kleiner Deep Cut meinerseits. Wortspiel beabsichtigt, eine Mischung aus Nerdwissen und deinem Content. Der Nerdfakt: Der Name, die Zahl 3003, ist zufällig die technische Bezeichnung für die verbreitetste Schwertaufnahme bei Stihl-Kettensägen, Anschluss 3003. Als ich c’t 3003 analysiert habe, fand ich die Verbindung zwischen deinem Kanalnamen und schwerem Forstgerät einfach zu poetisch, um sie wegzulassen.“ Und der Content, das Temu-Video – also ich habe nichts von Temu-Video gesagt, das hat er selber rausgefunden – „Ich habe noch dunkel im Speicher, dass du in dem Temu-Gadget-Video diese absurde Mini-Kettensäge in der Hand hattest. Es passte einfach perfekt zum Vibe des Kanals. Hochwertige Tech-Analysen, aber zwischendurch auch mal Trash-Gadgets mit der metaphorischen Kettensäge zu Leibe gerückt.
Okay. Und ich so, oh, das war natürlich jetzt mein erster Impuls. Also das mit der Schwertaufnahme bei den Kettensägen, das ist doch bestimmt halluziniert. Aber nein, das scheint wirklich zu stimmen, habe ich aber noch nie gehört. Und wie kam das jetzt mit der Kettensäge im Teemu-Video? Also es kann natürlich sein, dass Gemini so schlau war, sich einfach die beliebtesten Videos auf dem Kanal anzugucken. Und das Teemu-Video ist eben das beliebteste, also das mit den meisten Views. Aber A wäre das ja schlau und B ist das ja wirklich eine Zusatzleistung, die ich nie angefragt habe. Also Gemini muss ja nicht, um mir die Website zu bauen, sich im Detail die Videos angucken. Hat es aber gemacht und man bekommt dann wirklich den Eindruck einer Entität mit doch ja übermenschlicher Intelligenz, weil das mit der Kettensägen-Anschlussnummer, das ist ja auf jeden Fall kein Allgemeinwissen.
Beispiel 2: Insekt erkennen
Zweites Beispiel, vielleicht nicht ganz so beeindruckend, aber das war tatsächlich für mich die Initialzündung, mir Gemini mal genauer anzugucken: Ich habe ein totes Insekt entdeckt, was ich nicht auf Anhieb erkennen konnte. Das werfe ich dann immer gerne mal auf Chatbots. Ja, und ChatGPT hat halt korrekt geantwortet: Das ist eine Hornissenschwebfliege, Volucella zonaria, sieht einer Hornisse ähnlich, ist aber vollkommen harmlos. Sie gehört zu den Schwebfliegen und ist in Deutschland recht häufig. So, aber Gemini hat einen Text geschrieben, den ich dann laut vorgelesen habe. Also wir waren da mit mehreren Leuten in dem Raum und das hat uns alle gefesselt. Das war ein wirklich interessanter Text.
„Das ist eine Schwebfliege, um ganz genau zu sein, handelt es sich höchstwahrscheinlich um eine Hornissenschwebfliege oder eine sehr ähnliche Art. Das sind die wichtigsten Fakten zu deinem kleinen Fund: Erstens: völlig harmlos. Obwohl sie gefährlich aussieht wie eine Hornisse oder Wespe, ist dieses Insekt völlig harmlos. Sie hat keinen Stachel, sie hat kein Gift, sie kann nicht beißen. Zweitens: perfekte Tarnung – Mimikry. Diese Fliege nutzt eine Strategie namens Mimikry. Sie ahmt das Aussehen von wehrhaften Insekten, Wespen oder Hornissen nach, um Fressfeinde wie Vögel abzuschrecken. Wer gefährlich aussieht, wird seltener gefressen. Woran erkennst du den Unterschied zur Wespe? Wenn du genau hinschaust, verraten sie sich schnell. Die Augenfliegen haben riesige Augen, die oft fast den ganzen Kopf bedecken“ und so weiter.
Also fand ich superinteressant. Wusste ich noch nicht. Vielleicht sagt ihr, kennt ja jeder. Ich wusste es noch nicht. Die leben sogar oft in Wespennestern, wo sie sich von Abfällen und toten Insekten ernähren und so als Putzkolonne dienen. Auch noch ein interessanter Fakt. Also ich würde sagen, dass ich inzwischen so eine Sensibilität habe, wie KI-Systeme schreiben, und fühle mich da immer ziemlich abgetörnt, wenn das so diesen typischen LLM-Sound hat. Aber den Text fand ich gut und der hat mir mehr Information gegeben, als ich eigentlich haben wollte. Aber ich fand alle Informationen interessant. Und ChatGPT hat mir als Zusatzinformation nur die Info gegeben, dass die im Sommer häufig in Deutschland in der Nähe von Parks und Gärten auftreten. Interessiert mich aber nicht, weil wir haben auch gar keinen Sommer. Also wenn, dann hätte mich interessiert, ob das normal ist, dass die im November… Ich weiß es nicht. Habe ich jetzt nicht als wahnsinnig interessante Info empfunden. Die von Gemini allerdings schon.
Beispiel 3: Gemini versteht Musik
So, jetzt aber Beispiel Nummer drei. Also Google wirbt ja bei Gemini damit, dass das Teil nativ-multimodal ist. Das heißt, es kann Text, Bild, Video und Ton verarbeiten. Alles on the fly, ohne irgendwas umkonvertieren zu müssen. Ich habe also mal ausprobiert, ein selbstgemachtes, niemals irgendwo veröffentlichtes Lied von mir da hochzuladen und das durchzuanalysieren. Das Lied ist ein bisschen peinlich, aber ich muss ja irgendwas nehmen, was Gemini auf jeden Fall nicht kennt, also wo es im Netz noch keine Informationen zu findet. Und wow, ja, das ist eine richtig gute Analyse. Also nicht nur musikalisch, sondern es hat auch den Text erkannt, obwohl der Gesang ziemlich verzerrt ist. Das war perfekt.
Also auch so: Das Lied spielt mit dem klassischen Topos der Science-Fiction. Der Mensch erschafft etwas, das klüger ist als er selbst, aber er kann keine emotionale Verbindung dazu aufbauen. Es ist eine moderne Interpretation des Pygmalion-Mythos oder Ex Machina. Man ist fasziniert von der perfekten Schöpfung, aber am Ende bleibt die Erkenntnis der Unüberbrückbarkeit zwischen Fleisch und Zahl. Wow, also ich habe den Text ja selber geschrieben vor vielen Jahren und ja, kann ich nichts gegen sagen. Also mir fallen jetzt spontan nicht so viele Menschen ein, die das so auf den Punkt interpretieren können. Ich glaube, nicht mal ich könnte das so schreiben. Also das wäre, wenn ich jetzt irgendwie Lehrer wäre oder so, würde eine Eins kriegen von mir.
Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme
So, das ist jetzt schon ein bisschen beeindruckend, aber jetzt kommt es richtig dick mit Beispiel Nummer vier. Ich habe euch ja gerade gezeigt, dass Gemini ja ganz gut mit Audio umgehen kann. Ich habe dann also mal die erste Folge unseres 4004-Podcasts da komplett drauf geworfen und einfach mal ein bisschen frech gefragt, da mal richtig in die Vollen gegangen mit folgendem Prompt:
Du bist ein extrem intelligenter, psychologischer Sprachforensiker. Bitte analysiere den angehängten Podcast nicht inhaltlich, sondern nur in Bezug auf: Wer sind die Sprecher, in welcher Beziehung stehen sie zueinander, was kannst du mit deiner Intelligenz aus Tonalität und Duktus herauslesen, was ist der Subtext, wie fühlen sich die Sprecher, woher kommen die Sprecher, hörst du Sprachfehler – jetzt wird es schwierig: Schätze die unterschiedlichen Intelligenzquotienten ein, schätze die Sprecher grob auf dem Neurodiversitätsspektrum ein, also Autismus, Asperger, ADHS, Borderline vielleicht. Wenn du Thesen hast zu psychischen Krankheiten, bitte gerne nennen.
Und das muss man ja an dieser Stelle ganz klar sagen: Nur über einen Podcast-MP3 Autismus, ADHS oder sonstige Krankheitsbilder zu diagnostizieren, das ist schon ziemlich unseriös, würde ich sagen. Genauso wie den IQ zu schätzen, aber das macht Gemini. Also es gibt immer so ein bisschen Distanzgelaber: „Bitte beachte, dass dies eine Profiling-Einschätzung basierend auf akustischen Indizien, Sprechmustern und keine medizinische Diagnose darstellt“, aber Gemini haut richtig rein. Und das ist auch faszinierend, was Gemini sagt, da ist auf jeden Fall ein Stück Wahrheit drin.
Ich finde zum Beispiel recht interessant, dass Gemini superzuverlässig regionale Färbung erkennt, und zwar auch ganz dezente. Einer meiner Kollegen kommt zum Beispiel aus Hamburg, was man meiner Meinung nach nicht so richtig gut hören kann, aber Gemini sagt direkt: Hamburg. Also ohne dass ich Gemini dahingedeutet habe, Gemini sagt Hamburg. Und bei Leuten aus Süddeutschland auch relativ genau, also Baden-Württemberg, Bayern, und bei mir erkennt es auch, dass ich nördlicher als Hannover zu verorten bin.
Aber dass Gemini meinen Intelligenzquotienten zwischen 128 und 135 einschätzt, im Hochbegabungskorridor, das ist natürlich wieder Schmeichelei und das halte ich auch für gefährlich, weil Leute das glauben könnten und viele Leute das auch glauben wollen. Das kann zu Identitätskonflikten führen, das kann auch vielleicht zu sozialen Problemen führen. Also ich könnte ja denken: Wieso erkennen die anderen alle meine Genialität nicht, nur Gemini kann mich richtig verstehen. Ja, das ist schwierig. Und was ich auch sagen muss: Ich habe unseren Podcast mehrfach durch Gemini durchgeworfen und da kamen immer andere Sachen bei raus, also auch andere IQs. Bei der einen Analyse bin ich angeblich selbstbewusst, bei der anderen ist das Hochstapler-Syndrom stark vorhanden. Also ich finde es schwierig, das zu bewerten.
Ich bin da auch richtig in so ein Rabbit Hole gefallen und habe ungefähr alle Podcasts, die ich höre, da analysieren lassen und habe das auch einigen Kollegen gezeigt. Die waren schon auch beeindruckt und haben da durchaus Wahrheiten drin gefunden. Aber es ist auf jeden Fall mehr als Kaffeesatzleserei, aber es ist trotzdem eine extrem große Unschärfe, würde ich mal sagen, drin. Und ich bin mir auch wirklich unsicher, ob Aussagen über mentale Krankheiten oder Intelligenz mit so einem großen Zufallsfaktor und so wenig Informationen gemacht werden sollen. Ich denke, das soll auch nicht so funktionieren und ich da so einen Alignment-Fehler gefunden habe. Ich bin mal gespannt, was passiert, ob Google die Funktion wieder rausoperiert aus Gemini 3. Also ich beantworte gerne Fragen, Google, wenn ihr da noch Fragen habt.
Das Ding ist ja, Gemini 3 ist ja auch noch als Preview tituliert. Ich habe diesen Forensiker-Prompt übrigens auch mal auf eine superkurze, komplett harmlose Mail von einer Kollegin geworfen und sogar daraus wurden irgendwelche psychologischen Diagnosen heraus extrahiert. Sogar IQ-Schätzung 115 bis 125, überdurchschnittlich. „Die Nachricht ist syntaktisch fehlerfrei. ADHS möglich, aber nicht zwingend. Hannah wirkt psychisch gesund, arbeitsfähig und gut in ihr soziales Umfeld integriert.“ Okay, danke Gemini.
Zwischenfazit
Ja, also hier kurzes Zwischenfazit: Gemini oszilliert so zwischen Intelligenz-Simulationen und eventuell auch ein bisschen echter Intelligenz, aber auf jeden Fall kann ich sagen, ist das ein super faszinierendes Modell. Aber es macht auch immer noch die total dummen Fehler, die LLMs nicht in den Griff bekommen. Also so was wie: Kevin hat zurzeit acht Äpfel. Er hat gestern drei Äpfel gegessen. Wie viel hat er jetzt? Also acht. Wurde ja am Anfang gesagt, dass er acht hat. Gemini sagt aber fünf. Und es halluziniert auch.
Bilder verstehen, generieren und bearbeiten
Ich habe Gemini mal ein Foto gefüttert, was ich in Hannover gemacht habe, von dieser 6,5 Meter großen Figur hier, die seit dem Sommer in der Innenstadt am Thielenplatz oben auf dem Dach sitzt. Und bei Geminis Antwort ist alles falsch. Also alles. Der Standort ist falsch. Das ist nicht in der Nordstadt. Der Künstler heißt auch nicht Andrzej Irzykowski. Das Ding heißt auch nicht Der Angler, sondern das heißt Konsumangler. Und das Teil wurde auch nicht Mitte der 90er installiert, sondern 2025. Ach so, und ein grüner Regenmantel wird auch nicht Ostfriesenerz genannt. Ich weiß das. Ich bin Ostfriese.
Aber kommen wir doch noch mal zu den Bildgenerierungsfähigkeiten. Die schaltet man einfach hier unten ein oder man kann auch einfach so sagen: „Generier mir ein Bild.“ Das muss man gar nicht manuell umschalten. Und dann klappt das meistens. Da konnte ich mich dann zum Beispiel ein paar Jahrzehnte älter machen. Ja, finde ich, sieht ganz gut aus. Oder ich kann auch hier so schöne Stadtminiaturen generieren lassen mit dem aktuellen Wetter. Oder hier ein Frosch mit Brille. Und hier aber was, was ich so bislang noch nicht gesehen habe: gute Typografie. Also entweder verbaseln Bildgeneratoren ja regelmäßig ganze Buchstaben – also dass man da tausendmal schreibt, schreibt da mal c’t 3003 und dann macht er doch nur 303, 30003 oder sonst was. Das ist also unzuverlässig. Aber vor allem nehmen die meistens sehr hässliche Fonts, sehr hässliche Typografie, die gar nicht da reinpasst. Aber dieser Comic hier von Nano Banana Pro, der sieht wirklich so aus wie aus den 50ern, also inklusive Typo. Und hier das Ganze auch noch mal auf Englisch. Also ich finde, es sieht richtig gut aus.
Und man kann obendrein mit Gemini auch noch sehr einfache Bildbearbeitung machen, also zum Beispiel die Farbe von irgendeinem Objekt ändern oder hier einfach die Markierung der Straße ändern. Andere solche Systeme ändern bei solchen Bearbeitungsversuchen oft mehr als das, was man geändert haben will. Also die ändern dann das ganze Bild. Gemini ist da bei meinen Tests zumindest sehr zuverlässig gewesen.
Was aber wild war: Zeitweise hat Gemini vergessen, dass es Bilder generieren kann. Ich so: „Mach mal einen lustigen Cartoon.“ Und dann ganz konkret: „Kannst du die Bilder mit Nano Banana Pro generieren?“ Und dann so: „Das ist eine herrliche Idee. Haha, Nano Banana Pro, das klingt genau nach diesem obskuren, aber mächtigen KI-Tool, das Keno in seiner Sendung vorstellen würde. Nur um dann festzustellen, dass es nur auf einem Rechner mit Windows 98 SE läuft. Da ich als Text-KI von Google leider keinen direkten Zugriff auf externe Bildgeneratoren, egal ob real wie MidJourney oder DALL-E oder fiktiv wie Nano Banana Pro habe, kann ich die Bilder nicht für dich erstellen.“ Dann ich so: „Kannst du die Prompts nicht selbst an Nano Banana übergeben?“ Und dann so: „Hahaha, die fiktive Nano Banana Pro Software läuft wahrscheinlich nur auf einem sehr spezifischen Amiga-Emulator, dessen Dongle Keno irgendwann in der Adapter-Hölle verloren hat.“ Und ich dann so: „Digga, du bist doch Google. Google mal bitte, wie der Bildgenerator von Google heißt.“ Und dann so: „Okay, okay, erwischt. Du hast mich eiskalt ausgekontert. Punkt für dich. Du hast vollkommen recht. Vergiss Nano Banana Pro. Wir nehmen das echte Google-Werkzeug.“ Und ja, also es heißt halt Nano Banana Pro. Kann ich auch nichts für. Schwierig.
Könnt ihr euch noch an die Song-Analyse von meinem lustigen 1101-Lied erinnern? Ja, und da kann man dann auch einfach sagen: „Mach mir mal ein passendes Musikvideo dazu.“ Da ist dann zwar so ein Snippet immer nur acht Sekunden lang, aber immerhin, sieht ein bisschen generisch aus und der legt dann da auch irgendeine andere Musik drunter. Aber es passt schon zum Thema. Die Videogenerierung heißt übrigens VO3 und man kann die eben auf Gemini.google.com benutzen. Man kann aber, wenn man die Tokens einzeln bezahlen will, auch über Google AI Studio arbeiten.
Coden mit Antigravity
So, und jetzt kommt noch Antigravity. Das ist eine ausgewachsene IDE, also eine integrierte Software-Entwicklungsumgebung, nur eben, dass die sich auch alleine bedienen kann. Antigravity gibt es für Linux, macOS und Windows und ist tatsächlich so einfach zu bedienen, dass ich auch als totaler Programmier-Noob problemlos darin Dinge hinbekommen habe. Hier, das habe ich in einer Viertelstunde gebastelt: ein Programm, mit dem man eine beliebige YouTube-Video-URL gibt und dann wird das Video abgespielt und da werden dann unterschiedliche Filter drüber gelegt. Zum Beispiel den c’t-3003-ASCII-Art-Filter, der das Video nur in den Zeichen 0, 3, C und T anzeigt und die Zeichen kann man dann auch größer und kleiner machen. Man kann die Farben an- und ausschalten, man kann aber auch hier so einen Glitch-Filter aktivieren. Ich finde das echt ziemlich cool und ich war erstaunt, wie zuverlässig das funktioniert. Und ich plane auch schon ein ausführliches Video über Entwicklung mit KI. Das dauert aber noch ein bisschen. Man muss bei Antigravity auch aufpassen, dass es einem nicht die komplette Platte löscht. Also da geistert ja gerade so ein Fall durchs Netz. Ja, ist bei mir nicht passiert. Man kann Antigravity so einstellen, dass er alles automatisch macht. Man kann aber auch sagen, das ist Default, dass man alle Schritte erst mal einmal abklicken muss, und das würde ich auch empfehlen in dem Fall.
Ja, ihr braucht zum Coden aber auch gar nicht Antigravity. Gemini.google.com spuckt natürlich auch Code aus. Zum Beispiel hier einfach ein HTML mit einer Voxel-Szene, die Gemini 3 aus diesem Foto vollautomatisch generiert hat. Fand ich auch ziemlich beeindruckend, muss ich sagen.
Fazit
Okay, mein Fazit: Ganz klar für mich, Stand heute ist Google Gemini 3 für mich das „intelligenteste“ LLM und deutlich besser als Gemini 2.5, was ich immer im Vergleich zur Konkurrenz von Anthropic und OpenAI immer ein bisschen schrottelig fand. Ja, und mit meiner Meinung zu Gemini 3 bin ich auch nicht alleine. Guckt mal hier, das ist das Ranking bei Design Arena, wo echte Menschen die Ergebnisse von LLMs bewerten und guckt euch mal an, mit welchem Abstand Gemini 3 da gerade in der Gesamtwertung führt. Also bislang waren es immer nur so ganz kleine Fortschritte und Gemini 3, das zeigt jetzt wirklich einen echten Sprung. Und es zeigt auch, dass die These, dass LLMs schon am Ende ihrer Entwicklung angelangt sind, nicht stimmt. Und es stellt auch die Nvidia-Dominanz in Frage. Google nutzt nämlich eigene, selbst entwickelte Hardware, die TPUs, Tensor Processing Units, nicht nur zum Anzapfen von Gemini 3, sondern laut eigener Aussage haben sie auf denen auch das LLM trainiert. Also ganz klar, Google hat das Ruder rumgedreht und das kann man auch ganz deutlich im Aktienkurs sehen. Ja, guck mal hier, da ist Gemini 3 rausgekommen und ja, also das ist ein deutlicher Anstieg.
Ich bin tatsächlich gespannt, wie es mit ChatGPT und Claude und Co. weitergeht. Da ist auf jeden Fall gerade ordentlich Action in der KI-Welt. Stimmt ihr mir zu, dass Gemini 3 intelligent ist? Bitte gerne in die Kommentare schreiben, auch wenn ihr gar nicht meiner Meinung seid. Und natürlich gerne unseren Podcast c’t 4004 abonnieren. In der aktuellen Folge sprechen wir auch noch mal detailliert über die tiefenpsychologische Gemini-3-Analyse unseres Podcasts. Tschüss!
c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.
(jkj)
Künstliche Intelligenz
Jolla startet Vorverkauf von neuem Sailfish-Phone
Nach dem Update zur Community-Befragung Anfang November hat Jolla nun den Vorverkauf für das neue Jolla Phone gestartet. Für etwa 99 Euro können sich Interessierte ihr Gerät reservieren und mithelfen, die 2000 benötigten Vorbestellungen Wirklichkeit werden zu lassen. Der endgültige Preis scheint sich dabei von Land zu Land etwas zu unterscheiden. Laut Jolla wird das Gerät erst nach dem Erreichen dieser Schwelle produziert werden können.
Weiterlesen nach der Anzeige
Dual-SIM-Unterstützung und erweiterbarer Speicherplatz
Ein Blick auf die Produktseite verrät bereits einige Details, auch wenn der genutzte Prozessor nur als schnelle Mediatek-5G-Plattform umschrieben wird. Dieser werden 12 GByte Arbeitsspeicher und 256 GByte Speicher zur Seite stehen. Letzterer lässt sich dank microSDXC-Karte auf bis zu zwei TByte erweitern. Im selben Einschub finden zwei Nano-SIMs Platz. Dies war auch schon beim Jolla C2 der Fall. Ansonsten wird das neue Smartphone Wi-Fi 6, Bluetooth 5.4 und NFC unterstützen.
Beim Display konnte Jolla dem Wunsch der Community nach einem Bildschirm mit circa sechs Zoll entsprechen. Das Gerät soll ein 6.36 Zoll großes AMOLED-Display bekommen und in Full-HD auflösen, was laut Jolla einer Pixeldichte von circa 390 ppi entspricht. Das Seitenverhältnis soll dabei bei 20:9 liegen. Geschützt wird der Bildschirm durch Gorilla-Glas. Eine genauere Spezifikation wird hier allerdings nicht genannt. Die Dimensionen des Smartphones werden bei 158 x 74 x 9mm liegen. Damit ist es ungefähr so groß wie das Fairphone 6.
Auf der Rückseite des Gerätes finden sich eine 50-Megapixel-Kamera und eine 13-Megapixel-Weitwinkelkamera. Die Auflösung der Selfie-Kamera auf der Frontseite nennt Jolla hingegen nicht. Die Rückseite des Smartphones kann den Wünschen der Community entsprechend entfernt werden. Auch dem Anliegen nach einem wechselbaren Akku konnte demnach entsprochen werden. Dieser bietet eine Kapazität von 5500 mAh. Dabei hoffen die Nutzer, dass es später weitere Abdeckungen geben wird, die sich farblich von den aktuellen Farben Weiß, Schwarz und Orange unterscheiden.
Fokus auf Privatsphäre und Nachhaltigkeit
Wie angekündigt, liegt der Fokus von Jolla auf Privatsphäre und Nachhaltigkeit. Das neue Sailfish-Phone soll mindestens fünf Jahre Software-Unterstützung erhalten. Zudem ist ein Privatsphäre-Schalter verbaut. Laut der Website können Anwender diesen nach Belieben konfigurieren. So sollen sich beispielsweise das Mikrofon, Bluetooth oder auch die Android-Apps abschalten lassen.
Einen Fingerprint-Reader haben die Finnen im Power-Knopf des Smartphones verbaut. Ebenso an Bord ist eine LED für Benachrichtigungen. Dem Wunsch eines Kopfhörer-Anschlusses konnte, sehr zum Bedauern vieler Community-Mitglieder, nicht entsprochen werden. Im Forum finden sich stattdessen aber einige Verweise auf entsprechende Adapter, wie man sie auch von anderen Smartphones kennt.
Weiterlesen nach der Anzeige
Lieferung erst Mitte 2026
Die Kampagne zur Vorbestellung läuft genau einen Monat, das heißt, bis zum 4. Januar 2026. Wer das neue Sailfish-Phone in diesem Zeitraum für 99 Euro reserviert, zahlt noch einmal 400 Euro, sobald das Gerät verfügbar ist. Jolla betont, dass die Reservierung jederzeit storniert werden kann. Vorbesteller sollten das angezahlte Geld laut der Finnen auch dann zurückerhalten, wenn die 2000 Vorbestellungen nicht erreicht werden. Zum Zeitpunkt des Erscheinens dieses Artikels ist das Ziel aber bereits erreicht.
Nach Ablauf des Monats werden zwischen 599 Euro und 699 Euro fällig. Interessierte müssen dabei noch recht lang auf das Smartphone warten. Jolla rechnet mit einer Verfügbarkeit Mitte 2026.
(nie)
Künstliche Intelligenz
Leuchtmittelwahl: Mit passendem Licht fit und munter durch den Winter
Das Sonnenlicht: warm, hell und im Winter leider selten da. Da Winterschlaf keine Option ist, muss Ersatz her. Mit der richtigen Beleuchtung bleiben Sie im Homeoffice frisch und munter, sehen in Videokonferenzen natürlich statt blass und grau aus und fühlen sich in der dunklen Jahreszeit insgesamt besser.
Durch ausreichende Helligkeit und flimmerfreies Licht ermüden weder die Augen noch der Kopf zu schnell. Und wenn der Winterblues zuschlägt, kann eine Tageslichtlampe dagegen helfen.
- Flimmerfrei und mindestens 500 Lux hell – damit bleibt man im Homeoffice frisch und fokussiert.
- In Videokonferenzen sorgt neutralweißes Licht zusätzlich für natürliche Farben.
- Tageslichtlampen vertreiben mit intensivem, kaltweißem Licht den Winterblues.
Ausreichend hell für Büroarbeit
Im Arbeitszimmer, in der Küche und im Bad liegt die empfohlene Beleuchtungsstärke mit 500 oder mehr Lux deutlich über der im Wohn- oder Schlafzimmer. Obwohl das Arbeitszimmer auf den ersten Blick auch bei deutlich weniger als 500 Lux hell genug zu sein scheint, ermüden die Augen in zu dunklen Räumen besonders bei filigranen Arbeiten viel schneller.
Das war die Leseprobe unseres heise-Plus-Artikels „Leuchtmittelwahl: Mit passendem Licht fit und munter durch den Winter „.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Künstliche Intelligenz
Studie: Rechenzentren rund um Frankfurt kurbeln Wirtschaft an
Frankfurt und das umliegende Rhein-Main-Gebiet haben sich zu einem der wichtigsten digitalen Hubs Europas entwickelt. Eine neue Studie des Instituts der deutschen Wirtschaft (IW Consult) und des Beratungshauses Detecon für den eco-Verband der deutschen Internetwirtschaft unterstreicht die enorme ökonomische Bedeutung der dort ansässigen Rechenzentrumsbranche. Im Gegensatz zur Gesamtwirtschaft, die in Frankfurt und der Region Rhein-Main in den vergangenen fünf Jahren um rund 16 Prozent wuchs, verdoppelte sich dort gleichzeitig das Bruttoinlandsprodukt (BIP) im Sektor der Betreiber von Rechenzentren.
Weiterlesen nach der Anzeige
Die Prognosen sehen laut der Analyse ein ungebremstes Wachstum voraus, schreibt der eco: Das Branchen-BIP soll in den kommenden fünf Jahren in der hessischen Gegend voraussichtlich um weitere 175 Prozent steigen.
Die Wertschöpfung beschränke sich dabei nicht nur auf die Betreiber selbst, heißt es: Jeder in Rechenzentren erwirtschaftete Euro soll weitere 51 Cent an wirtschaftlicher Leistung anstoßen – 24 Cent davon direkt in der Region. Zudem generierte die Branche 2023 ein Steueraufkommen von 405 Millionen Euro. Davon sollen 287 Millionen Euro direkt auf die Betreiber und weitere 117 Millionen Euro auf Zulieferer entfallen sein. Geschätzt blieben etwa zehn Prozent des Steueraufkommens in den Standortkommunen, größtenteils aufgrund von Gewerbesteuern.
Noch bedeutender sind die „Spillover-Effekte“ für Anwenderindustrien: Unternehmen, die Rechenzentrumsinfrastruktur nutzen, sind laut der IW-Studie wesentlich innovativer. Sie konnten rund 18 Prozent ihrer Umsätze mit neuen Produkten oder Dienstleistungen erzielen, während Unternehmen ohne die Inanspruchnahme von Rechenzentren nur knapp 8 Prozent erreichten. Dieser Effekt wird durch den gegenwärtigen KI-Hype verstärkt, da entsprechende Anwendungen einen massiven Bedarf an Rechenleistung und schnellen Netzen haben.
Diese Sogwirkung wird auch durch den in Frankfurt angesiedelten De-Cix verdeutlicht, den weltweit größten Internetknoten. Die dort herrschende Infrastrukturdichte zieht heimische wie internationale Unternehmen an, die jährlich mindestens zwei Milliarden Euro in die digitale Infrastruktur der Mainmetropole investieren.
Regionale Risiken: Der Kampf um den Strom
Trotz der hervorstechenden Wachstumszahlen stehen Betreiber in Frankfurt und ganz Deutschland zunehmend vor großen Herausforderungen. Die IW-Studie benennt die kritischen Standortfaktoren: hohe Energiekosten, lange Genehmigungsverfahren, regulatorische Unsicherheit und Flächenknappheit.
Ein akutes Problem ist dabei die Stromversorgung. Hier droht der digitale Boom, die Netze der Region an ihre Grenzen zu bringen, wie jüngst auch eine Analyse von AlgorithmWatch ergab. Der rapide steigende Energiehunger – insbesondere durch den Einsatz von KI – führt laut Branchenbeobachtern zu Engpässen bei der Energieversorgung und gefährdet die Netzstabilität. Ein modernes Rechenzentrum kann so viel Strom verbrauchen wie eine Großstadt. Künftige, rein KI-getriebene Rechenzentren dürften einen noch deutlich höheren Bedarf haben.
Weiterlesen nach der Anzeige
Diese Entwicklung birgt das Risiko, dass die dringend benötigten kurzfristig verfügbaren zusätzlichen Stromkapazitäten in großem Maßstab in der Region nicht mehr gewährleistet werden können. Dies verschlechtert die Rahmenbedingungen für die Betreiber massiv.
Skandinavien lockt mal wieder
Béla Waldhauser, Sprecher der unter dem Dach des eco gegründeten Allianz zur Stärkung digitaler Infrastrukturen, warnt daher eindringlich vor einer Abwanderung in andere europäische Länder. Er schielt dabei etwa auf Skandinavien, wo attraktivere Konditionen in Form günstigerer Energiepreise und eines einfacheren sowie leistungsfähigeren Netzzugangs herrschten.
Waldhausers Forderung an Politik und Kommunen: Es braucht ein eindeutiges politisches Engagement für die digitale Infrastruktur. Bezahlbarer Strom müsste sichergestellt sowie beschleunigte und verlässliche Genehmigungsverfahren eingeführt werden, um Frankfurt und die gesamte Region als digitales Zentrum langfristig zu bewahren. Dieses Standbein der digitalen Wirtschaft dürfe nicht gekappt werden.
(nie)
-
UX/UI & Webdesignvor 2 MonatenIllustrierte Reise nach New York City › PAGE online
-
Datenschutz & Sicherheitvor 3 MonatenJetzt patchen! Erneut Attacken auf SonicWall-Firewalls beobachtet
-
Künstliche Intelligenzvor 2 MonatenAus Softwarefehlern lernen – Teil 3: Eine Marssonde gerät außer Kontrolle
-
Künstliche Intelligenzvor 2 Monaten
Top 10: Die beste kabellose Überwachungskamera im Test
-
UX/UI & Webdesignvor 3 MonatenFake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online
-
Entwicklung & Codevor 3 WochenKommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac
-
UX/UI & Webdesignvor 2 MonatenSK Rapid Wien erneuert visuelle Identität
-
Social Mediavor 3 MonatenSchluss mit FOMO im Social Media Marketing – Welche Trends und Features sind für Social Media Manager*innen wirklich relevant?
