Was ist
Durch eine unglückliche Verkettung außergewöhnlicher Umstände ist heute Mittag ein nahezu fertiges Briefing verschwunden. Wir ersparen dir die technischen Details und belassen es bei einer Warnung:
- Wenn du 364 Tage im Jahr ein doppeltes Backup hast, dann geht am 365. Tag garantiert alles schief.
- Ein neuer Laptop und Zeitdruck sind keine Entschuldigung, kurzzeitig ohne redundante Backups zu arbeiten.
- Wir haben unsere Lektion gelernt und machen den Fehler hoffentlich nur einmal.
Deshalb fällt die heutige Ausgabe etwas kürzer aus als gewohnt. Wir ersetzen den geplanten Deep-Dive zu Gemini 3 und Claude Opus 4.5 durch allgemeinere Gedanken zum Fortschritt bei generativer KI. Statt unsere eigenen Eindrücke zu teilen, verweisen wir auf umfangreiche Analysen von Menschen, die sich besser auskennen als wir.
Was Google und Anthropic vorgestellt haben
Binnen weniger Tage haben Google und Anthropic neue Sprach- und Bildmodelle veröffentlicht:
- Gemini 3 löst 2.5 Pro als Googles leistungsfähigstes LLM ab (Google Blog).
- Das zugehörige Bildmodell Nano Banana Pro übertrifft Nano Banana, das bereits führend bei Bildgenerierung und -bearbeitung war (Google-Blog).
- Claude Opus 4.5 ist das derzeit beste Coding-Modell (Anthropic-Blog).
Wir haben die Modelle ausführlich ausprobiert. Unsere bisherigen Beobachtungen:
- Alle drei Modelle sind besser als ihre Vorgänger und wären vor einem Jahr eine Sensation gewesen. Selbst Gary Marcus ist milde beeindruckt.
- Gemini 3 erfordert etwas Eingewöhnung und neue Prompting-Strategien. Mehr dazu bei Phil Schmid von Google DeepMind.
- Als erstes Bildmodell kann Nano Banana Pro vernünftig mit Text umgehen und sinnvolle Infografiken erstellen.
- Unsere laienhaften Coding-Fähigkeiten reichen nicht aus, um Opus 4.5 an seine Grenzen zu bringen. Doch selbst für uns ist die Verbesserung spürbar.
Was andere sagen
OpenAI, Google und Anthropic geben einem ausgewählten Personenkreis vorab Zugriff auf neue Modelle. Das hat einen Grund: Diese Menschen haben in der Vergangenheit bewiesen, dass sie gut einschätzen können, wozu LLMs taugen und wozu nicht.
Im Fall von Gemini 3 und Opus 4.5 empfehlen wir diese Analysen: