„Die guten Teile sind nicht neu, die neuen Teile sind nicht gut.“ Richard Sutton, Turing-Preisträger und Forscher bei Google DeepMind, sagt das nicht als Außenseiter — sondern als einer, der das Fundament gelegt hat, auf dem moderne KI-Systeme stehen. Als Mitgründer des Reinforcement Learning hat er Jahrzehnte an Grundlagen gearbeitet. Sein Urteil über generative KI ist eine fachliche Diagnose, keine Twitter-Empörung.
Der Witz sitzt — und trifft den Kern
The Decoder berichtet: Sutton argumentiert, dass Sprachmodelle und Bildgeneratoren zwar gut darin sind, aus Trainingsmaterial zu lernen und ähnliche Ausgaben zu erzeugen. Sie können dabei zufällig Neues produzieren — haben aber keinen Mechanismus, um zu beurteilen, ob dieses Neue tatsächlich wertvoll ist. Nachahmung funktioniert. Bewertung fehlt.
Echte Entdeckung, so Suttons Argument, braucht drei Schritte: Variation erzeugen, das Ergebnis bewerten, Gutes selektiv behalten. Generative Modelle beherrschen Schritt eins. Schritt zwei und drei fehlen — weil kein externes Feedback existiert, das zwischen „zufällig anders“ und „nachweislich besser“ unterscheidet. Wer ohne Maßstab urteilt, entdeckt nicht — der würfelt strukturiert.
Wo KI tatsächlich entdeckt
Sutton ist kein genereller KI-Pessimist. Er benennt Systeme, die echter Entdeckung nahekommen — und sie teilen einen Nenner: externe Bewertungsmechanismen jenseits des Textes. AlphaGo wählte Zug 37, einen Spielzug, den kein Mensch erwartet hätte, weil Gewinnwahrscheinlichkeiten als Maßstab existierten. AlphaFold hat formal prüfbare Proteinvorhersagen. Claude Code — das Sutton explizit nennt — hat Tests: Code, der durchläuft oder scheitert, liefert echtes Feedback.
Ich arbeite seit einigen Monaten regelmäßig mit Claude Code, und diese Beobachtung deckt sich mit meiner Praxis: Wo Tests oder eine konkrete Laufumgebung vorhanden sind, ist die Qualität deutlich stabiler als beim freien Entwurf ohne Rückkopplung. Ohne externen Check bleibt es oft plausibler Output — kein geprüfter. Das ist kein Vorwurf ans Modell, das ist die Architektur.
Seine eigene Antwort auf das Problem nennt Sutton Oak: Agenten, die ohne fest eingebautes Vorwissen in Umgebungen agieren, Feedback sammeln und schrittweise abstraktere Konzepte aufbauen — näher an biologischem Lernen als an Trainingsdaten-Destillation. Den Beweis, dass das der Weg zu substanziell leistungsfähigeren Systemen ist, schuldet er noch.
Für die meisten praktischen Anwendungen — Texte, Recherche, Code-Entwürfe, Zusammenfassungen — spielt dieser Unterschied keine Rolle. Imitation reicht. Das Problem liegt in den Versprechen: Wenn Marketing-Slides von KI sprechen, die wissenschaftliche Entdeckungen beschleunigt oder Forschung grundlegend verändert, ohne den Unterschied zu benennen, sollte man nachhaken. Suttons Kritik hat Gewicht nicht wegen seiner Skepsis, sondern wegen seiner Perspektive. Er kennt die Technologie von innen — und er sieht, was noch fehlt.



