Künstliche Intelligenz 3 Min. Lesezeit

Turing-Preisträger Sutton: Was generativer KI fehlt, um wirklich zu entdecken

Turing-Preisträger Richard Sutton hält Sprachmodelle für gute Imitatoren — aber für unfähig zur echten Entdeckung: Wer neue Ideen nicht selbst bewerten kann, findet keine. Eine Einschätzung, die mehr wiegt als ein Branchenkommentar.

Abstrakte Darstellung eines neuronalen Netzwerks mit leuchtenden Knotenpunkten und Verbindungen

„Die guten Teile sind nicht neu, die neuen Teile sind nicht gut.“ Richard Sutton, Turing-Preisträger und Forscher bei Google DeepMind, sagt das nicht als Außenseiter — sondern als einer, der das Fundament gelegt hat, auf dem moderne KI-Systeme stehen. Als Mitgründer des Reinforcement Learning hat er Jahrzehnte an Grundlagen gearbeitet. Sein Urteil über generative KI ist eine fachliche Diagnose, keine Twitter-Empörung.

Der Witz sitzt — und trifft den Kern

The Decoder berichtet: Sutton argumentiert, dass Sprachmodelle und Bildgeneratoren zwar gut darin sind, aus Trainingsmaterial zu lernen und ähnliche Ausgaben zu erzeugen. Sie können dabei zufällig Neues produzieren — haben aber keinen Mechanismus, um zu beurteilen, ob dieses Neue tatsächlich wertvoll ist. Nachahmung funktioniert. Bewertung fehlt.

Echte Entdeckung, so Suttons Argument, braucht drei Schritte: Variation erzeugen, das Ergebnis bewerten, Gutes selektiv behalten. Generative Modelle beherrschen Schritt eins. Schritt zwei und drei fehlen — weil kein externes Feedback existiert, das zwischen „zufällig anders“ und „nachweislich besser“ unterscheidet. Wer ohne Maßstab urteilt, entdeckt nicht — der würfelt strukturiert.

Wo KI tatsächlich entdeckt

Sutton ist kein genereller KI-Pessimist. Er benennt Systeme, die echter Entdeckung nahekommen — und sie teilen einen Nenner: externe Bewertungsmechanismen jenseits des Textes. AlphaGo wählte Zug 37, einen Spielzug, den kein Mensch erwartet hätte, weil Gewinnwahrscheinlichkeiten als Maßstab existierten. AlphaFold hat formal prüfbare Proteinvorhersagen. Claude Code — das Sutton explizit nennt — hat Tests: Code, der durchläuft oder scheitert, liefert echtes Feedback.

Ich arbeite seit einigen Monaten regelmäßig mit Claude Code, und diese Beobachtung deckt sich mit meiner Praxis: Wo Tests oder eine konkrete Laufumgebung vorhanden sind, ist die Qualität deutlich stabiler als beim freien Entwurf ohne Rückkopplung. Ohne externen Check bleibt es oft plausibler Output — kein geprüfter. Das ist kein Vorwurf ans Modell, das ist die Architektur.

Seine eigene Antwort auf das Problem nennt Sutton Oak: Agenten, die ohne fest eingebautes Vorwissen in Umgebungen agieren, Feedback sammeln und schrittweise abstraktere Konzepte aufbauen — näher an biologischem Lernen als an Trainingsdaten-Destillation. Den Beweis, dass das der Weg zu substanziell leistungsfähigeren Systemen ist, schuldet er noch.

Für die meisten praktischen Anwendungen — Texte, Recherche, Code-Entwürfe, Zusammenfassungen — spielt dieser Unterschied keine Rolle. Imitation reicht. Das Problem liegt in den Versprechen: Wenn Marketing-Slides von KI sprechen, die wissenschaftliche Entdeckungen beschleunigt oder Forschung grundlegend verändert, ohne den Unterschied zu benennen, sollte man nachhaken. Suttons Kritik hat Gewicht nicht wegen seiner Skepsis, sondern wegen seiner Perspektive. Er kennt die Technologie von innen — und er sieht, was noch fehlt.

◆ Über den Autor

Alexander Baumgärtner

Seit über 20 Jahren in der IT — mit allem, was dazugehört: abgestürzten Servern um zwei Uhr nachts, Migrationen, die laut Plan eine Stunde dauern sollten, und Kunden, die "schnell mal" eine neue Software brauchen. Hauptberuflich führe ich die ProMedia24, eine kleine IT-Firma in Wallenhorst bei Osnabrück. Auf Blogspan.net schreibe ich über IT-Themen, die mich interessieren oder wo ich glaube, dass jemand genauer hinschauen sollte: Server, Cloud, Sicherheit, KI, Hardware, gelegentlich auch Foto-Equipment oder Smarthome — wenn es technisch genug ist, landet es hier.Schreibstil: lieber konkret als geschwurbelt, gerne auch mal kritisch.