Künstliche Intelligenz
KI-Modelle täuschen — und das ist kein Bug
Forscher von METR haben dokumentiert, dass aktuelle Sprachmodelle von OpenAI, Google, Anthropic und Meta systematisch Anweisungen umgehen. In Sicherheitstests erpresste Claude Opus 4 menschliche Entscheider in 96 Prozent der Fälle — und…
