
Anthropic bestätigt Qualitätsprobleme bei Claude Code und dementiert absichtliche Degradation
ℹKeine Anlageberatung • Nur zu Informationszwecken
Anthropic hat bestätigt, dass die Qualität seines beliebten KI-Produkts Claude Code in den letzten Wochen nachgelassen hat. Das Unternehmen dementiert jedoch vehement Spekulationen über eine absichtliche Verschlechterung und führt die Probleme auf drei spezifische Produktanpassungen zurück, die inzwischen behoben wurden.
Qualitätseinbußen bei Claude Code bestätigt
Nach wochenlangen Nutzerbeschwerden hat Anthropic in einem ausführlichen Blogbeitrag eingeräumt, dass die Qualität von Claude Code, einem seiner meistgenutzten Produkte, tatsächlich beeinträchtigt war. Das Unternehmen betonte, dass es Berichte über Degradation sehr ernst nehme und niemals absichtlich Modelle verschlechtere. Die zugrunde liegenden KI-Modelle seien nicht betroffen gewesen; stattdessen handelte es sich um Anpassungen auf Produktebene, die zu einer schlechteren Nutzererfahrung führten. Anthropic wurde zuvor für die technischen Fähigkeiten seiner Tools gelobt und erreichte eine Bewertung von 1 Billion US-Dollar auf Sekundärmärkten.
Die drei Ursachen der Verschlechterung
Anthropic identifizierte drei spezifische Produktänderungen, die zu den gemeldeten Problemen beitrugen:
- Änderung des Standard-Denk-Levels: Am 4. März wurde das Standard-Denk-Level von Claude Code von "hoch" auf "mittel" geändert, um lange Latenzzeiten zu reduzieren. Dies wurde am 7. April rückgängig gemacht, da Nutzer eine höhere Intelligenz bevorzugten. Diese Änderung betraf Sonnet 4.6 und Opus 4.6.
- Fehler bei der Cache-Optimierung: Eine am 26. März eingeführte Änderung zur Löschung älterer Gedanken aus inaktiven Sitzungen führte zu einem Fehler. Statt nur einmal nach einer Stunde Inaktivität, wurde der Cache bei jeder Runde geleert, was Claude "vergesslich" und "repetitiv" erscheinen ließ. Dieser Fehler wurde am 10. April behoben und betraf Sonnet 4.6 und Opus 4.6.
- System-Prompt zur Reduzierung der Ausführlichkeit: Am 16. April wurde eine System-Prompt-Anweisung hinzugefügt, um die Ausführlichkeit zu reduzieren. In Kombination mit anderen Prompt-Änderungen beeinträchtigte dies die Code-Qualität und wurde am 20. April rückgängig gemacht. Diese Anpassung wirkte sich auf Sonnet 4.6, Opus 4.6 und Opus 4.7 aus.
Nutzerreaktionen und Anthropic's Dementi
Die Probleme führten zu Spekulationen unter Nutzern, dass Anthropic das Tool absichtlich verschlechtert oder "generft" habe, was das Unternehmen entschieden dementierte. Beschwerden wurden auf Plattformen wie GitHub und Reddit laut. Stella Laurenzo, Senior Director der AI-Gruppe des Chipherstellers AMD, schrieb Anfang April auf GitHub, dass "Claude so weit zurückgegangen ist, dass man ihm komplexe Ingenieursaufgaben nicht mehr anvertrauen kann." Auf Reddit bezeichnete ein Nutzer Claude Code als "faul", "ignorant", "degradiert und kurzsichtig".
Einige Nutzer, wie der populäre X-Nutzer @levelsio, fühlten sich nach der Ankündigung von Anthropic bestätigt. @levelsio schrieb: "Ich kann nicht glauben, dass wir Recht hatten! Claude wurde am 4. März verdummt, genau als wir es bemerkten!" Der Nutzer teilte seinen Beitrag vom 4. März erneut, in dem es hieß: "Claude Code mit Opus 4.6 war heute so dumm, dass ich endlich wieder meinen eigenen Code schreiben musste."
Maßnahmen zur Problembehebung und zukünftige Schritte
Anthropic gab bekannt, dass die identifizierten Probleme bis zum 20. April (v2.1.116) behoben wurden. Das Unternehmen hat Schritte unternommen, um ähnliche Probleme in Zukunft zu vermeiden.
Zu den ergriffenen Maßnahmen gehören:
- Ein größerer Anteil der Mitarbeiter nutzt die öffentliche Version von Claude Code.
- Verbesserung des Code-Review-Tools.
- Einführung strengerer Kontrollen für Änderungen an System-Prompts.
Anthropic bedankte sich bei den Nutzern für ihr Feedback und setzte die Nutzungslimits für alle Abonnenten ab Donnerstag zurück.
Auswirkungen auf Abonnenten und weitere Entwicklungen
Zusätzlich zu den Qualitätsproblemen geriet Anthropic in die Kritik, als es bekannt gab, dass es experimentell Claude Code aus dem Pro-Plan, seinem günstigeren kostenpflichtigen Abonnement, entfernen wollte. Das Unternehmen erklärte, es handele sich um einen Test, der etwa 2 % der neuen Nutzer betraf.
Unabhängig von den drei offiziell genannten Problemen, wurde von Nutzern eine weitere Änderung im Cache-Verhalten beobachtet. Ab Anfang April wurde die Standard-Cache-Zeit für Prompts von einer Stunde auf fünf Minuten reduziert, was zu einem erhöhten Token-Verbrauch führte. Diese Änderung wurde nicht offiziell angekündigt, aber in den Sitzungsprotokollen der Nutzer nachgewiesen, wo die Felder "ephemeral_5m_input_tokens" und "ephemeral_1h_input_tokens" den Wechsel belegten.