Anthropic: Claude Opus 4.7 verbessert Softwareentwicklung, Mythos bleibt geheim

Anthropic: Claude Opus 4.7 verbessert Softwareentwicklung, Mythos bleibt geheim

Aktualisiert:
4 Min. Lesezeit
AI-Generated
Human-verified
Teilen:

Keine Anlageberatung • Nur zu Informationszwecken

Anthropic hat kürzlich Claude Opus 4.7 vorgestellt, ein neues KI-Modell, das signifikante Fortschritte in der Softwareentwicklung und der Bearbeitung komplexer Aufgaben verspricht. Während dieses Modell nun allgemein verfügbar ist, bleibt das noch leistungsfähigere, auf Cybersicherheit spezialisierte Modell Claude Mythos Preview weiterhin nur einem ausgewählten Kreis von Unternehmen zugänglich, was Anthropic's Engagement für eine sichere KI-Entwicklung unterstreicht.

Anthropic stellt Claude Opus 4.7 vor

Das neue KI-Modell Claude Opus 4.7 ist ab sofort allgemein verfügbar und stellt eine bemerkenswerte Verbesserung gegenüber seinem Vorgänger Opus 4.6 dar. Besonders hervorzuheben sind die Fortschritte in der fortgeschrittenen Softwareentwicklung, wo das Modell selbst schwierigste Aufgaben mit hoher Präzision und Konsistenz bewältigt. Nutzer berichten, dass sie nun anspruchsvolle Programmierarbeiten, die zuvor eine enge Überwachung erforderten, mit Zuversicht an Opus 4.7 übergeben können.

Neben der verbesserten Fähigkeit, Anweisungen präzise zu befolgen und reale Arbeitsabläufe zu optimieren, bietet Opus 4.7 auch eine wesentlich bessere Bildverarbeitung mit höherer Auflösung. Es zeigt sich zudem geschmackvoller und kreativer bei professionellen Aufgaben, was zu hochwertigeren Benutzeroberflächen, Präsentationen und Dokumenten führt. Das Modell ist über alle Claude-Produkte, die API sowie über Plattformen wie Amazon Bedrock, Google Cloud’s Vertex AI und Microsoft Foundry zugänglich, wobei die Preise unverändert bei 5 US-Dollar pro Million Input-Tokens und 25 US-Dollar pro Million Output-Tokens liegen.

Gleichzeitig bereitet Anthropic die Einführung eines neuen KI-gestützten Design-Tools vor, das es Nutzern ermöglicht, Websites, Präsentationen und Landing Pages mittels einfacher englischer Prompts zu erstellen. Diese Nachricht führte laut The Information bereits zu einem Rückgang der Aktienkurse von Unternehmen wie Adobe, Wix und Figma. Das Tool zielt sowohl auf Entwickler als auch auf nicht-technische Anwender ab und tritt in Konkurrenz zu Startups wie Gamma und Googles Stitch.

Ein Schritt in Richtung sicherer KI-Entwicklung

Obwohl Claude Opus 4.7 eine deutliche Weiterentwicklung darstellt, ist es laut Anthropic "insgesamt weniger leistungsfähig" als das aktuellste Angebot, Claude Mythos Preview. Diese bewusste Einschränkung ist Teil von Anthropic's Strategie, die seit der Gründung im Jahr 2021 auf eine sichere und verantwortungsvolle Bereitstellung von KI-Modellen abzielt, um sich von Wettbewerbern wie OpenAI abzuheben.

Anthropic hat Opus 4.7 mit integrierten Schutzmechanismen ausgestattet, die Anfragen, die auf verbotene oder hochriskante Cybersicherheitsnutzungen hindeuten, automatisch erkennen und blockieren. Während der Trainingsphase des Modells wurden gezielte Anstrengungen unternommen, um die Cyberfähigkeiten von Opus 4.7 differenziert zu reduzieren. Sicherheitsexperten, die das Modell für legitime Cybersicherheitszwecke wie Schwachstellenforschung, Penetrationstests und Red-Teaming nutzen möchten, sind eingeladen, sich für das neue Cyber Verification Program zu bewerben.

Claude Mythos: Die unzugängliche "Frontier"-KI

Das wahre "Frontier"-Modell von Anthropic bleibt Claude Mythos Preview, ein auf Cybersicherheit spezialisiertes System, das nicht für die allgemeine Öffentlichkeit freigegeben wird. Stattdessen wurde Mythos Preview im Rahmen der Initiative Project Glasswing an ausgewählte Unternehmen verteilt. Ziel ist es, aus diesen realen Einsätzen zu lernen, wie Mythos-Klasse-Modelle zukünftig sicher und in größerem Umfang eingesetzt werden können.

Die Leistungsfähigkeit von Mythos ist beeindruckend: Das UK's AI Security Institute bewertete Mythos Preview und stellte fest, dass es in der Lage ist, hochentwickelte Cyberangriffe autonom auszuführen, und zwar in einem Maße, das kein anderes Modell bisher erreicht hat. Es war die erste KI, die "The Last Ones" erfolgreich absolvierte, eine 32-stufige Unternehmensnetzwerk-Angriffssimulation, die menschliche Red Teams normalerweise 20 Stunden kostet. Mythos meisterte diese in drei von zehn Versuchen und erreichte durchschnittlich 22 von 32 Schritten, während Opus 4.6 lediglich 16 Schritte schaffte. Die Einführung von Project Glasswing hat bereits zu hochrangigen Treffen zwischen Mitgliedern der Trump-Administration, Tech-CEOs und Bank-CEOs geführt, um die Sicherheitsrisiken leistungsstarker KI-Modelle zu diskutieren.

Herausforderungen bei der KI-Messung und Anthropic's Strategie

Die Branche steht weiterhin vor der Herausforderung, KI-Verbesserungen zuverlässig zu messen, da Benchmarks oft umstritten sind, aber dennoch als Leistungsnachweise dienen. Beispielsweise bezeichnete OpenAI einen führenden Coding-Benchmark kürzlich als "kontaminiert". In einer separaten ARC-AGI-3-Evaluierung erreichten Gemini 0,37 % und GPT-5.4 0,26 %, während Menschen 100 % erzielten. Dies erschwert die Einordnung von Leistungssteigerungen wie denen von Opus 4.7, solange keine detaillierten Modellkarten veröffentlicht werden.

Die Beziehung zwischen Opus und Mythos ist enger als oft angenommen: Anthropic entwickelt seine "Frontier"-Modelle, indem es auf der Opus-Linie aufbaut und diese verfeinert. Opus 4.7 dient somit als Grundlage, die später zu den Cybersicherheitsfähigkeiten von Mythos weiterentwickelt wird. Anthropic's Bestrebungen konzentrieren sich zunehmend auf Entwicklungs- und Unternehmensanwendungen, was sich in der Veröffentlichung von Fähigkeiten-Systemen und dem Fokus auf agentische KI zeigt. Dies deutet auf einen breiteren Wandel von einem reinen LLM-Anbieter hin zu einem "Full-Stack AI Studio"-Modell, bei dem Claude nicht nur Text generiert, sondern komplette Produkte entwickelt und bereitstellt. Frühe Tester von Opus 4.7, darunter eine Finanztechnologieplattform, loben das Modell für seine Fähigkeit, logische Fehler in der Planungsphase zu erkennen und die Ausführung zu beschleunigen, was als "bahnbrechend" für die schnellere Bereitstellung vertrauenswürdiger Finanzlösungen beschrieben wird.