- Sonnet 4.5 unterstützt langlebige Agenten, besseren Code und zuverlässiges Computing mit 64 Ausgabetoken und einer Konzentration von über 30 Stunden.
- Claude führt Code-Updates durch (Checkpoints, Terminal, VS Code), fügt der API Speicher- und Kontextbearbeitung hinzu und startet das Agent SDK.
- Es bietet Fortschritte in der Sicherheit (ASL-3, weniger Fehlalarme, Schutz vor sofortiger Injektion) und schneidet im SWE-Bench und OSWorld gut ab.
- Verfügbar auf Claude.ai, API, Bedrock und Vertex AI, mit Preisen von 3 bis 15 US-Dollar, mit Ersparnissen beim Caching und Batching.

Die Einführung von Claude Sonnet 4.5 hat die KI-Anwendung auf Agenten und Softwareentwicklung auf den Prüfstand gestellt, mit Versprechungen, die von der Selbstständige Programmierung und Computerhandhabung zu greifbaren Fortschritten in der Argumentation und Mathematik. Anthropic präsentiert ihn als sein bisher fähigstes Modell mit einem sehr klaren Ziel: Claude in mehr als nur einen Gesprächsassistenten zu verwandeln und ihn in den Bereich eines „handelnden Agenten“ zu drängen.
Parallel dazu stärkt das Unternehmen sein Ökosystem mit Verbesserungen an Claude Code, neuen Entwicklertools und einer strengeren Sicherheits- und Ausrichtungsebene. Das Angebot ist ambitioniert: das beste Modell für Agenten, Code und Computernutzung, unterstützt durch Metriken wie SWE-bench Verified und OSWorld, zusätzlich zu einer Reihe von Funktionen, die darauf abzielen, langfristige und komplexere Aufgaben zu erleichtern.
Was ist Claude Sonnet 4.5 und was verspricht es?
Anthropic beschreibt Sonnet 4.5 als sein leistungsstärkstes Modell in kritischen Bereichen: Erstellen komplexer Agenten, Generieren und Warten von Code und Steuern des ComputersEs handelt sich nicht nur um ein Etikett; das Unternehmen verspricht deutliche Verbesserungen im logisch-mathematisch-logischen Denken, zwei Säulen, die einen Unterschied machen, wenn Projekte mehrere Schritte und Abhängigkeiten umfassen.
Eines der auffälligsten Merkmale ist die Fähigkeit, komplexe Aufgaben über 30 Stunden am Stück zu bewältigen und dabei die Konzentration ohne direktes Eingreifen aufrechtzuerhalten. In der Praxis bedeutet dies, dass ein Agent beharrlich in langer und koordinierter Arbeit ohne den Faden zu verlieren. Darüber hinaus unterstützt das Modell Ausgaben von bis zu 64.000 Token, was für die detaillierte Planung und die Generierung großer Codeblöcke sehr nützlich ist.
In öffentlichen Benchmarks behauptet Anthropic, dass Sonnet 4.5 im SWE-Bench Verified, einer Bewertung, die die Lösung realer Softwareprobleme misst, auf dem neuesten Stand der Technik ist. Auch in OSWorld schneidet es mit 61,4 % sehr gut ab, was auf erhebliche Fortschritte hindeutet. reale Aufgaben in Desktop-UmgebungenDas Unternehmen selbst vergleicht diese 61,4 % mit den 42,2 %, die Sonnet 4 vor einigen Monaten erreichte – ein Anstieg, der nicht unerheblich ist.
Über die reine Leistung hinaus betont das Haus, dass es sich um sein am besten ausgerichtetes "Grenzmodell" handelt: Besorgniserregende Verhaltensweisen wie übermäßige Schmeichelei, Streben nach Macht oder die Tendenz, wahnhaftes Denken zu unterstützen, und die Abwehr von Prompt-Injection-Angriffen wurde in Computernutzungsszenarien und Agentenfunktionen verstärkt.

Ökosystem-Updates: Claude Code, Apps und Plattform
Sonnet 4.5 enthält ein umfangreiches Produktupdate. Claude Code führt Folgendes ein: Kontrollpunkte, eine der am häufigsten nachgefragten Funktionen: Sie speichern den Fortschritt und ermöglichen die sofortige Rückkehr zu vorherigen Zuständen. Für alle, die mit langen Iterationen entwickeln, reduziert diese Änderung die Reibung und gibt Ihnen die Sicherheit, neue Wege zu erkunden, ohne Angst haben zu müssen, alles zu zerstören.
Hinzu kommt ein Facelift der Terminaloberfläche und die Einführung eines native Erweiterung für Visual Studio Code, mit der Idee, Claude direkt in die IDE zu integrieren, in der die tägliche Routine des Programmierers stattfindet. Ein deutlicher Schub, wenn das Modell eine eher operative und weniger periphere Rolle übernehmen soll.
Auf der API-Seite gibt es zwei Schlüsselelemente: Kontextbearbeitung und ein neues Gedächtnistool zum Speichern und Abrufen von InformationenZusammen ermöglicht dies den Agenten, länger zu arbeiten, veralteten Kontext herauszufiltern und das Wesentliche zugänglich zu halten – unerlässlich, wenn Arbeitsabläufe stundenlang dauern und sich die Anforderungen spontan ändern.
In Claudes Apps gibt es eine weitere wichtige neue Funktion: Codeausführung und Dateierstellung (Dokumente, Tabellen und Präsentationen) innerhalb der Konversation. Dies ermöglicht dem Modell Daten analysieren, Inhalte generieren und materialisieren in Büroformaten, ohne den Chat zu verlassen, und bringt Theorie und Praxis zusammen.
Endlich ist die offizielle Claude Chrome-Erweiterung für Max-Benutzer verfügbar, die sich auf die Warteliste gesetzt haben, und öffnet die Tür zu Automatisieren Sie Browseraufgaben mit weniger Reibung und mehr Zuverlässigkeit.
Claude Agent SDK: Die Bausteine zum Erstellen Ihrer eigenen Agenten
Anthropic zeigt nicht nur, was sein Flaggschiffprodukt kann, sondern bietet auch die Teile an, mit denen andere es nach ihren Wünschen umbauen können. Das neue Claude Agent SDK Es teilt die Infrastruktur, die Claude Code ermöglicht, und ist darauf ausgelegt, schwierige Probleme zu lösen: Speicherverwaltung bei Aufgaben mit langer Ausführungsdauer, Berechtigungssysteme, die Autonomie und Benutzerkontrolle in Einklang bringen, und Koordination zwischen Unteragenten, die auf ein gemeinsames Ziel hinarbeiten.
Der Vorschlag besteht darin, dieses SDK in eine wiederverwendbare Basis umzuwandeln, sodass jedes Team darauf seinen eigenen Agenten aufbauen kann. produktionserprobte WerkzeugeAnthropic behauptet, dass es, obwohl es für Codefälle entwickelt wurde, bei einer Vielzahl von Aufgaben Vorteile bietet.
Forschungsvorschau: „Imagine with Claude“
Zusammen mit Sonnet 4.5 bietet Anthropic ein temporäres Erlebnis namens „Imagine with Claude“. In diesem Experiment wird das Modell generiert Software im laufenden Betrieb ohne vorgegebene Funktionalitäten, die in Echtzeit auf Benutzerinteraktionen reagiert. Im Wesentlichen ist es ein Fenster zu dem, was sich öffnet, wenn Sie ein leistungsfähiges Modell mit der richtigen Infrastruktur kombinieren.
Die Vorschau ist für Max-Abonnenten fünf Tage lang verfügbar und kann unter claude.ai/imagine abgerufen werden. Das Unternehmen präsentiert sie als spielerische und zugleich aufschlussreiche Präsentation von Wie weit kann Sonnet 4.5 gehen? in der Erzeugung und Anpassung.
Sicherheit, Ausrichtung und ASL-3-Niveau
Der Einsatz von Sonnet 4.5 wird durch die Sicherheitsstufe ASL-3 abgedeckt, ein Framework, das Modellfähigkeiten mit entsprechenden SicherheitsvorkehrungenZu den Maßnahmen gehören Klassifikatoren, die potenziell gefährliche Ein- und Ausgänge erkennen sollen, wobei der Schwerpunkt auf CBRN-Bereichen (chemischen, biologischen, radiologischen und nuklearen Gefahren) liegt.
Anthropic räumt ein, dass diese Klassifikatoren manchmal legitime Inhalte kennzeichnen können. Um den Benutzer nicht zu unterbrechen, bietet Anthropic an, das Gespräch mit Sonnet 4 fortzusetzen, das ein geringeres CBRN-Risiko birgt. Seit der ersten Beschreibung dieser Filter haben sie die Anzahl falscher Positivmeldungen um den Faktor zehn und seit der Einführung von Claude Opus 4 im Mai sogar um den Faktor zwei reduziert. Das Versprechen ist, dass die Die Unterscheidbarkeit der Klassifikatoren verbessert sich weiter.
Das Angebot geht über Filter hinaus: Schulungen und Sicherheitsbewertungen umfassen Tests, die vom ersten Mal inspiriert sind mechanistische Interpretierbarkeit, mit dem Ziel, das interne Verhalten des Modells besser zu verstehen und zu kontrollieren. Darüber hinaus wurden die Abwehrmaßnahmen gegen Prompt Injection verstärkt, was insbesondere dann relevant ist, wenn das System im Internet surft, auf virtuellen Desktops arbeitet oder Aktionen ausführt.
Verfügbarkeit, Integration und Preise
Claude Sonnet 4.5 ist ab sofort überall verfügbar. Entwickler können es über die Claude-API verwenden, indem sie das Modell aufrufen. Claude Sonett 4-5Der Preis bleibt derselbe wie bei der vorherigen Generation: 3 USD pro Million Eingabetoken und 15 USD pro Million Ausgabetoken.
Anthropic schafft mit seiner Infrastruktur Kostenvorteile: Bis zu 90 % Ersparnis durch sofortiges Caching und weitere 50 % bei Stapelverarbeitung, Werte, die für hohe Arbeitslasten ausgelegt sind. Endbenutzer können mit Sonnet 4.5 auf Claude.ai (Web, iOS und Android) chatten, und für Unternehmen ist es nativ auf der Claude Developer Platform sowie auf Amazon Bedrock und Google Cloud Vertex AI verfügbar.
Auf der kommerziellen Seite wird ein kostenloser Plan erwähnt mit Sitzungslimit, das alle fünf Stunden zurückgesetzt wird und eine variable Anzahl von Nachrichten auf Anfrage. Und für komplexe Programmieraufgaben fungiert Claude Code als interner Lead Agent.
Empfohlene Anwendungsfälle
Sonnet 4.5 wird als ideales Modell für Agenten präsentiert: Es kann fast sofort reagieren oder einsetzen Schritt-für-Schritt-Denken sichtbar wenn die Aufgabe es erfordert. API-Benutzer steuern präzise, wie lange das Modell „nachdenkt“, und wählen zwischen Geschwindigkeit und Tiefe.
In der Softwareentwicklung deckt es den gesamten Zyklus ab: Planung, Erstellung, Wartung, Fehlerbehebung und größere RefactoringsDer große Ausgabekontext (bis zu 64 Token) erleichtert die Erstellung kohärenter großer Pläne und Codes.
In der Browser- und Desktop-Nutzung ist es führend in seiner Kategorie: Vervollständigt echte Flows von Wettbewerbsanalyse und Einkauf bis hin zum Kunden-Onboarding im Web. Ziel ist es, Genauigkeit und Zuverlässigkeit im Laufe der Zeit weiter zu verbessern.
In der Cybersicherheit können Teams, die Sonnet 4.5 mit Claude Code kombinieren, Agenten einsetzen, die Sicherheitslücken selbstständig beheben bevor sie ausgenutzt werden, wodurch der Schwerpunkt von der reaktiven Erkennung auf die proaktive Abwehr verlagert wird.
Im Finanzwesen befasst sich das Modell mit der Inputanalyse und komplexe VorhersagenBeispielsweise überwacht es globale regulatorische Änderungen und passt Compliance-Systeme proaktiv an, wobei es sich von der manuellen Auditvorbereitung zu einem intelligenten Risikomanagement weiterentwickelt.
In der Geschäftsproduktivität zeichnet er sich durch das Erstellen und Bearbeiten aus Office-Dateien (Dokumente, Blätter, Präsentationen)Und in der Forschung können Sie interne und externe Quellen zurückverfolgen, um Wissen über komplexe Informationslandschaften hinweg zu synthetisieren.
Inhaltlich zeichnet er sich durch ein Gespür für Nuancen und Tonalität aus, wodurch er überzeugendere Texte verfasst und Analyse auf einer tieferen semantischen Ebene, ein wertvoller Punkt für Marketing, technische Dokumentation oder Unternehmenskommunikation.
Leistung und Metriken
Die von Anthropic vorgelegten Daten beziffern Sonnet 4.5 auf 77,2 % in SWE-Bench verifiziert, seine bisher beste Programmierleistung. In OSWorld erreichte es eine Bewertung von 61,4 % und festigte damit seine Position als bestes Computermodell. Diese Kennzahlen werden durch operative Nachweise von Aufgaben begleitet, die über 30 Stunden dauerten, und einer Ausgabekapazität von 64 Token.
Das Unternehmen behauptet, dass Sonnet 4.5 Agenten in stark nachgefragten Sektoren unterstützt, wie zum Beispiel Finanzanalyse, Cybersicherheit und Forschung, koordiniert mehrere Agenten und verarbeitet große Datenmengen mit der Zuverlässigkeit, die diese Domänen erfordern.
Entwicklung der Sonettfamilie und der Platz von 4.5
Um den Sprung zu verstehen, muss man zurückblicken. Sonnet 3.7 führte ein Modell ein von Hybrides Denken was die Kodierung, Inhaltserstellung und Datenanalyse deutlich verbesserte. Danach Sonnet 4 konsolidierte diesen Ansatz mit praktischer Spitzenleistung für Benutzerassistenten und Aufgaben mit hohem Volumen.
Sonnet 4.5 baut auf diesem Weg auf und geht noch einen Schritt weiter: Sein Ziel ist es, die präzisere Option für lange Aufgaben, komplexe Agenten und Computernutzung, mit umfassenderem Fachwissen in den Bereichen Programmierung, Finanzen und Cybersicherheit.
Was echte Fälle und die Community sagen
Anthropic hat gesagt, dass sie Sonnet 4.5 30 Stunden am Stück arbeiten ließen, um ein Slack-ReplikNach Angaben des Unternehmens generierte der Agent ohne Aufsicht 11.000 Zeilen Code und stoppte nach Abschluss der Aufgabe. Im Mai war das Modell Opus 4 rund sieben Stunden lang im Einsatz, die neue Marke vervielfacht diesen Rekord also.
Die Geschichte klingt eindrucksvoll, doch jenseits des Werbematerials tauchen Nuancen auf. Entwickler wie @midudev berichten, dass das Modell ganze Projekte mit einer einzigen Anweisung umgestaltet hat – unter Anwendung von Mustern wie saubere Architektur und Generierung von Hunderten oder Tausenden von Zeilen– aber das Ergebnis funktionierte beim Kompilieren nicht. Andere berichten dasselbe: Code mit tadelloser Struktur und professionellem Erscheinungsbild, obwohl er zur Laufzeit fehlerhaft war.
Es wurde auch darauf hingewiesen, dass Anthropic die angebliche Slack-App nicht von Anfang bis Ende in Betrieb gezeigt hat, sondern gesagt hat, dass es sie erstellt hat. Eine erhebliche Lücke zwischen der Kommunikation und mit überprüfbarem Code demonstrierenDieses Muster ist nicht einzigartig: In der gesamten Branche werden Modelle immer besser darin, Code zu generieren, der gut aussieht, aber ohne erhebliches menschliches Eingreifen gelingt es ihnen dennoch oft nicht, funktionale Lösungen zu produzieren.
Intern erklärt das Unternehmen, dass die Verbesserungen das eigene Team überrascht hätten. Dianne Penn weist darauf hin, dass das Modell dreimal besser mit Computern umgehen könne als die Oktoberversion und dass man seit einem Monat damit arbeite. GitHub und Cursor-FeedbackCanva sagt als Betatester, dass es bei „komplexen, langfristigen Aufgaben“ hilft. Scott White vergleicht es mit der Arbeit auf „Stabschef“-Ebene: Tagesordnungen koordinieren, Daten analysieren und Berichte schreiben.
Zwischen den Zeilen lässt sich klar lesen: Selbst mit einem starken Modell besteht Bedarf virtuelle Maschinen, Speicher- und Kontextverwaltung, Multi-Agent-Unterstützung und Berechtigungssysteme zuverlässigere Agenten in die Produktion zu bringen. Genau diese Lücke sollen das Agent SDK und die neuen Funktionen der Plattform schließen.
Wettbewerb und Marktpositionierung
Die Veröffentlichung von Sonnet 4.5 wird als Teil eines spannenden Kampfes gesehen: OpenAI schreitet mit seiner nächsten Generation voran und Google besteht auf Zwillingen, bewegliche Teile, die uns zwingen, unser Tempo zu beschleunigen. In diesem Zusammenhang sind langfristige Agenten, die direkte Nutzung des Computers und die autonome Programmierung Vektoren, bei denen ein Großteil des Geschäftswerts umstritten ist.
Wer Unternehmen davon überzeugt, dass sie reale Abläufe kontrolliert und zuverlässig automatisieren können, wird Lizenzierung und groß angelegte BereitstellungenAnthropic setzt darauf, dass die Kombination aus einem leistungsstarken Modell und der richtigen Infrastruktur – seiner eigenen – die Lücke zwischen Demonstrationen und nachhaltigem Betrieb schließen wird.
Adoptionsempfehlungen und bewährte Verfahren
Wenn Sie Sonnet 4.5 ernsthaft ausprobieren möchten, bedenken Sie, dass Autonomie nicht umsonst ist. Die Aktionen, die das Modell ausführen kann – Lesen und Ändern von Dateien, Daten verschieben, Befehle ausführen, navigieren – erfordern klare Regeln und Kontrolle. Die Aktivierung von Berechtigungssystemen, die Überwachung von Protokollen und die Festlegung von Schwellenwerten für menschliche Eingriffe sind entscheidend für die Risikominderung.
In Code-Flows helfen Ihnen die Checkpoints und der API-Speicher von Claude Code, sicher zu iterieren. Es ist jedoch eine gute Idee, Automatisieren Sie Test- und Validierungspipelines, und führen Sie das Modell in kontrollierten Phasen ein (von Aufgaben mit geringer Auswirkung bis hin zu kritischen Komponenten), bevor Sie wichtige Verantwortlichkeiten delegieren.
Wo Sie mehr lesen können und wie Sie anfangen können
Anthropic empfiehlt ein Upgrade auf Sonnet 4.5 für alle Anwendungen: Apps, APIs und Claude Code. Es präsentiert das Modell als direkter Ersatz mit besserer Leistung zum gleichen PreisDie neuen Funktionen von Claude Code stehen allen Benutzern zur Verfügung. Die Entwicklerplattform – einschließlich des Agent SDK – steht der gesamten Entwickler-Community zur Verfügung. Die Codeausführung und Dateierstellung in Apps sind in allen kostenpflichtigen Plänen verfügbar.
Für technische Details und Evaluierungsergebnisse verweist das Unternehmen auf seine Systemkarte, Modellseite und Dokumentation, sowie technische Veröffentlichungen und einen Forschungsbeitrag zur Cybersicherheit. Wer mit der Echtzeit-Softwaregenerierung experimentieren möchte, kann für einige Tage auf „Imagine with Claude“ zugreifen.
Diese Ankündigungen zeichnen ein Modell, das die Messlatte für Agenten, Code und Computernutzung höher legt und gleichzeitig Skalierbarkeit, Sicherheit und Entwicklertools verbessert. Es bleibt abzuwarten, inwieweit die Praxis mit der Theorie übereinstimmt, aber es gibt konkrete Anzeichen von Reife und einen konsequenten Plan, um die Lücke zwischen „guten Reden“ und „guten Taten“ zu schließen.
Inhaltsverzeichnis
- Was ist Claude Sonnet 4.5 und was verspricht es?
- Ökosystem-Updates: Claude Code, Apps und Plattform
- Claude Agent SDK: Die Bausteine zum Erstellen Ihrer eigenen Agenten
- Forschungsvorschau: „Imagine with Claude“
- Sicherheit, Ausrichtung und ASL-3-Niveau
- Verfügbarkeit, Integration und Preise
- Empfohlene Anwendungsfälle
- Leistung und Metriken
- Entwicklung der Sonettfamilie und der Platz von 4.5
- Was echte Fälle und die Community sagen
- Wettbewerb und Marktpositionierung
- Adoptionsempfehlungen und bewährte Verfahren
- Wo Sie mehr lesen können und wie Sie anfangen können