
Anthropic hat die neuen Modelle Claude Fable 5 und Claude Mythos 5 angekündigt. Fable 5 ist für den allgemeinen Einsatz gedacht, Mythos 5 nutzt dasselbe zugrunde liegende Modell mit gelockerten Beschränkungen und bleibt nur ausgewählten Partnern vorbehalten. Fable 5 erreichen Sie über die Claude API als claude-fable-5 für 10 $ pro Million Input-Token und 50 $ pro Million Output-Token.
Das ist der Teil, den jeder liest. Aber ehrlich gesagt: Der Preis pro Token ist der uninteressanteste Teil der ganzen Geschichte. Schauen wir uns an, warum.
Was Anthropic angekündigt hat
Fable 5 soll deutlich stärker bei Programmierung, analytischer Arbeit, Bildverständnis, langem Kontext und wissenschaftlichen Aufgaben sein. Anthropic nennt groß angelegte Code-Migrationen, Dokument- und Tabellenanalyse, präzises Auslesen von Daten aus Diagrammen und lange agentische Aufgaben, die laufende Planung erfordern.
Das Schlüsselwort ist „agentisch". Fable 5 ist nicht primär ein Modell, dem man eine Frage stellt und eine Antwort bekommt. Es ist für Aufgaben gebaut, bei denen das Modell über mehrere Schritte arbeitet, einen eigenen Plan verfolgt und relativ autonom auf das Ziel zusteuert. Und genau hier beginnt die Art, wie wir über Kosten denken, zu zerbrechen.
Ein neuer Trend: Modelle werden gesprächiger
Wir beobachten eine Verschiebung, die sich nicht aus einer Preistabelle ablesen lässt. Die neuesten Modelle werden gesprächiger. Um dieselbe Aufgabe zu lösen, brauchen sie mehr Schritte, „durchdenken" sie den Ansatz stärker und analysieren Dinge tiefer.
Das ist kein Mangel – im Gegenteil. Genau das ermöglicht es ihnen, komplexere Aufgaben zu bewältigen. Aber es hat eine Folge: Dasselbe Problem, das ein Modell früher in einem einzigen Durchgang löste, kann jetzt mehrere Runden von Schlussfolgerungen, Zwischenschritten und Selbstprüfungen durchlaufen.
Kosten pro Token vs. Kosten pro Ergebnis
Jahrelang waren wir auf eine Kennzahl fixiert: Was kostet eine Million Token. Das ist vergleichbar, wirkt objektiv und passt ordentlich in eine Tabelle. Aber es misst den Input, nicht den Wert.
Die eigentliche Frage ist nicht „was kostet ein Token", sondern „was kostet es, eine Aufgabe zum Abschluss zu bringen". Also: Wie viele Token, wie viele Versuche und wie viel menschliche Aufsicht verbraucht ein fertiges Ergebnis – ein analysierter Vertrag, eine abgeschlossene Migration, ein Bericht, den Sie nicht manuell korrigieren müssen.
Sobald Sie so zu rechnen beginnen, verliert die Modellrangliste nach Preis pro Token ihren Sinn. Ein günstigeres Modell, das umherirrt, kann mehr kosten als ein teureres Modell, das das Ergebnis sofort trifft.
Bauen Sie Automatisierungen und KI auf Unternehmensdaten?
In Apexloop teilen sich Daten, Dokumente, Automatisierungen und Berechtigungen ein gemeinsames Modell – sodass die Ausgabe eines KI-Agenten geprüft, auditiert und gemessen werden kann, nicht nur ausgeführt.
Was das für den Unternehmenseinsatz bedeutet
Für Teams, die interne Anwendungen, Automatisierungen oder KI-Assistenten auf Unternehmensdaten aufbauen, ist diese Verschiebung im Denken wichtiger als ein paar Dollar in der Preisliste.
Der Trend zu langen agentischen Aufgaben ist verlockend – ein Modell, das einen Plan und Kontext besser verfolgt, ist praktischer für Workflows wie Vertragsanalyse, Datenmigration, Berichtserstellung oder Datenbankprüfung. Aber genau diese Verschiebung ist es, die den Token-Verbrauch erhöht. Leistungsfähigkeit und Kosten steigen hier gemeinsam.
Der praktische Rat lautet daher nicht „wählen Sie das günstigste Modell", sondern:
- Definieren Sie, was ein „abgeschlossenes Ergebnis" für eine bestimmte Aufgabe bedeutet, und messen Sie die Kosten daran.
- Verfolgen Sie die Erfolgsrate beim ersten Versuch, nicht nur den Preis pro Token.
Wo eine einfachere Aufgabe ausreicht, setzen Sie nicht das gesprächigste Modell ein. Das Ziel ist nicht maximales Schlussfolgern, sondern das minimale Schlussfolgern, das für das Ergebnis nötig ist.
Ein Detail, das das Ergebnis ebenfalls beeinflusst
Noch etwas, das in die Rechnung „Kosten pro Ergebnis" einfließt. Fable 5 ist allgemein verfügbar, aber Anthropic hat zusätzlich konservative Sicherheitsklassifikatoren eingebaut. Fällt eine Anfrage in sensible Bereiche – Cybersicherheit, Biologie oder Chemie –, kann die Antwort von Claude Opus 4.8 übernommen werden.
Für ein Unternehmen bedeutet das, dass sich bei einem Teil der Anfragen das Modellverhalten ändern kann. Anthropic gibt an, dass dies im Durchschnitt weniger als fünf Prozent der Sitzungen betrifft und dass die Schutzmaßnahmen manchmal auch eine harmlose Anfrage erfassen. Wenn Sie ein Produkt auf diesem Modell aufbauen, lohnt es sich, diese Variabilität einzukalkulieren – auch sie gehört zur Frage, wie verlässlich Sie das erwartete Ergebnis erhalten.
Was mitzunehmen ist
Ein stärkeres Modell ist nicht automatisch eine vollständige Lösung. Im realen Einsatz entscheiden weiterhin das Datenmodell, Berechtigungen, Audit, Output-Tests und klar gestaltete Grenzen dafür, was der KI-Agent autonom tun darf.
Aber auch das Denken über Kosten verdient ein Upgrade. Ein neues Modell ist eine Gelegenheit, die Denkweise zu wechseln: Fragen Sie nicht mehr, was ein Token kostet, sondern was ein Ergebnis kostet. Das ist die Kennzahl, die wirklich zählt.