Apexloop

Claude Fable 5 : pourquoi le prix par token est le chiffre le moins intéressant

Lancement de Claude Fable 5
Image issue de Anthropic.com

Anthropic a annoncé de nouveaux modèles, Claude Fable 5 et Claude Mythos 5. Fable 5 est conçu pour un usage général, Mythos 5 utilise le même modèle sous-jacent avec des contraintes assouplies et reste réservé à des partenaires sélectionnés. Vous pouvez accéder à Fable 5 via l'API Claude sous le nom claude-fable-5, au prix de 10 $ par million de tokens en entrée et 50 $ par million de tokens en sortie.

C'est la partie que tout le monde retient. Mais honnêtement ? Le prix par token est l'élément le moins intéressant de toute l'histoire. Voyons pourquoi.

Ce qu'Anthropic a annoncé

Fable 5 serait nettement plus performant en programmation, en travail analytique, en compréhension d'images, sur les longs contextes et pour les tâches scientifiques. Anthropic évoque des migrations de code à grande échelle, l'analyse de documents et de tableurs, la lecture précise de données dans des graphiques, ainsi que des tâches agentiques longues nécessitant une planification continue.

Le mot clé est « agentique ». Fable 5 n'est pas avant tout un modèle auquel on pose une question pour obtenir une réponse. Il est conçu pour des tâches où le modèle travaille sur plusieurs étapes, maintient son propre plan et progresse vers l'objectif de manière relativement autonome. Et c'est précisément là que notre façon de penser le coût commence à se fissurer.

Une nouvelle tendance : les modèles deviennent plus verbeux

On observe un changement qui ne se lit pas dans un tableau de prix. Les derniers modèles deviennent plus verbeux. Pour résoudre la même tâche, ils prennent plus d'étapes, « réfléchissent » davantage à l'approche et analysent les choses plus en profondeur.

Ce n'est pas un défaut — au contraire. C'est précisément ce qui leur permet de traiter des tâches plus complexes. Mais cela a une conséquence : le même problème qu'un modèle résolvait autrefois en une seule passe peut désormais passer par plusieurs cycles de raisonnement, d'étapes intermédiaires et d'autovérification.

Coût par token vs coût par résultat

Pendant des années, nous nous sommes focalisés sur une seule mesure : combien coûte un million de tokens. C'est comparable, ça paraît objectif et ça rentre parfaitement dans un tableau. Mais cela mesure l'entrée, pas la valeur.

La vraie question n'est pas « combien coûte un token » mais « combien coûte le fait de mener une tâche à son terme ». C'est-à-dire : combien de tokens, combien de tentatives et combien de supervision humaine consomme une chose terminée — un contrat analysé, une migration achevée, un rapport que vous n'avez pas à corriger manuellement.

Dès que vous commencez à calculer ainsi, le classement des modèles par prix au token n'a plus de sens. Un modèle moins cher qui tâtonne peut coûter plus qu'un modèle plus cher qui atteint le résultat du premier coup.

Vous construisez des automatisations et de l'IA sur les données de votre entreprise ?

Dans Apexloop, les données, documents, automatisations et permissions partagent un seul modèle commun — afin que le résultat d'un agent IA puisse être vérifié, audité et mesuré, et pas seulement exécuté.

Ce que cela signifie pour un déploiement en entreprise

Pour les équipes qui construisent des applications internes, des automatisations ou des assistants IA sur les données de l'entreprise, ce changement de mentalité compte plus que quelques dollars dans la grille tarifaire.

L'évolution vers de longues tâches agentiques est séduisante — un modèle qui maintient mieux un plan et un contexte est plus pratique pour des workflows comme l'analyse de contrats, la migration de données, la préparation de rapports ou la revue de bases de données. Mais ce même changement est exactement ce qui augmente la consommation de tokens. Ici, capacité et coût augmentent de concert.

Le conseil pratique n'est donc pas « choisissez le modèle le moins cher », mais :

  1. Définissez ce que signifie un « résultat terminé » pour une tâche donnée, et mesurez les coûts en fonction de cela.
  2. Suivez le taux de réussite au premier essai, pas seulement le prix par token.
  3. Là où une tâche plus simple suffit, ne déployez pas le modèle le plus verbeux. L'objectif n'est pas un raisonnement maximal, mais le raisonnement minimal nécessaire au résultat.

Un détail qui influe aussi sur le résultat

Encore un élément qui entre dans le calcul du « coût par résultat ». Fable 5 est disponible de manière générale, mais Anthropic y a ajouté des classificateurs de sécurité conservateurs. Si une requête entre dans des domaines sensibles — cybersécurité, biologie ou chimie —, la réponse peut être prise en charge par Claude Opus 4.8.

Pour une entreprise, cela signifie que pour une partie des requêtes, le comportement du modèle peut changer. Anthropic indique que cela concerne en moyenne moins de cinq pour cent des sessions, et que les garde-fous saisissent parfois aussi une requête anodine. Si vous construisez un produit sur ce modèle, il vaut la peine d'anticiper cette variabilité — elle aussi fait partie de la question de la fiabilité avec laquelle vous obtenez le résultat attendu.

Ce qu'il faut en retenir

Un modèle plus puissant n'est pas automatiquement une solution complète. Dans un déploiement réel, ce qui continue de décider, c'est le modèle de données, les permissions, l'audit, les tests de sortie et des limites clairement conçues quant à ce que l'agent IA est autorisé à faire de manière autonome.

Mais même la façon de penser le coût mérite une mise à niveau. Un nouveau modèle est une occasion de changer de mentalité : arrêtez de demander ce que coûte un token et commencez à demander ce que coûte un résultat. C'est la mesure qui compte réellement.

Lire l'annonce sur le site d'Anthropic