Modeles de fallback

Configurez un modele de secours pour que votre agent continue de fonctionner quand le modele principal atteint ses limites ou tombe en panne.

3 min de lecture

A quoi servent les modeles de fallback

Les providers IA imposent des rate limits sur le nombre de requetes par minute ou par jour. Quand votre modele principal atteint sa limite, l'agent cesse de repondre jusqu'a la reinitialisation. Un modele de fallback lui donne une alternative sur laquelle basculer automatiquement.

Comment ca marche

Quand vous configurez un modele de fallback, le gateway OpenClaw fait ceci :

  1. Envoie la requete au modele principal.
  2. Si le principal retourne une erreur de rate limit (429) ou est indisponible (5xx), reessaie avec le modele de fallback.
  3. Si le fallback echoue aussi, retourne une erreur au chat.

Le basculement est automatique. Une fois le rate limit du modele principal reinitialise, l'agent revient dessus.

Quand les fallbacks sont utiles

Les rate limits sont frequents, surtout sur les plans API d'entree de gamme. Un agent actif peut les epuiser rapidement lors de taches comme la generation de code ou de longues sessions de recherche.

Les providers connaissent aussi des pannes ponctuelles. Un fallback chez un autre provider permet a l'agent de continuer a travailler.

Vous pouvez aussi utiliser les fallbacks pour controler les couts : un modele puissant en principal pour les taches complexes, et un modele moins cher en secours quand le principal est rate-limite. L'agent continue de repondre, juste avec un modele temporairement moins capable.

Configurer les fallbacks

Lors de la creation du bureau

  1. Cliquez sur New Desktop.
  2. Configurez votre provider et modele principal.
  3. Dans la section fallback, selectionnez un provider et modele de secours.
  4. Creez le bureau.

Sur un bureau existant

  1. Ouvrez les parametres de votre bureau.
  2. Ajoutez ou mettez a jour la configuration du modele de fallback.
  3. Redemarrez le bureau.

Combinaisons recommandees

Modele principalFallback recommandeRaison
Claude (Anthropic)GPT-4o (OpenAI)Provider different, pas de rate limits partages
GPT-4o (OpenAI)Claude Sonnet (Anthropic)Provider different, bon en code
Tout modele premiumUn modele plus petit sur OpenRouterFallback economique

L'essentiel : utilisez un provider different pour votre fallback. Si le principal et le fallback sont chez le meme provider, une panne du provider met les deux hors service.

Verifier l'activite des fallbacks

Consultez les logs de l'agent pour voir si les fallbacks ont ete declenches :

journalctl -u openclaw | grep -i "fallback"

Si les activations sont frequentes, envisagez d'upgrader votre plan API ou de passer a un provider avec des limites plus elevees.

Conseils

  • Configurez un fallback si votre agent tourne sans surveillance ou sur des taches longues.
  • OpenRouter fonctionne bien comme provider de secours puisqu'une seule cle couvre des centaines de modeles.
  • Pour tester votre configuration, utilisez temporairement une cle primaire invalide. L'agent devrait basculer sur le fallback sans interruption.
  • Le modele de fallback n'a pas besoin d'etre aussi puissant que le principal. Un modele plus petit vaut mieux que pas de reponse du tout.