Modeles de fallback
Configurez un modele de secours pour que votre agent continue de fonctionner quand le modele principal atteint ses limites ou tombe en panne.
A quoi servent les modeles de fallback
Les providers IA imposent des rate limits sur le nombre de requetes par minute ou par jour. Quand votre modele principal atteint sa limite, l'agent cesse de repondre jusqu'a la reinitialisation. Un modele de fallback lui donne une alternative sur laquelle basculer automatiquement.
Comment ca marche
Quand vous configurez un modele de fallback, le gateway OpenClaw fait ceci :
- Envoie la requete au modele principal.
- Si le principal retourne une erreur de rate limit (429) ou est indisponible (5xx), reessaie avec le modele de fallback.
- Si le fallback echoue aussi, retourne une erreur au chat.
Le basculement est automatique. Une fois le rate limit du modele principal reinitialise, l'agent revient dessus.
Quand les fallbacks sont utiles
Les rate limits sont frequents, surtout sur les plans API d'entree de gamme. Un agent actif peut les epuiser rapidement lors de taches comme la generation de code ou de longues sessions de recherche.
Les providers connaissent aussi des pannes ponctuelles. Un fallback chez un autre provider permet a l'agent de continuer a travailler.
Vous pouvez aussi utiliser les fallbacks pour controler les couts : un modele puissant en principal pour les taches complexes, et un modele moins cher en secours quand le principal est rate-limite. L'agent continue de repondre, juste avec un modele temporairement moins capable.
Configurer les fallbacks
Lors de la creation du bureau
- Cliquez sur New Desktop.
- Configurez votre provider et modele principal.
- Dans la section fallback, selectionnez un provider et modele de secours.
- Creez le bureau.
Sur un bureau existant
- Ouvrez les parametres de votre bureau.
- Ajoutez ou mettez a jour la configuration du modele de fallback.
- Redemarrez le bureau.
Combinaisons recommandees
| Modele principal | Fallback recommande | Raison |
|---|---|---|
| Claude (Anthropic) | GPT-4o (OpenAI) | Provider different, pas de rate limits partages |
| GPT-4o (OpenAI) | Claude Sonnet (Anthropic) | Provider different, bon en code |
| Tout modele premium | Un modele plus petit sur OpenRouter | Fallback economique |
L'essentiel : utilisez un provider different pour votre fallback. Si le principal et le fallback sont chez le meme provider, une panne du provider met les deux hors service.
Verifier l'activite des fallbacks
Consultez les logs de l'agent pour voir si les fallbacks ont ete declenches :
journalctl -u openclaw | grep -i "fallback"
Si les activations sont frequentes, envisagez d'upgrader votre plan API ou de passer a un provider avec des limites plus elevees.
Conseils
- Configurez un fallback si votre agent tourne sans surveillance ou sur des taches longues.
- OpenRouter fonctionne bien comme provider de secours puisqu'une seule cle couvre des centaines de modeles.
- Pour tester votre configuration, utilisez temporairement une cle primaire invalide. L'agent devrait basculer sur le fallback sans interruption.
- Le modele de fallback n'a pas besoin d'etre aussi puissant que le principal. Un modele plus petit vaut mieux que pas de reponse du tout.