Calculateur de disponibilite
Calculez le temps d'indisponibilite autorise par votre SLA, ou trouvez le pourcentage de disponibilite necessaire pour un budget d'indisponibilite specifique.
Qu'est-ce que la disponibilite ?
La disponibilite est le pourcentage de temps pendant lequel un service est operationnel et accessible. C'est la metrique principale utilisee dans les accords de niveau de service (SLA) pour definir les engagements de fiabilite entre les fournisseurs de services et leurs clients.
Quand quelqu'un dit que son service a "99,9% de disponibilite," cela signifie que sur n'importe quelle periode donnee, le service devrait etre indisponible pendant au plus 0,1% de ce temps. Sur un mois de 30 jours, cela represente environ 43 minutes d'indisponibilite autorisee.
La disponibilite est mesuree de l'exterieur, du point de vue de vos utilisateurs, pas de votre infrastructure interne. Un serveur qui pense fonctionner mais ne peut pas traiter les requetes est effectivement en panne.
Comprendre les niveaux de SLA
Chaque "neuf" supplementaire de disponibilite reduit votre temps d'indisponibilite autorise par 10x et necessite generalement une augmentation significative de la complexite et du cout de l'infrastructure.
| SLA | Par jour | Par semaine | Par mois | Par an |
|---|---|---|---|---|
| 99% | 14m 24s | 1h 40m 48s | 7h 18m 18s | 3d 15h 39m 29s |
| 99.5% | 7m 12s | 50m 24s | 3h 39m 8s | 1d 19h 49m 45s |
| 99.9% | 1m 26s | 10m 5s | 43m 50s | 8h 45m 57s |
| 99.95% | 43s | 5m 2s | 21m 55s | 4h 22m 58s |
| 99.99% | 8.6s | 1m 0s | 4m 23s | 52m 36s |
| 99.999% | 0.9s | 6s | 26s | 5m 15s |
Comment ameliorer la disponibilite
Utilisez la surveillance externe
Les health checks internes ne peuvent pas detecter les pannes reseau ou les problemes DNS. Les moniteurs externes verifient depuis l'exterieur de votre infrastructure, de la meme maniere que vos utilisateurs accedent a votre service. Verifiez toutes les 10 a 30 secondes depuis plusieurs regions.
Mettez en place la redondance
Executez au moins deux instances derriere un repartiteur de charge. Utilisez des bases de donnees gerees avec basculement automatique. Chaque point de defaillance unique que vous supprimez vous rapproche du prochain neuf.
Automatisez les deploiements
Les deploiements manuels sont sujets aux erreurs et causent des indisponibilites. Utilisez des deploiements blue-green ou canary pour deployer les changements sans interrompre le service. Automatisez les rollbacks pour les deploiements echoues.
Configurez les alertes et les astreintes
La detection rapide reduit la duree d'indisponibilite. Configurez les alertes avec des politiques d'escalade pour que le bon ingenieur soit alerte immediatement, avec une escalade automatique s'il ne repond pas.
Faites des postmortems
Chaque incident est une opportunite d'apprentissage. Documentez ce qui s'est passe, la cause racine et les actions pour prevenir la recurrence. La meilleure facon d'ameliorer la disponibilite est de ne pas repeter les pannes.
Questions frequemment posees
Comment calcule-t-on le pourcentage de disponibilite ?
Pourcentage de disponibilite = (Temps total - Indisponibilite) / Temps total x 100. Par exemple, un mois de 30 jours a 43 200 minutes. Si votre service etait en panne pendant 43 minutes, disponibilite = (43 200 - 43) / 43 200 x 100 = 99,9%.
Quelle est la difference entre 99,9% et 99,99% de disponibilite ?
99,9% de disponibilite autorise environ 43 minutes d'indisponibilite par mois, tandis que 99,99% n'autorise qu'environ 4 minutes. Le neuf supplementaire reduit votre budget d'indisponibilite par 10x, ce qui necessite generalement un investissement en infrastructure significativement plus important.
La maintenance planifiee compte-t-elle contre la disponibilite ?
Cela depend de la definition de votre SLA. Certains SLA excluent les fenetres de maintenance programmee des calculs de disponibilite, tandis que d'autres comptent toute indisponibilite quelle qu'en soit la cause. Verifiez toujours les termes de votre SLA pour la definition specifique.
Quel SLA devrais-je offrir a mes clients ?
Commencez par mesurer votre disponibilite reelle sur 3 a 6 mois. Votre SLA doit etre atteignable base sur des donnees reelles, pas sur des aspirations. La plupart des services SaaS en production s'engagent sur 99,9% (trois neuf). Ne vous engagez sur 99,99% ou plus que si votre architecture le supporte reellement.
Comment surveiller ma disponibilite reelle ?
Utilisez un service de surveillance externe qui verifie vos endpoints depuis l'exterieur de votre infrastructure a intervalles reguliers (toutes les 10 a 60 secondes). La surveillance interne peut manquer des pannes qui affectent vos utilisateurs, donc les verifications externes depuis plusieurs regions donnent l'image la plus precise.
Connaissez votre disponibilite. Protegez votre SLA.
PulseAPI surveille vos endpoints toutes les 10 secondes et vous alerte des qu'un probleme survient. Pages de statut, gestion d'incidents et astreintes, le tout en un seul endroit.