在线时间计算器
计算您的 SLA 允许多少停机时间,或找出特定停机预算所需的在线时间百分比。
%
每天
1m 26s
每周
10m 5s
每月
43m 50s
每年
8h 45m 58s
什么是在线时间?
在线时间是服务可运行和可访问的时间百分比,是服务级别协议 (SLA) 中定义可靠性承诺的主要指标。
当有人说他们的服务有"99.9% 在线时间"时,意味着在任何给定时间段内,服务预计不可用的时间不超过 0.1%。在 30 天的月份中,这约等于 43 分钟的允许停机时间。
在线时间从外部测量——从用户的角度,而非内部基础设施的角度。
理解 SLA 级别
每增加一个"9"的可用性,允许的停机时间减少 10 倍,通常需要基础设施复杂性和成本的显著增加。
| SLA | 每天 | 每周 | 每月 | 每年 |
|---|---|---|---|---|
| 99% | 14m 24s | 1h 40m 48s | 7h 18m 18s | 3d 15h 39m 29s |
| 99.5% | 7m 12s | 50m 24s | 3h 39m 8s | 1d 19h 49m 45s |
| 99.9% | 1m 26s | 10m 5s | 43m 50s | 8h 45m 57s |
| 99.95% | 43s | 5m 2s | 21m 55s | 4h 22m 58s |
| 99.99% | 8.6s | 1m 0s | 4m 23s | 52m 36s |
| 99.999% | 0.9s | 6s | 26s | 5m 15s |
如何提高在线时间
使用外部监控
内部健康检查无法发现网络级故障或 DNS 问题。外部监控从基础设施外部进行检查。
实施冗余
在负载均衡器后面运行至少两个实例。使用具有自动故障转移的托管数据库。
自动化部署
手动部署容易出错并导致停机。使用蓝绿部署或金丝雀部署来无中断地推出更改。
设置告警和值班
快速检测可减少停机时长。配置带有升级策略的告警。
进行事后分析
每个事件都是学习的机会。记录发生了什么、根本原因以及预防措施。
常见问题
在线时间百分比如何计算?
在线时间百分比 = (总时间 - 停机时间) / 总时间 x 100。30 天的月份有 43,200 分钟。如果停机 43 分钟:(43,200 - 43) / 43,200 x 100 = 99.9%。
99.9% 和 99.99% 在线时间有什么区别?
99.9% 在线时间每月允许约 43 分钟停机,而 99.99% 仅允许约 4 分钟。
计划维护是否计入停机时间?
取决于 SLA 的定义。有些 SLA 排除计划维护窗口,有些则计算所有停机时间。
我应该向客户提供什么 SLA?
首先测量 3-6 个月的实际在线时间。大多数生产 SaaS 服务承诺 99.9%(三个9)。
如何监控实际在线时间?
使用外部监控服务,定期(每 10-60 秒)从基础设施外部检查您的端点。