アップタイム計算ツール

SLAで許容されるダウンタイムを計算するか、特定のダウンタイム予算に必要なアップタイム率を確認できます。

%
1日あたり
1m 26s
1週間あたり
10m 5s
1ヶ月あたり
43m 50s
1年あたり
8h 45m 58s

アップタイムとは?

アップタイムとは、サービスが稼働しアクセス可能な時間の割合です。サービスレベル契約(SLA)で信頼性を定義するための主要な指標です。

「99.9%のアップタイム」とは、任意の期間で0.1%以上の停止がないことを意味します。30日の月では、約43分の許容ダウンタイムに相当します。

アップタイムは外部から測定されます。内部インフラではなく、ユーザーの視点からです。

SLAレベルの理解

可用性の「ナイン」が1つ増えるごとに、許容ダウンタイムは10分の1に減少し、インフラの複雑さとコストが大幅に増加します。

SLA1日1週間1ヶ月1年
99%14m 24s1h 40m 48s7h 18m 18s3d 15h 39m 29s
99.5%7m 12s50m 24s3h 39m 8s1d 19h 49m 45s
99.9%1m 26s10m 5s43m 50s8h 45m 57s
99.95%43s5m 2s21m 55s4h 22m 58s
99.99%8.6s1m 0s4m 23s52m 36s
99.999%0.9s6s26s5m 15s

アップタイムの改善方法

外部監視を使用する

内部ヘルスチェックではネットワークやDNSの障害を検出できません。外部モニターはインフラの外部から確認します。

冗長性を実装する

ロードバランサーの背後で少なくとも2つのインスタンスを実行してください。自動フェイルオーバー付きのマネージドデータベースを使用してください。

デプロイを自動化する

手動デプロイはエラーが起きやすくダウンタイムの原因になります。Blue-GreenやCanaryデプロイを使用してください。

アラートとオンコールを設定する

迅速な検出がダウンタイムを短縮します。エスカレーションポリシー付きのアラートを設定してください。

ポストモーテムを実施する

すべてのインシデントは学習の機会です。何が起きたか、根本原因、再発防止策を文書化してください。

よくある質問

アップタイム率はどのように計算されますか?

アップタイム率 = (合計時間 - ダウンタイム) / 合計時間 x 100。30日の月は43,200分です。43分のダウンタイムの場合: (43,200 - 43) / 43,200 x 100 = 99.9%。

99.9%と99.99%のアップタイムの違いは?

99.9%のアップタイムは月約43分のダウンタイムを許容し、99.99%は約4分のみです。

計画メンテナンスはアップタイムに影響しますか?

SLAの定義によります。計画的なメンテナンスウィンドウを除外するSLAもあれば、すべてのダウンタイムをカウントするSLAもあります。

顧客にどのSLAを提供すべきですか?

まず3-6ヶ月の実際のアップタイムを測定してください。ほとんどの本番SaaSサービスは99.9%(スリーナイン)にコミットしています。

実際のアップタイムをどう監視しますか?

インフラの外部からエンドポイントを定期的(10-60秒間隔)にチェックする外部監視サービスを使用してください。

アップタイムを把握し、SLAを守りましょう。

PulseAPIは10秒ごとにエンドポイントを監視し、問題が発生した瞬間にアラートを送信します。