अपटाइम कैलकुलेटर
गणना करें कि आपका SLA कितना डाउनटाइम अनुमति देता है, या पता करें विशिष्ट डाउनटाइम बजट के लिए कितना अपटाइम प्रतिशत चाहिए।
अपटाइम क्या है?
अपटाइम वो प्रतिशत है जितने समय सेवा चालू और उपलब्ध रहती है। यह सर्विस लेवल एग्रीमेंट (SLAs) में विश्वसनीयता प्रतिबद्धताएं परिभाषित करने के लिए इस्तेमाल होने वाली प्राथमिक मेट्रिक है।
जब कोई कहता है उनकी सेवा "99.9% अपटाइम" है, तो इसका मतलब है कि किसी भी समयावधि में, सेवा 0.1% से ज़्यादा समय अनुपलब्ध नहीं होनी चाहिए। 30 दिन के महीने में, यह लगभग 43 मिनट अनुमत डाउनटाइम है।
अपटाइम बाहरी रूप से मापी जाती है — आपके यूज़र्स के नज़रिए से, आपके आंतरिक इंफ्रास्ट्रक्चर से नहीं। एक सर्वर जो सोचता है कि वो चल रहा है लेकिन अनुरोध पूरे नहीं कर सकता, वास्तव में डाउन है।
SLA स्तर समझें
उपलब्धता का हर अतिरिक्त "नाइन" आपका अनुमत डाउनटाइम 10 गुना कम करता है और आमतौर पर इंफ्रास्ट्रक्चर जटिलता और लागत में बड़ी वृद्धि चाहिए।
| SLA | प्रति दिन | प्रति सप्ताह | प्रति माह | प्रति वर्ष |
|---|---|---|---|---|
| 99% | 14m 24s | 1h 40m 48s | 7h 18m 18s | 3d 15h 39m 29s |
| 99.5% | 7m 12s | 50m 24s | 3h 39m 8s | 1d 19h 49m 45s |
| 99.9% | 1m 26s | 10m 5s | 43m 50s | 8h 45m 57s |
| 99.95% | 43s | 5m 2s | 21m 55s | 4h 22m 58s |
| 99.99% | 8.6s | 1m 0s | 4m 23s | 52m 36s |
| 99.999% | 0.9s | 6s | 26s | 5m 15s |
अपटाइम कैसे सुधारें
एक्सटर्नल मॉनिटरिंग इस्तेमाल करें
आंतरिक हेल्थ चेक नेटवर्क-लेवल फ़ेलियर या DNS समस्याएं पकड़ नहीं सकते। एक्सटर्नल मॉनिटर आपके इंफ्रास्ट्रक्चर के बाहर से चेक करते हैं, उसी तरह जैसे आपके यूज़र्स आपकी सेवा एक्सेस करते हैं। कई क्षेत्रों से हर 10-30 सेकंड पर चेक करें।
रिडंडेंसी लागू करें
लोड बैलेंसर के पीछे कम से कम दो इंस्टेंस चलाएं। ऑटोमैटिक फ़ेलओवर के साथ मैनेज्ड डेटाबेस इस्तेमाल करें। हर सिंगल पॉइंट ऑफ़ फ़ेलियर जो आप हटाते हैं, अगले नाइन के करीब ले जाता है।
डिप्लॉयमेंट ऑटोमेट करें
मैनुअल डिप्लॉय त्रुटि-प्रवण होते हैं और डाउनटाइम पैदा करते हैं। सेवा ऑफ़लाइन किए बिना बदलाव रोल आउट करने के लिए ब्लू-ग्रीन या कैनरी डिप्लॉयमेंट इस्तेमाल करें। विफल डिप्लॉय के लिए रोलबैक ऑटोमेट करें।
अलर्टिंग और ऑन-कॉल सेट करें
तेज़ डिटेक्शन डाउनटाइम अवधि कम करती है। एस्केलेशन पॉलिसी के साथ अलर्ट कॉन्फ़िगर करें ताकि सही इंजीनियर को तुरंत पेज किया जाए, जवाब न देने पर ऑटोमैटिक एस्केलेशन के साथ।
पोस्टमॉर्टम चलाएं
हर इंसिडेंट सीखने का मौका है। दस्तावेज़ करें क्या हुआ, मूल कारण, और दोबारा होने से रोकने के लिए कार्रवाई आइटम। अपटाइम सुधारने का सबसे अच्छा तरीका है विफलताएं दोहराना नहीं।
अक्सर पूछे जाने वाले सवाल
अपटाइम प्रतिशत कैसे गणना होती है?
अपटाइम प्रतिशत = (कुल समय - डाउनटाइम) / कुल समय x 100। उदाहरण के लिए, 30 दिन के महीने में 43,200 मिनट होते हैं। अगर आपकी सेवा 43 मिनट डाउन थी, अपटाइम = (43,200 - 43) / 43,200 x 100 = 99.9%।
99.9% और 99.99% अपटाइम में क्या फ़र्क है?
99.9% अपटाइम प्रति माह लगभग 43 मिनट डाउनटाइम अनुमति देता है, जबकि 99.99% सिर्फ लगभग 4 मिनट। अतिरिक्त नाइन आपका डाउनटाइम बजट 10 गुना कम करता है, जिसके लिए आमतौर पर काफ़ी ज़्यादा इंफ्रास्ट्रक्चर निवेश चाहिए।
क्या योजनाबद्ध मेंटेनेंस अपटाइम के खिलाफ़ गिनी जाती है?
यह आपके SLA की परिभाषा पर निर्भर करता है। कुछ SLAs शेड्यूल्ड मेंटेनेंस विंडो को अपटाइम गणना से बाहर रखते हैं, जबकि कुछ सभी डाउनटाइम गिनते हैं चाहे कारण कुछ भी हो। विशिष्ट परिभाषा के लिए हमेशा अपने SLA शर्तें जांचें।
मुझे अपने ग्राहकों को कौन सा SLA देना चाहिए?
3-6 महीनों में अपना वास्तविक अपटाइम मापकर शुरू करें। आपका SLA वास्तविक डेटा पर आधारित प्राप्त करने योग्य होना चाहिए, महत्वाकांक्षी नहीं। ज़्यादातर प्रोडक्शन SaaS सेवाएं 99.9% (तीन नाइन) प्रतिबद्ध करती हैं। 99.99% या ज़्यादा तभी प्रतिबद्ध करें जब आपका आर्किटेक्चर वास्तव में सपोर्ट करे।
मैं अपना वास्तविक अपटाइम कैसे मॉनिटर करूं?
एक्सटर्नल मॉनिटरिंग सेवा इस्तेमाल करें जो नियमित अंतराल (हर 10-60 सेकंड) पर आपके इंफ्रास्ट्रक्चर के बाहर से endpoints चेक करे। आंतरिक मॉनिटरिंग वो विफलताएं छोड़ सकती है जो यूज़र्स को प्रभावित करती हैं, इसलिए कई क्षेत्रों से एक्सटर्नल चेक सबसे सटीक तस्वीर देते हैं।
अपना अपटाइम जानें। अपना SLA सुरक्षित रखें।
PulseAPI आपके endpoints को हर 10 सेकंड पर मॉनिटर करता है और कुछ गलत होते ही अलर्ट करता है। स्टेटस पेज, इंसिडेंट प्रबंधन, और ऑन-कॉल — सब एक जगह।