<पी>
<पी> अप्रैल 19, 2026, 10:00 पूर्वाह्न EDT पर प्रकाशित <पी> तकनीकी प्रकाशन में अफाम का अनुभव 2018 का है, जब उन्होंने मेक टेक ईज़ीयर के लिए काम किया था। इन वर्षों में, उन्होंने विंडोज़, लिनक्स और ओपन सोर्स टूल्स को कवर करते हुए उच्च-गुणवत्ता वाले गाइड, समीक्षा, टिप्स और व्याख्याकार लेख प्रकाशित करने के लिए प्रतिष्ठा बनाई है। उनके काम को शीर्ष वेबसाइटों पर प्रदर्शित किया गया है, जिनमें टेक्निकल उस्ताद, विंडोज रिपोर्ट, गाइडिंग टेक, अल्फा और नेक्स्ट ऑफ विंडोज शामिल हैं। <पी> उनके पास कंप्यूटर साइंस में प्रथम डिग्री है और वे डेटा गोपनीयता और सुरक्षा के प्रबल समर्थक हैं, उन्होंने फ़ूज़ो टेक यूट्यूब चैनल पर इस विषय पर कई युक्तियां, वीडियो और ट्यूटोरियल प्रकाशित किए हैं। <पी> जब वह काम नहीं कर रहा होता है, तो वह अपने परिवार के साथ समय बिताना, साइकिल चलाना या अपने बगीचे की देखभाल करना पसंद करता है। पी> <पी> मुझे इसकी स्थिरता के लिए लिनक्स का उपयोग करना पसंद आया है। हालाँकि, मेरा होम सर्वर, जो 24/7 चलता है, इसे अपनी सीमा तक धकेलता हुआ प्रतीत होता है, और मैंने इसे कुछ सबसे खराब क्षणों में हैंग होते देखा है। कभी-कभी, मुझे हस्तक्षेप करना पड़ता है और मैन्युअल रीबूट करना पड़ता है ताकि मेरा रिमोट बॉक्स ऑनलाइन वापस आ जाए। <पी> यदि यह एक ऐसा परिदृश्य है जिसका आप सामना कर रहे हैं, तो लिनक्स में एक अंतर्निहित प्रणाली है जो इस प्रकार की स्थितियों के लिए बिल्कुल उपयुक्त है। इसे सिस्टमडी की सेवा पुनर्प्राप्ति के साथ संयोजित करने से मुझे एक कुशल दो-परत क्रैश पुनर्प्राप्ति तंत्र मिलता है जिसमें भौतिक हस्तक्षेप की आवश्यकता नहीं होती है। <पी>
संबंधित लिनक्स में पहले से ही एक अंतर्निहित पुनर्प्राप्ति तंत्र है
वॉचडॉग टाइमर जो आपके सिस्टम की सुरक्षा करता है
<पी> लिनक्स में वॉचडॉग नामक एक अंतर्निहित सुविधा है, जो इस सिद्धांत पर काम करती है कि सिस्टम नियमित रूप से सिग्नल भेजता है जो दिखाता है कि यह अभी भी सक्रिय है। जिस क्षण इसे सिस्टम से सिग्नल नहीं मिलता है, वॉचडॉग मान लेता है कि कोई समस्या है और रिबूट शुरू हो जाता है। यह सुविधा लिनक्स पर 1990 के दशक के मध्य से ही मौजूद है और इसका उपयोग मुख्य रूप से उन प्रणालियों पर किया गया है जहां अपटाइम पर समझौता नहीं किया जा सकता है, जैसे सर्वर और एम्बेडेड सिस्टम। <पी> कुछ प्रणालियों पर, वॉचडॉग को /dev/watchDog के माध्यम से उजागर किया जाता है डिवाइस फ़ाइल, जबकि अन्य पर, यह /dev/watchDog0 हो सकती है . काउंटडाउन टाइमर को रीसेट करने के लिए एक प्रक्रिया को इस फ़ाइल में लिखना होगा। यदि प्रक्रिया लिखना बंद कर देती है, तो इसका आम तौर पर मतलब है कि सिस्टम रुक गया है या संसाधनों का एक भगोड़ा प्रक्रिया द्वारा उपभोग किया गया है। ऐसे मामले में, टाइमर समाप्त हो जाता है, और इस तरह रीबूट ट्रिगर हो जाता है। <पी> वॉचडॉग दो प्रकार के होते हैं:हार्डवेयर और सॉफ्टवेयर (सॉफ्टडॉग)। पहला मदरबोर्ड पर एक हार्डवेयर तंत्र हो सकता है। यह हमेशा सिस्टम रीसेट करने में सक्षम है, यहां तक कि ऐसे समय में जब कर्नेल पूरी तरह से लॉक हो गया हो। अगला सॉफ़्टवेयर संस्करण है जो कर्नेल के अंदर चलता है और इसके लिए किसी अतिरिक्त हार्डवेयर की आवश्यकता नहीं होती है। हालाँकि, कर्नेल क्रैश होने पर यह संस्करण आपको नहीं बचाता है। <थ> <पी> टाइप करें थ> <थ> <पी> समर्पित हार्डवेयर की आवश्यकता है थ> <थ> <पी> एक कठिन कर्नेल क्रैश से बच जाता है थ> <थ> <पी> के लिए सबसे उपयुक्त थ> <पी> हार्डवेयर निगरानीकर्ता <पी> हाँ <पी> हाँ <पी> सर्वर, हमेशा सक्रिय महत्वपूर्ण प्रणालियाँ <पी> सॉफ्टवेयर (सॉफ्टडॉग) <पी> नहीं <पी> नहीं <पी> होम सर्वर, वीएम, सामान्य प्रयोजन रिगपी> <पी> सॉफ़्टवेयर वॉचडॉग सामान्य फ़्रीज़ के लिए बहुत अच्छा है, जिसका सामना अधिकांश सेटअप करते हैं, जैसे लोड स्पाइक्स, मेमोरी थकावट और रनवे प्रक्रियाएँ। हालाँकि, यह सुविधा डिफ़ॉल्ट रूप से अक्षम है, और इसे गलत कॉन्फ़िगर करने से अनावश्यक और बार-बार सिस्टम रीबूट हो सकता है। जैसा कि कहा गया है, यह मेरी पसंदीदा छिपी हुई Linux सुविधाओं में से एक बन गई है। मिनटों में स्वचालित क्रैश पुनर्प्राप्ति सेट करना
एक व्यावहारिक निगरानी सेटअप जो वास्तव में काम करता है
<पी> सॉफ्टडॉग पहले से ही लगभग सभी लिनक्स डिस्ट्रोज़ पर काम करता है, इसलिए आपको नए हार्डवेयर की आवश्यकता नहीं है। आपका प्रारंभिक बिंदु इस कमांड के साथ मॉड्यूल लोड कर रहा है: sudo modprobe softdog
<पी> यह सुनिश्चित करने के लिए कि रिबूट के बाद सॉफ्टडॉग बना रहता है, फ़ाइल को /etc/modules पर खोलें (डेबियन/उबंटू), सॉफ्टडॉग को उसकी अपनी लाइन में जोड़ें, और उसे सहेजें। अब वॉचडॉग डेमॉन इंस्टॉल करें और इसे नीचे दिए गए कमांड से सक्षम करें: sudo apt install watchdog
sudo systemctl enable --now watchdog
<पी> यह हो जाने के बाद, /etc/watchDog.conf खोलने का समय आ गया है और कुछ महत्वपूर्ण सेटिंग्स पर ध्यान केंद्रित करें: <थ> <पी> सेटिंग थ> <थ> <पी> यह क्या नियंत्रित करता है थ> <थ> <पी> व्यावहारिक प्रारंभिक बिंदु थ> <पी> अंतराल <पी> सिस्टम कितनी बार जाँच करता है <पी> 10 सेकंड <पी> अधिकतम-लोड-1 <पी> रिबूट से पहले औसत सीलिंग लोड करें <पी> ~6× सीपीयू कोर गिनतीपी> <पी> मिन-मेमोरी <पी> रिबूट से पहले फ्री मेमोरी फ्लोर <पी> ~512 पृष्ठ (~2एमबी)पी> <पी> अधिकतम-लोड-1 के लिए लोड औसत एक मिनट है। यह मान उन प्रक्रियाओं की संख्या को दर्शाता है जो आपके डिवाइस पर CPU समय के लिए सक्रिय रूप से प्रतिस्पर्धा करती हैं। इसका तात्पर्य यह है कि यदि 4-कोर मशीन का भार 4.0 है, तो प्रत्येक कोर पूरी तरह से भरा हुआ है। अपने कोर काउंट का 6 गुना उपयोग करना अधिक सुरक्षित है ताकि आपके सिस्टम में विस्फोट के लिए हेडरूम हो, जो लॉकअप से पहले वैध हो सकता है। <पी> साथ ही, ध्यान रखें कि न्यूनतम-मेमोरी मेमोरी पेजों में निर्दिष्ट होती है, मेगाबाइट्स में नहीं। x86_64 सिस्टम पर एक पेज आमतौर पर 4KiB का होता है। इस हिसाब से, 512 पेज लगभग 2MB मुफ्त मेमोरी होगी। <पी> एक बार जब आप ये कॉन्फ़िगरेशन पूरा कर लें, तो systemctl स्टेटस वॉचडॉग कमांड चलाएँ यह सत्यापित करने के लिए कि डेमॉन चल रहा है, और कमांड journalctl -u watchDog आपको इसकी गतिविधि की समीक्षा करने की अनुमति देता है। <पी> वॉचडॉग सेवा को रोकने से रिबूट ट्रिगर नहीं होगा - डेमॉन बाहर निकलने पर /dev/watchDog को सफाई से बंद कर देता है, जो टाइमर को सुरक्षित रूप से निष्क्रिय कर देता है। वास्तव में यह जांचने के लिए कि वॉचडॉग आपके सिस्टम को रीबूट करेगा, आपको वास्तविक विफलता की स्थिति का अनुकरण करने की आवश्यकता है, जैसे कि निरंतर लोड स्पाइक। हर क्रैश को रीबूट की आवश्यकता नहीं है
systemd को टूटी हुई सेवाओं को सेकंडों में ठीक करने दें
<पी> ऐसी कई विफलताएँ हैं जिन्हें सिस्टमडी सेकंडों में संभाल सकता है जिसके लिए सिस्टम को रीबूट करने की आवश्यकता नहीं होती है। एक उदाहरण ऐसी सेवा हो सकती है जो क्रैश हो जाती है, अप्रत्याशित रूप से बंद हो जाती है, या प्रत्युत्तर देना बंद कर देती है। आप जांच लागू कर सकते हैं ताकि मूल इकाई को छुए बिना हर चीज रीबूट न हो। सेवा का नाम जोड़कर नीचे कमांड चलाएँ: sudo systemctl edit
<पी> फिर निम्नलिखित जोड़ें: [Service]
Restart=on-failure
RestartSec=5
<पी> Restart=on-failure सुनिश्चित करता है कि पुनरारंभ तभी होता है जब सेवा एक त्रुटि कोड के साथ बाहर निकलती है, और RestartSec=5 रैपिड-फायर पुनरारंभ लूप को रोकने के लिए वास्तविक पुनरारंभ से पहले थोड़ी देरी होती है। <पी> StartLimitIntervalSec का संयोजन और StartLimitBurst किसी टूटी हुई सेवा को अनिश्चित काल तक पुनः प्रारंभ होने से रोकेगा। वे क्रैश लूप को रोकने के लिए आवश्यक हैं, लेकिन केवल सिस्टमडी के भीतर चलने वाली सेवाओं के लिए काम करते हैं। पुनर्प्राप्ति की दो परतें जो लगभग हर विफलता को कवर करती हैं
<पी> न तो वॉचडॉग और न ही सिस्टमडी सेवा प्रबंधन अपने आप में पूर्ण है। हालाँकि, एक साथ उपयोग किए जाने पर, वे लगभग किसी भी चीज़ को संभाल सकते हैं। <थ> <पी> विफलता प्रकार थ> <थ> <पी> पुनर्प्राप्ति परत थ> <थ> <पी> अपेक्षित परिणाम थ> <पी> सेवा एक त्रुटि के साथ बाहर निकलती है <पी> systemd (पुनः आरंभ=विफलता पर) <पी> कुछ ही सेकंड में सेवा पुनः प्रारंभ हो जाती है <पी> सेवा साफ़-साफ़ निकलती है लेकिन ऐसा नहीं होना चाहिए <पी> systemd (पुनरारंभ=हमेशा) <पी> कुछ ही सेकंड में सेवा पुनः प्रारंभ हो जाती है <पी> पूर्ण सिस्टम फ़्रीज़ या लोड सर्पिल <पी> वॉचडॉग डेमन <पी> स्वचालित रीबूट, कोई मैन्युअल कदम नहीं <पी> सिस्टमडी व्यक्तिगत सेवा विफलताओं को पकड़ने और पुनः आरंभ करने के लिए उपयुक्त है, और वॉचडॉग पूरे सिस्टम पर नजर रखने के लिए इसके ऊपर बैठता है और सिस्टमडी की सीमा से परे कुछ गलत होने पर पुनरारंभ को ट्रिगर करता है। <पी> इस संयोजन का मतलब है कि हर बार कुछ गलत होने पर आपको उपलब्ध रहने की ज़रूरत नहीं है, और यह सर्वर प्रबंधन को अधिक सुखद उपक्रम बनाता है। इसके अलावा, विशिष्ट लिनक्स कमांड सीखने पर विचार करें जो आपको अधिकांश सिस्टम समस्याओं को ठीक करने में मदद करते हैं।