बड़े पैमाने पर डेटा स्टोर करना आपकी हार्ड ड्राइव पर किसी फाइल को सेव करने जैसा नहीं है। आपकी कंपनी की फाइलों को बनाने वाले सभी बिट्स का ट्रैक रखने के लिए एक सॉफ्टवेयर मैनेजर की आवश्यकता होती है। यहीं से सेफ और ग्लस्टर जैसे वितरित भंडारण प्रबंधन पैकेज लागू होते हैं।
सेफ और ग्लस्टर दोनों सिस्टम वितरित भंडारण के प्रबंधन के लिए उपयोग किए जाते हैं। दोनों को सॉफ्टवेयर-परिभाषित भंडारण माना जाता है, जिसका अर्थ है कि वे बड़े पैमाने पर हार्डवेयर-अज्ञेयवादी हैं। वे बिट्स को व्यवस्थित करते हैं जो आपके डेटा को अपने अंतर्निहित बुनियादी ढांचे का उपयोग करके बनाते हैं, जो कि इस विकल्प को परिभाषित करता है:आप अपने डेटा का समर्थन करने के लिए कौन सा अंतर्निहित ढांचा चाहते हैं?
आपके द्वारा संग्रहीत किए जा रहे डेटा के प्रकार, उस डेटा तक कैसे पहुंचा जाता है, और वह डेटा कहां रहता है, के आधार पर आप यह निर्णय लेना चाहते हैं। Ceph और GlusterFS दोनों ही अच्छे विकल्प हैं, लेकिन उनके आदर्श अनुप्रयोग सूक्ष्म रूप से भिन्न हैं।
असंरचित डेटा के लिए ऑब्जेक्ट-आधारित संग्रहण:Ceph
सेफ एक ऑब्जेक्ट-आधारित सिस्टम है, जिसका अर्थ है कि यह संग्रहीत डेटा को एक फ़ाइल पदानुक्रम के बजाय ऑब्जेक्ट के रूप में प्रबंधित करता है, क्लस्टर में बाइनरी डेटा फैलाता है। इसी तरह की ऑब्जेक्ट स्टोरेज विधियों का उपयोग फेसबुक द्वारा छवियों को संग्रहीत करने के लिए और ड्रॉपबॉक्स द्वारा क्लाइंट फ़ाइलों को संग्रहीत करने के लिए किया जाता है। सामान्य तौर पर, ऑब्जेक्ट स्टोरेज बड़े पैमाने पर असंरचित डेटा का समर्थन करता है, इसलिए यह बड़े पैमाने पर डेटा स्टोरेज के लिए एकदम सही है। सिस्टम को क्लस्टर मॉनिटर, मेटाडेटा सर्वर और जर्नल स्टोरेज के रूप में डेमॉन के नेटवर्क द्वारा बनाए रखा जाता है। ये सिफ को प्रतिस्पर्धा से अधिक सक्षम लेकिन अधिक जटिल बनाने के लिए गठबंधन करते हैं।
असामान्य वस्तु और ब्लॉक-आधारित भंडारण का मतलब है कि सेफ भंडारण के प्रबंधन के लिए अपने स्वयं के उपकरणों का उपयोग करता है। इसके लिए सिस्टम एडमिनिस्ट्रेटर को सेफ के टूल्स से परिचित होना आवश्यक है। सेफ की वास्तविक आंतरिक कार्यप्रणाली को पहली नज़र में समझना मुश्किल हो सकता है। मूल रूप से, आपको यह जानने के लिए तैयार रहने की आवश्यकता है कि यह लाभ प्राप्त करने के लिए कैसे काम करता है। स्व-प्रबंधित, स्व-उपचार प्रणाली समय के साथ चल रहे परिचालन खर्चों को कम कर सकती है, और सेफ उद्योग-मानक सर्वर हार्डवेयर पर चल सकता है।
सिस्टम ब्लॉक स्टोरेज भी बना सकता है, ब्लॉक डिवाइस इमेज तक पहुंच प्रदान करता है जिसे स्ट्रिप किया जा सकता है और क्लस्टर में दोहराया जा सकता है। एप्लिकेशन एक रीस्टफुल इंटरफ़ेस के माध्यम से सेफ ऑब्जेक्ट स्टोरेज तक पहुंच सकते हैं जो अमेज़ॅन एस 3 और ओपनस्टैक स्विफ्ट एपीआई का समर्थन करता है। लक्ष्य उच्च प्रदर्शन, विशाल भंडारण, और लीगेसी कोड के साथ संगतता है।
श्रेणीबद्ध पेड़ों में संग्रहण अवरोधित करें:GlusterFS
GlusterFS, जिसे Gluster के नाम से जाना जाता है, एक अधिक पारंपरिक फ़ाइल स्टोर है। इसे सेट अप करना आसान है, और एक उचित रूप से संकलित बिल्ड का उपयोग किसी भी सिस्टम पर किया जा सकता है जिसमें एक फ़ोल्डर होता है। लचीलापन और उपयोग में आसानी प्रणाली का एक प्रमुख लाभ है। हालांकि यह विशाल क्षमता तक बढ़ सकता है, प्रदर्शन जल्दी से कम हो जाता है। यह बड़े औसत फ़ाइल आकार (4 एमबी से अधिक) और अनुक्रमिक पहुंच के लिए सबसे उपयुक्त है। एक क्लस्टर भौतिक, आभासी और क्लाउड सर्वरों में फैल सकता है, जिससे लचीले भंडारण वर्चुअलाइजेशन की अनुमति मिलती है।
ग्लस्टर ब्लॉक स्टोरेज का उपयोग करता है, जिसका अर्थ है कि डेटा का हिस्सा कनेक्टेड क्लस्टर डिवाइस पर खुले स्थान पर संग्रहीत किया जाता है। फ़ाइल और ब्लॉक-आधारित भंडारण एक फ़ाइल सिस्टम का उपयोग करता है जो पदानुक्रमित पेड़ों में फ़ाइलों को व्यवस्थित करता है। यह एक स्केलेबल समानांतर नेटवर्क फ़ाइल सिस्टम बनाने के लिए ईथरनेट पर भौगोलिक दृष्टि से अलग सर्वरों को एकत्रित करता है। ग्लस्टर अनिवार्य रूप से FUSE और NFS का क्लस्टर-आधारित संस्करण है, जो अधिकांश सिस्टम प्रशासकों के लिए एक परिचित वास्तुकला प्रदान करता है। इसका उद्देश्य सरल, रखरखाव योग्य और व्यापक रूप से उपयोग करने योग्य होना है, लेकिन इसमें पहुंच की गति नहीं है जो कि सेफ सही परिस्थितियों में पेश कर सकता है।
निष्कर्ष
सेफ असंरचित डेटा की तीव्र पहुंच के लिए सबसे उपयुक्त है, जो दुनिया में अधिकांश फाइलों का गठन करता है। क्रमिक डेटा एक्सेस के लिए ग्लस्टर बेहतर है, जैसे स्ट्रीमिंग वीडियो, या ऐसे एप्लिकेशन के लिए जहां गति उतनी महत्वपूर्ण नहीं है, जैसे बैकअप।
आप किस फाइल स्टोरेज सिस्टम का उपयोग कर रहे हैं?