बिग डेटा के संदर्भ में हम जानते हैं कि यह बड़ी मात्रा में डेटा और उसके निष्पादन से संबंधित है। तो संक्षेप में हम कह सकते हैं कि बिग डेटा एक ऐसी चीज है जो बड़ी मात्रा में डेटा से संबंधित है और चूंकि डेटा की मात्रा इतनी बड़ी है तो मोटे तौर पर तीन श्रेणियां हैं जिन्हें इस आधार पर परिभाषित किया जाता है कि डेटा कैसे व्यवस्थित किया जाता है जो कि संरचित हैं, अर्ध संरचित और असंरचित डेटा।
अब डेटा को व्यवस्थित करने के स्तर के आधार पर हम इन तीनों प्रकार के डेटा के बीच कुछ और अंतरों का पता लगा सकते हैं जो इस प्रकार हैं।
संरचना और संघ के बीच महत्वपूर्ण अंतर निम्नलिखित हैं।
Sr. नहीं. | कुंजी | संरचित डेटा | अर्ध संरचित डेटा | असंरचित डेटा |
---|---|---|---|---|
1 | आयोजन का स्तर | संरचित डेटा जैसा कि नाम से पता चलता है कि इस प्रकार का डेटा अच्छी तरह से व्यवस्थित है और इसलिए इस प्रकार के डेटा में आयोजन का स्तर उच्चतम है। | दूसरी ओर अर्ध संरचित डेटा के मामले में डेटा केवल कुछ हद तक व्यवस्थित होता है और बाकी गैर-संगठित होता है इसलिए आयोजन का स्तर संरचित डेटा से कम और असंरचित डेटा से अधिक होता है। | अंत में असंरचित डेटा के मामले में डेटा पूरी तरह से असंगठित है और इसलिए असंरचित डेटा के मामले में आयोजन का स्तर सबसे कम है। |
2 | डेटा संगठन के साधन | संरचित डेटा रिलेशनल डेटाबेस के माध्यम से व्यवस्थित किया जाता है। | जबकि अर्ध संरचित डेटा के मामले में आंशिक रूप से XML/RDF के माध्यम से व्यवस्थित किया जाता है। | दूसरी ओर असंरचित डेटा के मामले में डेटा साधारण वर्ण और बाइनरी डेटा पर आधारित होता है। |
3 | लेन-देन प्रबंधन | संरचित डेटा प्रबंधन में और डेटा की संगामिति मौजूद है और इसलिए इसे बहु-कार्य प्रक्रिया में प्राथमिकता दी जाती है। | अर्द्ध संरचित डेटा में लेन-देन डिफ़ॉल्ट रूप से नहीं होता है, लेकिन DBMS से अनुकूलित हो जाता है लेकिन डेटा समवर्ती मौजूद नहीं होता है। | जबकि असंरचित डेटा में कोई लेन-देन प्रबंधन और कोई संगामिति मौजूद नहीं है। |
4 | वर्शनिंग | जैसा कि परिभाषा में बताया गया है कि स्ट्रक्चर्ड डेटा रिलेशनल डेटाबेस में सपोर्ट करता है इसलिए वर्जनिंग टुपल्स, रो और टेबल पर भी की जाती है। | दूसरी ओर, सेमी स्ट्रक्चर्ड डेटा वर्जनिंग केवल वहीं की जाती है, जहां टुपल्स या ग्राफ संभव है क्योंकि सेमी स्ट्रक्चर्ड डेटा के मामले में आंशिक डेटाबेस समर्थित है। | असंरचित डेटा के मामले में संस्करण केवल संपूर्ण डेटा के रूप में संभव है क्योंकि डेटाबेस का कोई समर्थन नहीं है। |
5 | लचीला और स्केलेबल | चूंकि स्ट्रक्चर्ड डेटा रिलेशनल डेटाबेस पर आधारित होता है, इसलिए यह स्कीमा पर निर्भर और कम लचीला होने के साथ-साथ कम स्केलेबल भी हो जाता है। | जबकि अर्ध संरचित डेटा डेटा संरचित डेटा की तुलना में अधिक लचीला है लेकिन असंरचित डेटा की तुलना में कम लचीला और स्केलेबल है। | चूंकि किसी भी डेटाबेस पर कोई निर्भरता नहीं है, इसलिए संरचित और अर्ध संरचित डेटा की तुलना में असंरचित डेटा अधिक लचीला और स्केलेबल है। |
6 | प्रदर्शन | संरचना डेटा में हम संरचित क्वेरी कर सकते हैं जो जटिल जुड़ने की अनुमति देती है और इस प्रकार अर्ध संरचित और असंरचित डेटा की तुलना में प्रदर्शन उच्चतम है। | दूसरी ओर, अर्ध-संरचित डेटा के मामले में केवल अनाम नोड्स पर क्वेरी करना संभव है, इसलिए इसका प्रदर्शन संरचित डेटा की तुलना में कम है, लेकिन असंरचित डेटा से अधिक है | जबकि असंरचित डेटा के मामले में केवल टेक्स्ट क्वेरी संभव है, इसलिए प्रदर्शन संरचित और अर्ध संरचित डेटा दोनों की तुलना में कम है। |