डेटा वेयरहाउसिंग एक ऐसी तकनीक है जिसका उपयोग मुख्य रूप से व्यवसाय को एक सार्थक व्यावसायिक अंतर्दृष्टि देने के लिए विभिन्न स्रोतों से डेटा एकत्र करने और प्रबंधित करने के लिए किया जाता है। डेटा वेयरहाउस विशेष रूप से प्रबंधन निर्णयों का समर्थन करने के लिए डिज़ाइन किया गया है।
सरल शब्दों में, डेटा वेयरहाउस एक डेटाबेस को परिभाषित करता है जिसे किसी संगठन के परिचालन डेटाबेस से स्वतंत्र रूप से बनाए रखा जाता है। डेटा वेयरहाउस सिस्टम कई एप्लिकेशन सिस्टम के एकीकरण को सक्षम बनाता है। वे विश्लेषण के लिए समेकित, ऐतिहासिक जानकारी का एक ठोस मंच प्रदान करके डेटा प्रोसेसिंग प्रदान करते हैं।
डेटा वेयरहाउस बहुआयामी अंतरिक्ष में डेटा को सामान्यीकृत और केंद्रीकृत करते हैं। डेटा वेयरहाउस के निर्माण में डेटा क्लीनिंग, डेटा इंटीग्रेशन और डेटा ट्रांसफ़ॉर्मेशन शामिल हैं और इसे डेटा माइनिंग के लिए एक महत्वपूर्ण प्रीप्रोसेसिंग चरण के रूप में देखा जा सकता है।
यह विभिन्न ग्रैन्युलैरिटी के बहुआयामी डेटा के इंटरैक्टिव विश्लेषण के लिए ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) उपकरण प्रदान करता है, जो प्रभावी डेटा सामान्यीकरण और डेटा खनन की सुविधा प्रदान करता है। एब्स्ट्रैक्शन के विभिन्न स्तरों पर ज्ञान के इंटरेक्टिव माइनिंग का निर्माण करने के लिए एसोसिएशन, वर्गीकरण, भविष्यवाणी और क्लस्टरिंग सहित कई डेटा माइनिंग फंक्शन OLAP ऑपरेशंस के साथ एकीकृत किए जा सकते हैं।
डेटा वेयरहाउस के तीन मुख्य प्रकार हैं जो इस प्रकार हैं -
एंटरप्राइज़ डेटा वेयरहाउस (EDW) - एंटरप्राइज डेटा वेयरहाउस एक केंद्रीकृत वेयरहाउस है। इसका उपयोग डेटा को व्यवस्थित और प्रतिनिधित्व करने के लिए किया जाता है। EDW की मदद से उपयोगकर्ता विषय के आधार पर डेटा को वर्गीकृत कर सकता है।
ऑपरेशनल डेटा स्टोर - ऑपरेशनल डेटा स्टोर में, डेटा वेयरहाउस रीयल-टाइम में रीफ़्रेश किया जाता है। इस प्रकार, यह आम तौर पर नियमित गतिविधियों के लिए उपयोग किया जाता है जिसमें अभिलेखों को संग्रहित करना आदि शामिल हैं।
डेटा मार्ट - डेटा मार्ट को डेटा वेयरहाउस के सबसेट के रूप में परिभाषित किया जा सकता है। इसे बिक्री, वित्त आदि के लिए डिज़ाइन किया गया है।
डेटा वेयरहाउस की विशेषताएं
डेटा वेयरहाउस की विभिन्न विशेषताएं हैं जो इस प्रकार हैं -
-
विषय-उन्मुख - डेटा वेयरहाउस निर्णय लेने वालों के लिए सूचना के मॉडलिंग और विश्लेषण को लक्षित करता है। इस प्रकार, डेटा वेयरहाउस आम तौर पर निर्णय समर्थन प्रक्रिया में लाभकारी नहीं होने वाली जानकारी को छोड़कर विशिष्ट विषय मुद्दों का एक सरल और संक्षिप्त दृश्य प्रदान करते हैं।
-
एकीकृत - चूंकि डेटा वेयरहाउस आमतौर पर कई विषम स्रोतों, जैसे रिलेशनल डेटाबेस, फ्लैट फाइल और ऑनलाइन लेनदेन रिकॉर्ड को एकीकृत करके बनाया जाता है, डेटा सफाई और डेटा एकीकरण तकनीकों का उपयोग नामकरण सम्मेलनों, एन्कोडिंग तंत्र, विशेषता उपायों में स्थिरता प्रदान करने के लिए किया जाना चाहिए। , आदि.
-
समय-भिन्न - डेटा को ऐतिहासिक परिप्रेक्ष्य से डेटा प्रदान करने के लिए सहेजा जाता है (उदा., पिछले 5-10 वर्ष)। डेटा वेयरहाउस में प्रत्येक प्रमुख तंत्र में समय का एक तत्व निहित या स्पष्ट रूप से शामिल होता है।
-
गैर-वाष्पशील - डेटा वेयरहाउस हमेशा परिचालन वातावरण में पाए जाने वाले सॉफ़्टवेयर डेटा से रूपांतरित डेटा का एक भौतिक रूप से स्वतंत्र स्टोर होता है। इस अलगाव के कारण, डेटा वेयरहाउस को लेनदेन प्रसंस्करण, पुनर्प्राप्ति और समवर्ती नियंत्रण संरचना की आवश्यकता नहीं होती है। डेटा एक्सेस करने में आमतौर पर इसे केवल दो ऑपरेशन की आवश्यकता होती है - डेटा की प्रारंभिक लोडिंग और डेटा की एक्सेस।