डेटा वेयरहाउसिंग एक दृष्टिकोण है जो आम तौर पर व्यवसाय को महत्वपूर्ण व्यावसायिक अंतर्दृष्टि देने के लिए कई स्रोतों से डेटा एकत्र करने और संभालने के लिए उपयोग किया जाता है। डेटा वेयरहाउस विशेष रूप से प्रबंधन निर्णयों का समर्थन करने के लिए डिज़ाइन किया गया है।
सरल शब्दों में, डेटा वेयरहाउस एक डेटाबेस को परिभाषित करता है जिसे किसी संगठन के परिचालन डेटाबेस से स्वतंत्र रूप से बनाए रखा जाता है। डेटा वेयरहाउस सिस्टम कई एप्लिकेशन सिस्टम के एकीकरण को सक्षम बनाता है। वे विश्लेषण के लिए समेकित, ऐतिहासिक जानकारी का एक ठोस मंच प्रदान करके डेटा प्रोसेसिंग प्रदान करते हैं।
डेटा वेयरहाउस बहुआयामी अंतरिक्ष में डेटा को सामान्यीकृत और केंद्रीकृत करते हैं। डेटा वेयरहाउस के निर्माण में डेटा क्लीनिंग, डेटा इंटीग्रेशन और डेटा ट्रांसफ़ॉर्मेशन शामिल हैं और इसे डेटा माइनिंग के लिए एक महत्वपूर्ण प्रीप्रोसेसिंग चरण के रूप में देखा जा सकता है।
यह विभिन्न ग्रैन्युलैरिटी के बहुआयामी डेटा के इंटरैक्टिव विश्लेषण के लिए ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) उपकरण प्रदान करता है, जो प्रभावी डेटा सामान्यीकरण और डेटा खनन की सुविधा प्रदान करता है। एब्स्ट्रैक्शन के विभिन्न स्तरों पर ज्ञान के इंटरेक्टिव माइनिंग का निर्माण करने के लिए एसोसिएशन, वर्गीकरण, भविष्यवाणी और क्लस्टरिंग सहित कई डेटा माइनिंग फंक्शन OLAP ऑपरेशंस के साथ एकीकृत किए जा सकते हैं।
डेटा वेयरहाउस सिस्टम डेटा विश्लेषण और निर्णय लेने के लिए उपयोगकर्ताओं या ज्ञान कार्यकर्ताओं की सेवा करते हैं। इस तरह के सिस्टम कई उपयोगकर्ताओं की विविध आवश्यकताओं को समायोजित करने के लिए एक विशिष्ट संरचना में डेटा का निर्माण और प्रस्तुत कर सकते हैं। इन प्रणालियों को ऑनलाइन-विश्लेषणात्मक प्रसंस्करण (OLAP) सिस्टम के रूप में जाना जाता है।
OLAP एक व्यापक शब्द है जो डेटा वेयरहाउसिंग को भी घेरता है। इस मॉडल में, डेटा को एक प्रारूप में सहेजा जाता है, जो डेटा माइनिंग/दस्तावेजों के प्रभावी निर्माण की अनुमति देता है। OLAP डिज़ाइन को परिचालन प्रभावशीलता में एक छोटे से गिरावट के साथ बड़े रिकॉर्डसेट पर रिपोर्टिंग को समायोजित करना चाहिए।
OLTP संरचना में डेटा संरचना लेने और OLAP संरचना में समान डेटा को प्रभावित करने वाला संपूर्ण शब्द "आयामी मॉडलिंग" है यह डेटा वेयरहाउसिंग का मूल निर्माण खंड है।
एक डेटा वेयरहाउस विभिन्न सुरक्षा स्तरों के अनुसार डेटा को वर्गीकृत और प्रतिबंधित करने के लिए एक बहुस्तरीय सुरक्षा मॉडल को नियोजित कर सकता है, जिसमें उपयोगकर्ताओं को केवल उनके अधिकृत स्तर तक पहुंच की अनुमति होती है। विभिन्न स्तरों पर विभिन्न प्रकार की सुरक्षा होती है -
-
अनुप्रयोग विकास - प्रत्येक प्रक्रिया प्रबंधक के लिए अतिरिक्त सुरक्षा कोड की आवश्यकता हो सकती है।
-
लोड प्रबंधक - इसमें रिकॉर्ड को फ़िल्टर करने और उनकी सामग्री के आधार पर उन्हें विभिन्न स्थानों पर रखने के लिए कोड की जाँच की आवश्यकता हो सकती है। कुछ डेटा छिपाने के लिए संवेदनशील फ़ील्ड को संशोधित करने के लिए अतिरिक्त परिवर्तन नियमों की भी आवश्यकता हो सकती है।
-
गोदाम प्रबंधक - एक कोड बनाने और सुरक्षा को लागू करने के लिए आवश्यक सभी अतिरिक्त विचारों और एकत्रीकरण को बनाए रखने के लिए इसकी आवश्यकता हो सकती है।
-
क्वेरी प्रबंधक - किसी भी एक्सेस प्रतिबंध को संभालने के लिए इसे परिवर्तनों की आवश्यकता होती है। सुरक्षा को लागू करने के लिए आवश्यक अतिरिक्त दृश्य, एकत्रीकरण और तालिकाओं को भी विकसित करने की आवश्यकता होगी।