डेटा स्टेजिंग एक प्रमुख प्रक्रिया है जिसमें निम्नलिखित उप-प्रक्रियाएं शामिल हैं जो इस प्रकार हैं -
निकालना - डेटा वेयरहाउस वातावरण में जानकारी प्राप्त करने का पहला चरण निकालने का चरण है। निष्कर्षण स्रोत डेटा को पढ़ने और सीखने को परिभाषित करता है, और अधिक काम के लिए डेटा स्टेजिंग क्षेत्र में आवश्यक तत्वों की प्रतिलिपि बनाना।
रूपांतरण - क्योंकि डेटा को डेटा स्टेजिंग क्षेत्र में निकाला जाता है, इसलिए कई संभावित परिवर्तन प्रक्रियाएं इस प्रकार हैं -
-
यह गलत वर्तनियों को ठीक करके, डोमेन विरोधों को हल करके (एक शहर का नाम जो डाक कोड के साथ असंगत है), लापता डेटा घटकों से निपटने और मानक प्रारूपों में निर्धारित करके डेटा को साफ कर सकता है।
-
इसका उपयोग विरासती रिकॉर्ड से चयनित फ़ील्ड को शुद्ध करने के लिए किया जा सकता है जो डेटा वेयरहाउस के लिए फायदेमंद नहीं हैं।
-
यह डेटा स्रोतों में शामिल हो सकता है, मुख्य मूल्यों पर सटीक रूप से या गैर-कुंजी विशेषताओं पर फ़ज़ी मैचों को लागू करके, जैसे कि विरासती सिस्टम कोड के टेक्स्ट को समान रूप से देखना
-
यह विरासत परिभाषित कुंजियों पर निर्भरता से बचने के लिए प्रत्येक आयाम डेटा के लिए सरोगेट कुंजी बना सकता है, जहां सरोगेट कुंजी पीढ़ी प्रक्रिया आयाम तालिकाओं और तथ्य तालिकाओं के बीच संदर्भात्मक अखंडता को लागू करती है।
-
इसका उपयोग सामान्य प्रश्नों के कार्य को बढ़ावा देने के लिए समुच्चय बनाने के लिए किया जा सकता है।
लोड हो रहा है और अनुक्रमणित किया जा रहा है - परिवर्तन चरण के अंत में, डेटा लोड डेटा छवियों के डिज़ाइन में होता है। डेटा वेयरहाउस वातावरण में लोड करना आम तौर पर आयाम तालिकाओं और तथ्य तालिकाओं को प्रतिबिंबित करने और प्रत्येक प्राप्तकर्ता डेटा मार्ट की आकार लोडिंग सुविधाओं के लिए इन तालिकाओं की विशेषता का रूप लेता है।
गुणवत्ता आश्वासन जांच - जब प्रत्येक डेटा मार्ट को लोड और अनुक्रमित किया गया है और उपयुक्त समुच्चय प्रदान किया गया है, तो विज्ञापन से पहले अंतिम चरण गुणवत्ता आश्वासन कदम है। नए लोड किए गए डेटा के पूरे सेट पर एक व्यापक अपवाद दस्तावेज़ को संचालित करके गुणवत्ता आश्वासन की जाँच की जा सकती है।
सभी रिपोर्टिंग तत्व मौजूद होने चाहिए, और सभी गणना और योग पर्याप्त होने चाहिए। सभी रिपोर्ट किए गए मान उन्हीं मानों के समय अनुक्रम के साथ भरोसेमंद होने चाहिए जो उनका अनुमान लगाते हैं। अपवाद दस्तावेज़ का निर्माण डेटा मार्ट की एंड-यूज़र दस्तावेज़ लेखन सुविधा के साथ किया गया है।
रिलीज़/प्रकाशन - जब प्रत्येक डेटा मार्ट वर्तमान में लोड और गुणवत्ता आश्वासन दिया गया है, तो उपयोगकर्ता समुदाय को सूचित किया जाना चाहिए कि नया रिकॉर्ड तैयार है। प्रकाशन किसी भी परिवर्तन की प्रकृति को भी जोड़ता है जो मूल आयामों और नई मान्यताओं में प्रकट हुए हैं जिन्हें मापा या गणना किए गए तथ्यों में पेश किया गया है।
क्वेरी करना - क्वेरी करना एक व्यापक शब्द है जिसमें डेटा मार्ट से जानकारी का अनुरोध करने की सभी गतिविधियां शामिल हैं, जैसे अंतिम उपयोगकर्ताओं द्वारा तदर्थ क्वेरी करना, दस्तावेज़ लेखन, जटिल निर्णय समर्थन एप्लिकेशन, मॉडल से अनुरोध और परिष्कृत डेटा माइनिंग।