डेटा वेयरहाउसिंग प्रक्रिया में, डेटा स्टेजिंग क्षेत्र को डेटा स्टेजिंग सर्वर सॉफ़्टवेयर और डेटा स्टोर आर्काइव (रिपॉजिटरी) के निष्कर्षण, परिवर्तन और लोडिंग गतिविधि के परिणामों से एकत्र किया जाता है।
डेटा स्टेजिंग सॉफ़्टवेयर सर्वर अस्थायी रूप से OLTP डेटा स्रोतों से निकाले गए डेटा को सहेजता है और बदलता है और डेटा मार्ट और डेटा वेयरहाउस में लोड करने के लिए डेटा और विशेषताओं को साफ़, रूपांतरित डेटा और अभिलेखीय भंडार स्टोर करता है।
डेटा स्टेजिंग प्रक्रिया या तो स्ट्रीम या फाइलों के रूप में जानकारी आयात करती है, इसे बदल देती है, एकीकृत, साफ डेटा तैयार करती है, और डेटा वेयरहाउस, डेटा मार्ट, या ऑपरेशनल डेटा स्टोर में लोड करने के लिए इसे चरणबद्ध करती है।
एक डेटा स्टेजिंग टूल पहुंच योग्य है, और डेटा डेटाबेस में है। डेटा प्रवाह शुरू होता है ताकि यह स्रोत प्रणाली से बाहर दिखाई दे, परिवर्तन इंजन के माध्यम से और एक स्टेजिंग डेटाबेस में बदल जाए।
दूसरी विधि में, यह मेनफ्रेम लीगेसी सिस्टम से शुरू हो सकता है और फिर मांगे गए रिकॉर्ड को एक फ्लैट फ़ाइल में निकाल सकता है, फ़ाइल को स्टेजिंग सर्वर में बदल सकता है, इसकी सामग्री को रूपांतरित कर सकता है, और परिवर्तित जानकारी को स्टेजिंग डेटाबेस में लोड कर सकता है।
डेटा वेयरहाउस स्टेजिंग क्षेत्र एक अस्थायी क्षेत्र है जहां स्रोत सिस्टम से डेटा पुन:प्रस्तुत किया जाता है। समय के कारणों के लिए डेटा वेयरहाउसिंग आर्किटेक्चर में आमतौर पर एक स्टेजिंग क्षेत्र की आवश्यकता होती है। संक्षेप में, डेटा को डेटा वेयरहाउस में एकीकृत करने से पहले सभी आवश्यक जानकारी उपलब्ध होनी चाहिए।
अलग-अलग व्यावसायिक चक्रों, डेटा प्रोसेसिंग चक्रों, हार्डवेयर और नेटवर्क संसाधन सीमाओं और भौगोलिक तत्वों के कारण, यह एक ही समय में सभी ऑपरेशनल डेटाबेस से सभी जानकारी निकालने के लिए लागू नहीं होता है।
उदाहरण - दैनिक बिक्री डेटा निकालना उचित हो सकता है, लेकिन, दैनिक उद्धरण वित्तीय जानकारी के लिए उपयुक्त नहीं हो सकते हैं जिसके लिए महीने के अंत में सुलह प्रक्रिया की आवश्यकता होती है। इसी तरह, यह सिंगापुर में एक डेटाबेस से "ग्राहक" डेटा को दोपहर पूर्वी मानक समय पर निकालने के लिए उपयुक्त हो सकता है, लेकिन यह शिकागो डेटाबेस में "ग्राहक" डेटा के लिए उपयुक्त नहीं हो सकता है।
डेटा वेयरहाउस में डेटा लगातार हो सकता है (यानी लंबी अवधि के लिए आसपास रहता है) या अस्थायी (यानी केवल अस्थायी रूप से रहता है)। यह सभी व्यवसायों को डेटा वेयरहाउस स्टेजिंग क्षेत्र की आवश्यकता नहीं है। कई व्यवसायों के लिए, परिचालन डेटाबेस से डेटा को सीधे डेटा वेयरहाउस में कॉपी करने के लिए ETL का उपयोग करना उपयुक्त है।
डेटा स्टेजिंग के लाभ और नुकसान
फायदे
-
मंचन प्रक्रिया को परिवर्तन प्रक्रिया के समानांतर नियंत्रित किया जाता है।
-
डिस्क I/O को आधा कर दिया गया है क्योंकि स्टेजिंग टेबल को केवल लिखा जाता है, इसके विपरीत लिखा जाता है, और फिर से निकाला जाता है।
नुकसान
-
यदि परिवर्तन प्रक्रिया में गिरावट आती है, तो मंचन प्रक्रिया भी रुक जाएगी।