Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा स्टेजिंग क्या है?

<घंटा/>

डेटा वेयरहाउसिंग प्रक्रिया में, डेटा स्टेजिंग क्षेत्र को डेटा स्टेजिंग सर्वर सॉफ़्टवेयर और डेटा स्टोर आर्काइव (रिपॉजिटरी) के निष्कर्षण, परिवर्तन और लोडिंग गतिविधि के परिणामों से एकत्र किया जाता है।

डेटा स्टेजिंग सॉफ़्टवेयर सर्वर अस्थायी रूप से OLTP डेटा स्रोतों से निकाले गए डेटा को सहेजता है और बदलता है और डेटा मार्ट और डेटा वेयरहाउस में लोड करने के लिए डेटा और विशेषताओं को साफ़, रूपांतरित डेटा और अभिलेखीय भंडार स्टोर करता है।

डेटा स्टेजिंग प्रक्रिया या तो स्ट्रीम या फाइलों के रूप में जानकारी आयात करती है, इसे बदल देती है, एकीकृत, साफ डेटा तैयार करती है, और डेटा वेयरहाउस, डेटा मार्ट, या ऑपरेशनल डेटा स्टोर में लोड करने के लिए इसे चरणबद्ध करती है।

एक डेटा स्टेजिंग टूल पहुंच योग्य है, और डेटा डेटाबेस में है। डेटा प्रवाह शुरू होता है ताकि यह स्रोत प्रणाली से बाहर दिखाई दे, परिवर्तन इंजन के माध्यम से और एक स्टेजिंग डेटाबेस में बदल जाए।

दूसरी विधि में, यह मेनफ्रेम लीगेसी सिस्टम से शुरू हो सकता है और फिर मांगे गए रिकॉर्ड को एक फ्लैट फ़ाइल में निकाल सकता है, फ़ाइल को स्टेजिंग सर्वर में बदल सकता है, इसकी सामग्री को रूपांतरित कर सकता है, और परिवर्तित जानकारी को स्टेजिंग डेटाबेस में लोड कर सकता है।

डेटा वेयरहाउस स्टेजिंग क्षेत्र एक अस्थायी क्षेत्र है जहां स्रोत सिस्टम से डेटा पुन:प्रस्तुत किया जाता है। समय के कारणों के लिए डेटा वेयरहाउसिंग आर्किटेक्चर में आमतौर पर एक स्टेजिंग क्षेत्र की आवश्यकता होती है। संक्षेप में, डेटा को डेटा वेयरहाउस में एकीकृत करने से पहले सभी आवश्यक जानकारी उपलब्ध होनी चाहिए।

अलग-अलग व्यावसायिक चक्रों, डेटा प्रोसेसिंग चक्रों, हार्डवेयर और नेटवर्क संसाधन सीमाओं और भौगोलिक तत्वों के कारण, यह एक ही समय में सभी ऑपरेशनल डेटाबेस से सभी जानकारी निकालने के लिए लागू नहीं होता है।

उदाहरण - दैनिक बिक्री डेटा निकालना उचित हो सकता है, लेकिन, दैनिक उद्धरण वित्तीय जानकारी के लिए उपयुक्त नहीं हो सकते हैं जिसके लिए महीने के अंत में सुलह प्रक्रिया की आवश्यकता होती है। इसी तरह, यह सिंगापुर में एक डेटाबेस से "ग्राहक" डेटा को दोपहर पूर्वी मानक समय पर निकालने के लिए उपयुक्त हो सकता है, लेकिन यह शिकागो डेटाबेस में "ग्राहक" डेटा के लिए उपयुक्त नहीं हो सकता है।

डेटा वेयरहाउस में डेटा लगातार हो सकता है (यानी लंबी अवधि के लिए आसपास रहता है) या अस्थायी (यानी केवल अस्थायी रूप से रहता है)। यह सभी व्यवसायों को डेटा वेयरहाउस स्टेजिंग क्षेत्र की आवश्यकता नहीं है। कई व्यवसायों के लिए, परिचालन डेटाबेस से डेटा को सीधे डेटा वेयरहाउस में कॉपी करने के लिए ETL का उपयोग करना उपयुक्त है।

डेटा स्टेजिंग के लाभ और नुकसान

फायदे

  • मंचन प्रक्रिया को परिवर्तन प्रक्रिया के समानांतर नियंत्रित किया जाता है।

  • डिस्क I/O को आधा कर दिया गया है क्योंकि स्टेजिंग टेबल को केवल लिखा जाता है, इसके विपरीत लिखा जाता है, और फिर से निकाला जाता है।

नुकसान

  • यदि परिवर्तन प्रक्रिया में गिरावट आती है, तो मंचन प्रक्रिया भी रुक जाएगी।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही

  1. सीरियलाइजेशन क्या है?

    हाल ही में एक प्रोजेक्ट अपडेट मीटिंग के दौरान, मेरी टीम ने इस बारे में बात की कि हम इस एप्लिकेशन से डेटा को आगे और पीछे भेजने के लिए क्रमांकन का उपयोग कैसे करने जा रहे हैं। एक इंजीनियर जो सॉफ्टवेयर परियोजनाओं में और अधिक काम करना चाह रहा था, उसने मुझे बताया कि वे इस शब्द से अपरिचित थे। इस तरह की