Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा वेयरहाउस में निष्कर्षण के विभिन्न तरीके क्या हैं?

<घंटा/>

निष्कर्षण विधि स्रोत नियम पर और लक्ष्य डेटा वेयरहाउस वातावरण में व्यावसायिक आवश्यकता पर भी अत्यधिक निर्भर है। निकाली जाने वाली जानकारी का अनुमानित थोक और ईटीएल प्रक्रिया में चरण (मूल भार या अभिलेखों का संरक्षण) तार्किक और भौतिक दृष्टिकोण से निकालने के तरीके के निर्धारण को भी मजबूर कर सकता है। लॉजिकल एक्सट्रैक्शन मेथड्स और फिजिकल एक्सट्रैक्शन मेथड्स सहित निष्कर्षण के दो प्रकार के तरीके हैं।

तार्किक निष्कर्षण के तरीके

लॉजिकल एक्सट्रैक्शन दो प्रकार के होते हैं जो इस प्रकार हैं -

  • पूर्ण निष्कर्षण - डेटा पूरी तरह से सोर्स सिस्टम से निकाला जाता है। चूंकि यह निष्कर्षण स्रोत सिस्टम पर सीधे पहुंच योग्य सभी डेटा का अनुसरण करता है, इसलिए अंतिम सफल निष्कर्षण के कारण डेटा स्रोत में परिवर्तनों का ट्रैक रखने की कोई आवश्यकता नहीं है।

    स्रोत जानकारी का समर्थन किया जाएगा और स्रोत साइट पर कोई अतिरिक्त तार्किक डेटा (जैसे टाइमस्टैम्प) आवश्यक नहीं है। पूर्ण निष्कर्षण का एक उदाहरण एक विशिष्ट तालिका का निर्यात दस्तावेज़ या संपूर्ण स्रोत तालिका को स्कैन करने वाला दूरस्थ SQL कथन हो सकता है।

  • वृद्धिशील निष्कर्षण - ऐसा डेटा है जो अतीत में एक स्पष्ट घटना के कारण बदल गया है जिसे निकाला जाएगा। यह घटना निष्कर्षण का अंतिम समय या अधिक जटिल व्यावसायिक घटना हो सकती है जैसे किसी वित्तीय अवधि का अंतिम बुकिंग दिन।

    यह इस डेल्टा परिवर्तन को पहचान सकता है, इस निश्चित समय की घटना के कारण सभी परिवर्तित डेटा को पहचानने की संभावना होनी चाहिए। इस डेटा को स्रोत डेटा द्वारा समर्थित किया जा सकता है, जिसमें एक सॉफ़्टवेयर कॉलम शामिल है, जो अंतिम-बदले गए टाइमस्टैम्प को दर्शाता है, या एक बदलती तालिका जहां एक उपयुक्त अतिरिक्त संरचना बढ़ते लेनदेन के अलावा परिवर्तनों का निशान रखती है। सामान्य मामलों में, बाद की तकनीकों का उपयोग स्रोत सिस्टम में निष्कर्षण तर्क डालने को परिभाषित करता है।

भौतिक निष्कर्षण के तरीके

यह चुनी हुई तार्किक निष्कर्षण विधि और स्रोत पक्ष पर क्षमता और शर्तों पर आधारित है, निकाली गई जानकारी को दो संरचनाओं द्वारा भौतिक रूप से निकाला जा सकता है। जानकारी को स्रोत प्रणाली या ऑफ़लाइन तंत्र से ऑनलाइन निकाला जा सकता है। ऐसा ऑफ़लाइन तंत्र पहले से ही हो सकता है या इसे निष्कर्षण दिनचर्या द्वारा बनाया जा सकता है।

भौतिक निष्कर्षण के निम्नलिखित तरीके इस प्रकार हैं -

  • ऑनलाइन निष्कर्षण - डेटा ठीक स्रोत सिस्टम से ही निकाला जाता है। निष्कर्षण प्रक्रिया को सीधे स्रोत सिस्टम से जोड़ा जा सकता है ताकि स्रोत तालिकाओं को स्वयं या एक मध्य सिस्टम से जोड़ा जा सके जो जानकारी को पूर्व-कॉन्फ़िगर किए गए पहलू (उदाहरण के लिए, स्नैपशॉट लॉग या शिफ्ट टेबल) में सहेजता है।

  • ऑफ़लाइन निष्कर्षण - डेटा को स्रोत प्रणाली से सटीक रूप से नहीं निकाला जाता है, लेकिन विशेष रूप से प्रारंभिक स्रोत प्रणाली के बाहर निष्पादित किया जाता है। डेटा में एक वर्तमान आर्किटेक्चर है (उदाहरण के लिए, लॉग को फिर से करें, संग्रह लॉग, या मोबाइल टेबलस्पेस) या एक निष्कर्षण दिनचर्या द्वारा उत्पन्न किया गया था।


  1. डेटा वेयरहाउस में बैकअप और रिकवरी की रणनीति क्या है?

    बैकअप और पुनर्प्राप्ति एक हानि की विधि में रिकॉर्ड का बैकअप लेने की प्रक्रिया को परिभाषित करता है और सिस्टम स्थापित करता है जो डेटा हानि के कारण डेटा पुनर्प्राप्ति को सक्षम करता है। डेटा का बैकअप लेने के लिए कंप्यूटर की जानकारी को कॉपी और संग्रहीत करना आवश्यक है, ताकि यह डेटा हटाने या भ्रष्टाचार के

  1. डेटा माइनिंग गोपनीयता-संरक्षण के तरीके क्या हैं?

    गोपनीयता-संरक्षण डेटा माइनिंग डेटा माइनिंग में गोपनीयता सुरक्षा के जवाब में डेटा माइनिंग अनुसंधान का एक अनुप्रयोग है। इसे प्राइवेसी-एन्हांस्ड या प्राइवेसी-सेंसिटिव डेटा माइनिंग कहा जाता है। यह बुनियादी संवेदनशील डेटा मूल्यों का खुलासा किए बिना सही डेटा माइनिंग परिणाम प्राप्त करने से संबंधित है। अधि

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।