निष्कर्षण विधि स्रोत नियम पर और लक्ष्य डेटा वेयरहाउस वातावरण में व्यावसायिक आवश्यकता पर भी अत्यधिक निर्भर है। निकाली जाने वाली जानकारी का अनुमानित थोक और ईटीएल प्रक्रिया में चरण (मूल भार या अभिलेखों का संरक्षण) तार्किक और भौतिक दृष्टिकोण से निकालने के तरीके के निर्धारण को भी मजबूर कर सकता है। लॉजिकल एक्सट्रैक्शन मेथड्स और फिजिकल एक्सट्रैक्शन मेथड्स सहित निष्कर्षण के दो प्रकार के तरीके हैं।
तार्किक निष्कर्षण के तरीके
लॉजिकल एक्सट्रैक्शन दो प्रकार के होते हैं जो इस प्रकार हैं -
-
पूर्ण निष्कर्षण - डेटा पूरी तरह से सोर्स सिस्टम से निकाला जाता है। चूंकि यह निष्कर्षण स्रोत सिस्टम पर सीधे पहुंच योग्य सभी डेटा का अनुसरण करता है, इसलिए अंतिम सफल निष्कर्षण के कारण डेटा स्रोत में परिवर्तनों का ट्रैक रखने की कोई आवश्यकता नहीं है।
स्रोत जानकारी का समर्थन किया जाएगा और स्रोत साइट पर कोई अतिरिक्त तार्किक डेटा (जैसे टाइमस्टैम्प) आवश्यक नहीं है। पूर्ण निष्कर्षण का एक उदाहरण एक विशिष्ट तालिका का निर्यात दस्तावेज़ या संपूर्ण स्रोत तालिका को स्कैन करने वाला दूरस्थ SQL कथन हो सकता है।
-
वृद्धिशील निष्कर्षण - ऐसा डेटा है जो अतीत में एक स्पष्ट घटना के कारण बदल गया है जिसे निकाला जाएगा। यह घटना निष्कर्षण का अंतिम समय या अधिक जटिल व्यावसायिक घटना हो सकती है जैसे किसी वित्तीय अवधि का अंतिम बुकिंग दिन।
यह इस डेल्टा परिवर्तन को पहचान सकता है, इस निश्चित समय की घटना के कारण सभी परिवर्तित डेटा को पहचानने की संभावना होनी चाहिए। इस डेटा को स्रोत डेटा द्वारा समर्थित किया जा सकता है, जिसमें एक सॉफ़्टवेयर कॉलम शामिल है, जो अंतिम-बदले गए टाइमस्टैम्प को दर्शाता है, या एक बदलती तालिका जहां एक उपयुक्त अतिरिक्त संरचना बढ़ते लेनदेन के अलावा परिवर्तनों का निशान रखती है। सामान्य मामलों में, बाद की तकनीकों का उपयोग स्रोत सिस्टम में निष्कर्षण तर्क डालने को परिभाषित करता है।
भौतिक निष्कर्षण के तरीके
यह चुनी हुई तार्किक निष्कर्षण विधि और स्रोत पक्ष पर क्षमता और शर्तों पर आधारित है, निकाली गई जानकारी को दो संरचनाओं द्वारा भौतिक रूप से निकाला जा सकता है। जानकारी को स्रोत प्रणाली या ऑफ़लाइन तंत्र से ऑनलाइन निकाला जा सकता है। ऐसा ऑफ़लाइन तंत्र पहले से ही हो सकता है या इसे निष्कर्षण दिनचर्या द्वारा बनाया जा सकता है।
भौतिक निष्कर्षण के निम्नलिखित तरीके इस प्रकार हैं -
-
ऑनलाइन निष्कर्षण - डेटा ठीक स्रोत सिस्टम से ही निकाला जाता है। निष्कर्षण प्रक्रिया को सीधे स्रोत सिस्टम से जोड़ा जा सकता है ताकि स्रोत तालिकाओं को स्वयं या एक मध्य सिस्टम से जोड़ा जा सके जो जानकारी को पूर्व-कॉन्फ़िगर किए गए पहलू (उदाहरण के लिए, स्नैपशॉट लॉग या शिफ्ट टेबल) में सहेजता है।
-
ऑफ़लाइन निष्कर्षण - डेटा को स्रोत प्रणाली से सटीक रूप से नहीं निकाला जाता है, लेकिन विशेष रूप से प्रारंभिक स्रोत प्रणाली के बाहर निष्पादित किया जाता है। डेटा में एक वर्तमान आर्किटेक्चर है (उदाहरण के लिए, लॉग को फिर से करें, संग्रह लॉग, या मोबाइल टेबलस्पेस) या एक निष्कर्षण दिनचर्या द्वारा उत्पन्न किया गया था।