Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा वेयरहाउस की प्रक्रियाएं क्या हैं?

<घंटा/>

डेटा स्टेजिंग एक प्रमुख प्रक्रिया है जिसमें निम्नलिखित उप-प्रक्रियाएं शामिल हैं जो इस प्रकार हैं -

निकालना - डेटा वेयरहाउस वातावरण में जानकारी प्राप्त करने का पहला चरण निकालने का चरण है। निष्कर्षण स्रोत डेटा को पढ़ने और सीखने को परिभाषित करता है, और अधिक काम के लिए डेटा स्टेजिंग क्षेत्र में आवश्यक तत्वों की प्रतिलिपि बनाना।

रूपांतरण - क्योंकि डेटा को डेटा स्टेजिंग क्षेत्र में निकाला जाता है, इसलिए कई संभावित परिवर्तन प्रक्रियाएं इस प्रकार हैं -

  • यह गलत वर्तनियों को ठीक करके, डोमेन विरोधों को हल करके (एक शहर का नाम जो डाक कोड के साथ असंगत है), लापता डेटा घटकों से निपटने और मानक प्रारूपों में निर्धारित करके डेटा को साफ कर सकता है।

  • इसका उपयोग विरासती रिकॉर्ड से चयनित फ़ील्ड को शुद्ध करने के लिए किया जा सकता है जो डेटा वेयरहाउस के लिए फायदेमंद नहीं हैं।

  • यह डेटा स्रोतों में शामिल हो सकता है, मुख्य मूल्यों पर सटीक रूप से या गैर-कुंजी विशेषताओं पर फ़ज़ी मैचों को लागू करके, जैसे कि विरासती सिस्टम कोड के टेक्स्ट को समान रूप से देखना

  • यह विरासत परिभाषित कुंजियों पर निर्भरता से बचने के लिए प्रत्येक आयाम डेटा के लिए सरोगेट कुंजी बना सकता है, जहां सरोगेट कुंजी पीढ़ी प्रक्रिया आयाम तालिकाओं और तथ्य तालिकाओं के बीच संदर्भात्मक अखंडता को लागू करती है।

  • इसका उपयोग सामान्य प्रश्नों के कार्य को बढ़ावा देने के लिए समुच्चय बनाने के लिए किया जा सकता है।

लोड हो रहा है और अनुक्रमणित किया जा रहा है - परिवर्तन चरण के अंत में, डेटा लोड डेटा छवियों के डिज़ाइन में होता है। डेटा वेयरहाउस वातावरण में लोड करना आम तौर पर आयाम तालिकाओं और तथ्य तालिकाओं को प्रतिबिंबित करने और प्रत्येक प्राप्तकर्ता डेटा मार्ट की आकार लोडिंग सुविधाओं के लिए इन तालिकाओं की विशेषता का रूप लेता है।

गुणवत्ता आश्वासन जांच - जब प्रत्येक डेटा मार्ट को लोड और अनुक्रमित किया गया है और उपयुक्त समुच्चय प्रदान किया गया है, तो विज्ञापन से पहले अंतिम चरण गुणवत्ता आश्वासन कदम है। नए लोड किए गए डेटा के पूरे सेट पर एक व्यापक अपवाद दस्तावेज़ को संचालित करके गुणवत्ता आश्वासन की जाँच की जा सकती है।

सभी रिपोर्टिंग तत्व मौजूद होने चाहिए, और सभी गणना और योग पर्याप्त होने चाहिए। सभी रिपोर्ट किए गए मान उन्हीं मानों के समय अनुक्रम के साथ भरोसेमंद होने चाहिए जो उनका अनुमान लगाते हैं। अपवाद दस्तावेज़ का निर्माण डेटा मार्ट की एंड-यूज़र दस्तावेज़ लेखन सुविधा के साथ किया गया है।

रिलीज़/प्रकाशन - जब प्रत्येक डेटा मार्ट वर्तमान में लोड और गुणवत्ता आश्वासन दिया गया है, तो उपयोगकर्ता समुदाय को सूचित किया जाना चाहिए कि नया रिकॉर्ड तैयार है। प्रकाशन किसी भी परिवर्तन की प्रकृति को भी जोड़ता है जो मूल आयामों और नई मान्यताओं में प्रकट हुए हैं जिन्हें मापा या गणना किए गए तथ्यों में पेश किया गया है।

क्वेरी करना - क्वेरी करना एक व्यापक शब्द है जिसमें डेटा मार्ट से जानकारी का अनुरोध करने की सभी गतिविधियां शामिल हैं, जैसे अंतिम उपयोगकर्ताओं द्वारा तदर्थ क्वेरी करना, दस्तावेज़ लेखन, जटिल निर्णय समर्थन एप्लिकेशन, मॉडल से अनुरोध और परिष्कृत डेटा माइनिंग।


  1. डेटा माइनिंग के घटक क्या हैं?

    डेटा माइनिंग डेटाबेस के मालिक के लिए स्पष्ट और लाभकारी परिणाम प्राप्त करने के लिए पहले अज्ञात नियमितताओं या संबंधों को खोजने के लिए उच्च मात्रा में जानकारी के चयन, अन्वेषण और मॉडलिंग की प्रक्रिया है। डेटा माइनिंग एक अंतःविषय क्षेत्र है, जो डेटाबेस सिस्टम, सांख्यिकी, मशीन लर्निंग, विज़ुअलाइज़ेशन और

  1. डेटा वेयरहाउस में सुरक्षा संबंधी समस्याएं क्या हैं?

    डेटा वेयरहाउसिंग एक दृष्टिकोण है जो आम तौर पर व्यवसाय को महत्वपूर्ण व्यावसायिक अंतर्दृष्टि देने के लिए कई स्रोतों से डेटा एकत्र करने और संभालने के लिए उपयोग किया जाता है। डेटा वेयरहाउस विशेष रूप से प्रबंधन निर्णयों का समर्थन करने के लिए डिज़ाइन किया गया है। सरल शब्दों में, डेटा वेयरहाउस एक डेटाबेस

  1. डेटा वेयरहाउस का डिज़ाइन क्या है?

    डेटा वेयरहाउसिंग एक ऐसा दृष्टिकोण है जो व्यवसाय को एक महत्वपूर्ण व्यावसायिक अंतर्दृष्टि का समर्थन करने के लिए कई स्रोतों से जानकारी एकत्र और प्रबंधित कर सकता है। एक डेटा वेयरहाउस विशेष रूप से समर्थन प्रबंधन निर्णयों के लक्ष्यों के लिए बनाया गया है। एक डेटा वेयरहाउस एक डेटाबेस को परिभाषित करता है जि