Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा वेयरहाउस के कार्यान्वयन क्या हैं?

<घंटा/>

डेटा वेयरहाउस में बड़ी मात्रा में डेटा होता है। OLAP सर्वर मांग करते हैं कि निर्णय समर्थन प्रश्नों को सेकंड के क्रम में स्वीकार किया जाए। इस प्रकार, डेटा वेयरहाउस सिस्टम के लिए अत्यधिक प्रभावी क्यूब कंप्यूटेशन तकनीक, एक्सेस तकनीक और क्वेरी प्रोसेसिंग तकनीक प्रदान करना आवश्यक है।

डेटा क्यूब्स की कुशल गणना

बहुआयामी डेटा विश्लेषण के मूल में आयामों के कई सेटों में एकत्रीकरण की कुशल गणना है। SQL शब्दों में, इन एकत्रीकरणों को समूह-दर के रूप में संदर्भित किया जाता है। प्रत्येक समूह-दर को एक घनाभ द्वारा दर्शाया जा सकता है, जहाँ समूह-दर का समूह एक डेटा घन को परिभाषित करने वाले घनाभों की एक जाली बनाता है।

बेस क्यूबॉइड दिए गए डेटा क्यूब के भौतिककरण के लिए तीन विकल्प हैं -

  • कोई भौतिककरण नहीं - यह किसी भी "नॉनबेस" क्यूबॉइड का प्रीकंप्यूट नहीं करता है। इससे महंगे बहुआयामी समुच्चय की गणना तुरंत हो जाती है, जो बेहद धीमी गति से हो सकती है।

  • पूर्ण भौतिकीकरण - यह सभी घनाभों की पूर्व-गणना कर सकता है। गणना किए गए घनाभों की परिणामी जाली को पूर्ण घन के रूप में परिभाषित किया गया है। इस विकल्प के लिए आम तौर पर सभी पूर्व-संगणित घनाभों को संग्रहीत करने के लिए बड़ी मात्रा में स्मृति स्थान की आवश्यकता होती है।

  • आंशिक भौतिककरण - यह संभावित घनाभों के पूरे सेट के एक उचित उपसमुच्चय की चुनिंदा गणना कर सकता है। वैकल्पिक रूप से, यह क्यूब के एक सबसेट की गणना कर सकता है, जिसमें केवल वे सेल शामिल हैं जो कुछ उपयोगकर्ता-निर्दिष्ट मानदंड को पूरा करते हैं, जिसमें प्रत्येक सेल की टपल गिनती कुछ सीमा का पालन कर रही है।

OLAP डेटा अनुक्रमणित करना

यह कुशल डेटा एक्सेसिंग का समर्थन कर सकता है, कुछ डेटा वेयरहाउस सिस्टम इंडेक्स संरचनाएं और भौतिक दृश्य (क्यूबोइड्स का उपयोग करके) प्रदान करते हैं। बिटमैप अनुक्रमण दृष्टिकोण OLAP उत्पादों में प्रसिद्ध है क्योंकि यह डेटा क्यूब्स में तेजी से खोज करने में सक्षम बनाता है। बिटमैप इंडेक्स रिकॉर्ड आईडी (आरआईडी) सूची का एक वैकल्पिक प्रतिनिधित्व है।

किसी दी गई विशेषता के लिए बिटमैप अनुक्रमणिका में, विशेषता के डोमेन में प्रत्येक मान v के लिए एक विशिष्ट बिट वेक्टर, Bv होता है। यदि किसी दी गई विशेषता के डोमेन में n मान शामिल हैं, तो बिटमैप इंडेक्स में प्रत्येक प्रविष्टि के लिए n बिट्स की आवश्यकता होती है (यानी, n बिट वैक्टर हैं)। यदि डेटा तालिका में दी गई पंक्ति के लिए विशेषता का मान v है, तो उस मान को परिभाषित करने वाला बिट बिटमैप इंडेक्स की संबंधित पंक्ति में 1 पर सेट होता है। उस पंक्ति के अन्य सभी बिट 0 पर सेट हैं।

OLAP प्रश्नों का कुशल संसाधन

क्यूबॉइड्स को मूर्त रूप देने और OLAP इंडेक्स संरचनाओं के निर्माण का लक्ष्य डेटा क्यूब में क्वेरी प्रोसेसिंग को तेज करना है।

  • निर्धारित करें कि उपलब्ध घनाभों पर कौन-से ऑपरेशन किए जाने चाहिए - इसमें कुछ चयन, प्रक्षेपण, रोल-अप (समूह-दर), और ड्रिल-डाउन संचालन को संबंधित SQL और/या OLAP संचालन में क्वेरी में दर्शाया गया है। उदाहरण के लिए, डेटा क्यूब को काटना और काटना एक भौतिक घनाभ पर चयन और प्रक्षेपण संचालन के अनुरूप हो सकता है।

  • निर्धारित करें कि किस भौतिक घनाभ (घनभों) पर प्रासंगिक संचालन लागू किया जाना चाहिए - इसमें कुछ भौतिक घनाभों की पहचान करना शामिल है जिनका उपयोग संभावित रूप से प्रश्न का उत्तर देने के लिए किया जा सकता है, घनाभों के बीच "प्रभुत्व" संबंधों के ज्ञान का उपयोग करते हुए निम्नलिखित सेट की छंटाई करना, शेष भौतिक घनाभों के उपयोग के मूल्यों का अनुमान लगाना और न्यूनतम लागत के साथ घनाभ का चयन करना शामिल है।


  1. एसवीएम की विशेषताएं क्या हैं?

    एक वर्गीकरण दृष्टिकोण जिसे काफी जांच मिली है वह है सपोर्ट वेक्टर मशीन (एसवीएम)। इस दृष्टिकोण की जड़ें सांख्यिकीय सीखने के सिद्धांत में हैं और हस्तलिखित अंकों की पहचान से लेकर पाठ वर्गीकरण तक, कई व्यावहारिक अनुप्रयोगों में आशाजनक अनुभवजन्य परिणाम प्रदर्शित किए हैं। एसवीएम उच्च-आयामी डेटा के साथ भी क

  1. डेटा वेयरहाउस में सुरक्षा संबंधी समस्याएं क्या हैं?

    डेटा वेयरहाउसिंग एक दृष्टिकोण है जो आम तौर पर व्यवसाय को महत्वपूर्ण व्यावसायिक अंतर्दृष्टि देने के लिए कई स्रोतों से डेटा एकत्र करने और संभालने के लिए उपयोग किया जाता है। डेटा वेयरहाउस विशेष रूप से प्रबंधन निर्णयों का समर्थन करने के लिए डिज़ाइन किया गया है। सरल शब्दों में, डेटा वेयरहाउस एक डेटाबेस

  1. डेटा वेयरहाउस का डिज़ाइन क्या है?

    डेटा वेयरहाउसिंग एक ऐसा दृष्टिकोण है जो व्यवसाय को एक महत्वपूर्ण व्यावसायिक अंतर्दृष्टि का समर्थन करने के लिए कई स्रोतों से जानकारी एकत्र और प्रबंधित कर सकता है। एक डेटा वेयरहाउस विशेष रूप से समर्थन प्रबंधन निर्णयों के लक्ष्यों के लिए बनाया गया है। एक डेटा वेयरहाउस एक डेटाबेस को परिभाषित करता है जि