डेटा वेयरहाउस में बड़ी मात्रा में डेटा होता है। OLAP सर्वर मांग करते हैं कि निर्णय समर्थन प्रश्नों को सेकंड के क्रम में स्वीकार किया जाए। इस प्रकार, डेटा वेयरहाउस सिस्टम के लिए अत्यधिक प्रभावी क्यूब कंप्यूटेशन तकनीक, एक्सेस तकनीक और क्वेरी प्रोसेसिंग तकनीक प्रदान करना आवश्यक है।
डेटा क्यूब्स की कुशल गणना
बहुआयामी डेटा विश्लेषण के मूल में आयामों के कई सेटों में एकत्रीकरण की कुशल गणना है। SQL शब्दों में, इन एकत्रीकरणों को समूह-दर के रूप में संदर्भित किया जाता है। प्रत्येक समूह-दर को एक घनाभ द्वारा दर्शाया जा सकता है, जहाँ समूह-दर का समूह एक डेटा घन को परिभाषित करने वाले घनाभों की एक जाली बनाता है।
बेस क्यूबॉइड दिए गए डेटा क्यूब के भौतिककरण के लिए तीन विकल्प हैं -
-
कोई भौतिककरण नहीं - यह किसी भी "नॉनबेस" क्यूबॉइड का प्रीकंप्यूट नहीं करता है। इससे महंगे बहुआयामी समुच्चय की गणना तुरंत हो जाती है, जो बेहद धीमी गति से हो सकती है।
-
पूर्ण भौतिकीकरण - यह सभी घनाभों की पूर्व-गणना कर सकता है। गणना किए गए घनाभों की परिणामी जाली को पूर्ण घन के रूप में परिभाषित किया गया है। इस विकल्प के लिए आम तौर पर सभी पूर्व-संगणित घनाभों को संग्रहीत करने के लिए बड़ी मात्रा में स्मृति स्थान की आवश्यकता होती है।
-
आंशिक भौतिककरण - यह संभावित घनाभों के पूरे सेट के एक उचित उपसमुच्चय की चुनिंदा गणना कर सकता है। वैकल्पिक रूप से, यह क्यूब के एक सबसेट की गणना कर सकता है, जिसमें केवल वे सेल शामिल हैं जो कुछ उपयोगकर्ता-निर्दिष्ट मानदंड को पूरा करते हैं, जिसमें प्रत्येक सेल की टपल गिनती कुछ सीमा का पालन कर रही है।
OLAP डेटा अनुक्रमणित करना
यह कुशल डेटा एक्सेसिंग का समर्थन कर सकता है, कुछ डेटा वेयरहाउस सिस्टम इंडेक्स संरचनाएं और भौतिक दृश्य (क्यूबोइड्स का उपयोग करके) प्रदान करते हैं। बिटमैप अनुक्रमण दृष्टिकोण OLAP उत्पादों में प्रसिद्ध है क्योंकि यह डेटा क्यूब्स में तेजी से खोज करने में सक्षम बनाता है। बिटमैप इंडेक्स रिकॉर्ड आईडी (आरआईडी) सूची का एक वैकल्पिक प्रतिनिधित्व है।
किसी दी गई विशेषता के लिए बिटमैप अनुक्रमणिका में, विशेषता के डोमेन में प्रत्येक मान v के लिए एक विशिष्ट बिट वेक्टर, Bv होता है। यदि किसी दी गई विशेषता के डोमेन में n मान शामिल हैं, तो बिटमैप इंडेक्स में प्रत्येक प्रविष्टि के लिए n बिट्स की आवश्यकता होती है (यानी, n बिट वैक्टर हैं)। यदि डेटा तालिका में दी गई पंक्ति के लिए विशेषता का मान v है, तो उस मान को परिभाषित करने वाला बिट बिटमैप इंडेक्स की संबंधित पंक्ति में 1 पर सेट होता है। उस पंक्ति के अन्य सभी बिट 0 पर सेट हैं।
OLAP प्रश्नों का कुशल संसाधन
क्यूबॉइड्स को मूर्त रूप देने और OLAP इंडेक्स संरचनाओं के निर्माण का लक्ष्य डेटा क्यूब में क्वेरी प्रोसेसिंग को तेज करना है।
-
निर्धारित करें कि उपलब्ध घनाभों पर कौन-से ऑपरेशन किए जाने चाहिए - इसमें कुछ चयन, प्रक्षेपण, रोल-अप (समूह-दर), और ड्रिल-डाउन संचालन को संबंधित SQL और/या OLAP संचालन में क्वेरी में दर्शाया गया है। उदाहरण के लिए, डेटा क्यूब को काटना और काटना एक भौतिक घनाभ पर चयन और प्रक्षेपण संचालन के अनुरूप हो सकता है।
-
निर्धारित करें कि किस भौतिक घनाभ (घनभों) पर प्रासंगिक संचालन लागू किया जाना चाहिए - इसमें कुछ भौतिक घनाभों की पहचान करना शामिल है जिनका उपयोग संभावित रूप से प्रश्न का उत्तर देने के लिए किया जा सकता है, घनाभों के बीच "प्रभुत्व" संबंधों के ज्ञान का उपयोग करते हुए निम्नलिखित सेट की छंटाई करना, शेष भौतिक घनाभों के उपयोग के मूल्यों का अनुमान लगाना और न्यूनतम लागत के साथ घनाभ का चयन करना शामिल है।