डेटा विसंगतियों को पहचानने का समर्थन करने के लिए अपवाद संकेतक के रूप में तीन उपायों का उपयोग किया जाता है। ये उपाय आश्चर्य की डिग्री को दर्शाते हैं कि एक सेल में मात्रा उसके अपेक्षित मूल्य के संबंध में प्रभावित करती है।
एकत्रीकरण के सभी स्तरों के लिए उपायों की गणना की जाती है और प्रत्येक सेल के साथ संबद्ध किया जाता है। वे इस प्रकार हैं जिनमें SelfExp, InExp, और PathExp माप तालिका विश्लेषण के लिए एक संख्यात्मक दृष्टिकोण पर आधारित हैं।
एक सेल मान को एक अपवाद माना जाता है, यह इस बात पर निर्भर करता है कि यह अपने अपेक्षित मूल्य से कितना भिन्न है, जहां इसका अपेक्षित मूल्य एक सांख्यिकीय मॉडल के साथ तय किया जाता है। किसी दिए गए सेल मान और उसके अपेक्षित मान के बीच के अंतर को अवशिष्ट के रूप में जाना जाता है।
सहज रूप से, अवशिष्ट जितना अधिक होगा, अतिरिक्त प्रदान किया गया सेल मान एक अपवाद है। अवशिष्ट मूल्यों की तुलना के लिए हमें अवशिष्टों से जुड़े अपेक्षित मानक विचलन के आधार पर मूल्यों को मापना होगा। इसलिए एक सेल मान को एक अपवाद माना जाता है यदि यह स्केल किया गया अवशिष्ट मान एक पूर्वनिर्धारित सीमा से अधिक है।
SelfExp, InExp, और PathExp उपाय इस स्केल किए गए अवशिष्ट पर आधारित हैं। किसी दिए गए सेल का अपेक्षित मान प्रदान किए गए सेल के बड़े-स्तर के समूह-दर की सेवा है। उदाहरण के लिए, तीन आयामों ए, बी, और सी के साथ एक क्यूब दिया गया है, ए में ईथ स्थिति पर सेल के लिए अपेक्षित मान, बी में जेथ स्थिति, और सी में kth स्थिति γ, Ai का एक कार्य है। γBj , γCk , ABij , ACik , और BCjk , जो इस्तेमाल किए गए संख्यात्मक मॉडल के गुणांक हैं।
गुणांक इस बात का अनुसरण करता है कि अधिक स्तरों पर मान कितने भिन्न हैं, यह बड़े-स्तर के एकत्रीकरण को देखने के द्वारा बनाए गए सामान्यीकृत छापों पर निर्भर करता है। इस दृष्टिकोण में, सेल मान की अपवाद गुणवत्ता उसके बाद के मानों के अपवादों पर निर्भर करती है। इसलिए, अपवाद देखते समय, उपयोगकर्ता के लिए यह आवश्यक है कि वह नीचे ड्रिल करके अपवाद का विश्लेषण करे।
इस गणना में तीन चरण होते हैं जैसे कि -
-
पहले चरण में घन को परिभाषित करने वाले कुल मानों की गणना शामिल है, जिसमें योग या गणना शामिल है, जिसके ऊपर अपवाद खोजे जाएंगे।
-
दूसरे चरण में मॉडल फिटिंग शामिल है, जिसमें गुणांक निर्धारित किए जाते हैं और मानकीकृत अवशिष्टों की गणना के लिए उपयोग किए जाते हैं। इस चरण को पहले चरण के साथ ओवरलैप किया जा सकता है क्योंकि गणना समान हैं।
-
तीसरा चरण SelfExp, InExp और PathExp मानों की गणना करता है, जो मानकीकृत अवशेषों पर निर्भर करता है। यह चरण कम्प्यूटेशनल रूप से चरण 1 के बराबर है। इसलिए, खोज-संचालित अन्वेषण के लिए डेटा क्यूब की गणना को प्रभावी ढंग से पूरा किया जा सकता है।