एक सांख्यिकीय विसंगति परीक्षण विश्लेषण दो परिकल्पनाएं; एक कामकाजी परिकल्पना और एक अलग परिकल्पना। एक कामकाजी परिकल्पना, एच, एक बयान है कि एन वस्तुओं का पूरा डेटा सेट प्रारंभिक वितरण मॉडल, एफ, यानी एच:ओ <उप>i से आता है। एफ, जहां मैं =1, 2, एन.
परिकल्पना को बरकरार रखा जाता है यदि इसकी अस्वीकृति का समर्थन करने वाला कोई सांख्यिकीय रूप से महत्वपूर्ण सबूत नहीं है। एक विसंगति परीक्षण जाँचता है कि क्या कोई वस्तु <उप>i . है वितरण एफ के संबंध में अनिवार्य रूप से बड़ा (या छोटा) है। डेटा के उपलब्ध ज्ञान के आधार पर विभिन्न परीक्षण आंकड़ों को एक विसंगति परीक्षण के रूप में उपयोग के लिए प्रस्तावित किया गया है।
मान लीजिए कि कुछ आँकड़ा T को विसंगति परीक्षण के लिए चुना गया है, और वस्तु oi के लिए आँकड़ों का मान vi . है , तो T के वितरण का निर्माण किया जाता है। महत्व प्रायिकता SP (vi ) =प्रोब (T> vi ) का मूल्यांकन किया जाता है।
अगर कुछ एसपी (vi ) पर्याप्त रूप से छोटा है, तो oi असंगत है तथा कार्य परिकल्पना अस्वीकृत की जाती है। एक वैकल्पिक परिकल्पना, जो बताती है कि oi एक अन्य वितरण मॉडल से प्रकट होता है, G को अपनाया जाता है। परिणाम बहुत अधिक है जिसके आधार पर F मॉडल चुना जाता है क्योंकि oi एक मॉडल के तहत एक बाहरी और दूसरे के तहत पूरी तरह से मान्य मान हो सकता है।
वैकल्पिक वितरण परीक्षण की शक्ति को तय करने में बहुत आवश्यक है, यानी संभावना है कि काम करने वाली परिकल्पना को खारिज कर दिया जाता है जब oi एक बाहरी है। कई प्रकार के वैकल्पिक वितरण हैं।
अंतर्निहित वैकल्पिक वितरण - इस मामले में, कार्य परिकल्पना कि सभी वस्तुएं वितरण F से आती हैं, वैकल्पिक परिकल्पना के पक्ष में खारिज कर दी जाती है कि सभी वस्तुएं दूसरे वितरण से बढ़ती हैं, G -
H:oi Î जी, जहां मैं =1, 2, ..., एन
F और G अलग-अलग वितरण हो सकते हैं या केवल समान वितरण के मापदंडों में भिन्न हो सकते हैं। जी वितरण के रूप में बाधाएं हैं कि इसमें आउटलेयर बनाने की क्षमता होनी चाहिए। उदाहरण के लिए, इसका एक अलग माध्य या फैलाव हो सकता है, या एक लंबी पूंछ हो सकती है।
मिश्रण वैकल्पिक वितरण - मिश्रण विकल्प बताता है कि एफ आबादी में असंगत मूल्य बाहरी नहीं हैं, लेकिन कुछ अन्य आबादी से दूषित हैं। इस मामले में, वैकल्पिक परिकल्पना है -
H:oi Î (1 - एल) एफ + एलजी, जहां मैं =1, 2, ..., एन
स्लिपेज वैकल्पिक वितरण - यह विकल्प बताता है कि सभी ऑब्जेक्ट (कुछ निर्धारित छोटी संख्या के अलावा) मूल मॉडल F से स्वतंत्र रूप से पैरामीटर m और s2 के साथ उत्पन्न होते हैं, जबकि शेष ऑब्जेक्ट F के संशोधित संस्करण से स्वतंत्र अवलोकन हैं जिसमें पैरामीटर बदल दिए गए हैं ।