अनुक्रमिक अपवाद तकनीक उस पद्धति का अनुकरण करती है जिसमें मनुष्य असामान्य सेटों को कथित रूप से वस्तुओं के अनुक्रम के बीच से अलग कर सकता है। यह डेटा के निहित अतिरेक में मदद करता है।
n ऑब्जेक्ट्स के डेटा सेट, D को देखते हुए, यह सबसेट का एक क्रम बनाता है, {D1 , डी<उप>2उप> ,..., डी<उप>एमउप> }, इन वस्तुओं में से 2 ≤ m ≤ n सहित
$$\mathrm{D_{j−1}\subset D_{j}\:\:where\:D_{j}\subseteq D}$$
श्रृंखला में सबसेट के बीच असमानताओं का आकलन किया जाता है। तकनीक निम्नलिखित शब्दों को सीखती है जो इस प्रकार हैं -
अपवाद सेट - यह विचलन या आउटलेयर का सेट है। इसे वस्तुओं के सबसे छोटे उपसमुच्चय के रूप में परिभाषित किया जाता है, जिसके हटाने से अवशिष्ट सेट में असमानता में सबसे अधिक कमी आती है।
असमानता फ़ंक्शन - इस फ़ंक्शन को वस्तुओं के बीच एक मीट्रिक दूरी की आवश्यकता नहीं है। ऑब्जेक्ट्स के एक सेट को देखते हुए, यदि ऑब्जेक्ट एक दूसरे के समान हैं, तो कम मान को पुनर्स्थापित करें। वस्तुओं के बीच असमानता जितनी अधिक होगी, फ़ंक्शन द्वारा लौटाया गया मान उतना ही अधिक होगा।
एक उपसमुच्चय की असमानता की गणना क्रमिक रूप से की जाती है, यह क्रम में उसके पिछले उपसमुच्चय पर निर्भर करता है। n संख्याओं के सबसेट को देखते हुए, {x1 ,..., xn }, एक संभावित असमानता फलन सेट में संख्याओं का प्रसरण है
$$\mathrm{\frac{1}{n}\displaystyle\sum\limits_{i=1}^n (x_{i}-x^{'})^2}$$
जहां x ' सेट में n संख्याओं का माध्य है। कैरेक्टर स्ट्रिंग्स के लिए, डिसिमिलैरिटी फंक्शन एक पैटर्न स्ट्रिंग (जैसे, वाइल्डकार्ड कैरेक्टर सहित) के डिजाइन में हो सकता है जो अब तक के सभी पैटर्न व्यू को कवर कर सकता है। Dj−1 . में कुछ स्ट्रिंग्स को कवर करने वाला पैटर्न तब बढ़ता है जब असमानता बढ़ जाती है Dj . में कुछ स्ट्रिंग को कवर नहीं करता है जो Dj−1 . में नहीं है ।
कार्डिनैलिटी फ़ंक्शन - यह आमतौर पर किसी दिए गए सेट में कई वस्तुओं की गिनती है।
चिकनाई कारक - इस फ़ंक्शन की गणना अनुक्रम में प्रत्येक सबसेट के लिए की जाती है। यह मूल्यांकन करता है कि वस्तुओं के प्रारंभिक सेट से उपसमुच्चय को हटाकर कितनी असमानता को कम किया जा सकता है। यह मान सेट की कार्डिनैलिटी द्वारा दर है। उपसमुच्चय जिसका चौरसाई कारक मान उच्चतम है वह अपवाद सेट है।
अपवाद सेट खोजने का कार्य एनपी-हार्ड (यानी, अट्रैक्टिव) हो सकता है। एक अनुक्रमिक विधि कम्प्यूटेशनल रूप से संभव है और एक रैखिक एल्गोरिदम का उपयोग करके निष्पादित किया जा सकता है।
अपने पूरक सेट से संबंधित वर्तमान उपसमुच्चय की असमानता का आकलन करने के बजाय, एल्गोरिथ्म विश्लेषण के लिए सेट से सबसेट की एक श्रृंखला का चयन करता है। प्रत्येक उपसमुच्चय के लिए, यह क्रम में पिछले उपसमुच्चय से संबंधित उपसमुच्चय की असमानता के अंतर को तय करता है।