एक पैटर्न के अपेक्षित समर्थन को निर्धारित करने के लिए दो दृष्टिकोण हैं (एक अवधारणा पदानुक्रम और एक पड़ोस-आधारित दृष्टिकोण जिसे अप्रत्यक्ष संघ कहा जाता है।
अवधारणा पदानुक्रम के आधार पर समर्थन की अपेक्षा
केवल वस्तुनिष्ठ उपाय अनिच्छुक विरल प्रतिमानों को हटाने के लिए पर्याप्त नहीं हो सकते। उदाहरण के लिए, मान लें कि ब्रेड और लैपटॉप कंप्यूटर अक्सर आइटम होते हैं। भले ही आइटमसेट {ब्रेड, Iaptop conputer} दुर्लभ है और संभवतः नकारात्मक रूप से सहसंबद्ध है, यह आकर्षक नहीं है क्योंकि उनके समर्थन की कमी डोमेन विशेषज्ञों के लिए स्पष्ट प्रतीत होती है। इसलिए, इस तरह के दुर्लभ पैटर्न को उत्पन्न करने से रोकने के लिए अपेक्षित समर्थन तय करने के लिए एक व्यक्तिपरक दृष्टिकोण की आवश्यकता है।
अप्रत्यक्ष संघ के आधार पर समर्थन की अपेक्षा
वस्तुओं की एक जोड़ी पर विचार करें, (ए, बी), जो ग्राहकों द्वारा असाधारण रूप से खरीदे जाते हैं। यदि ए और बी असंबंधित आइटम हैं, जिसमें ब्रेड और डीवीओ प्लेयर शामिल हैं, इसलिए उनका समर्थन कम होने की उम्मीद है। दूसरे शब्दों में, यदि ए और बी संबंधित आइटम हैं, तो उनका समर्थन अधिक होना चाहिए। अपेक्षित समर्थन की गणना पहले एक अवधारणा पदानुक्रम का उपयोग करके की गई थी। यह आमतौर पर इन दो वस्तुओं के साथ-साथ अन्य वस्तुओं को खरीदकर वस्तुओं की एक जोड़ी के बीच अपेक्षित समर्थन तय करने के लिए एक दृष्टिकोण दिखाता है।
उदाहरण के लिए, उन ग्राहकों पर विचार करें जो स्लीपिंग बैग खरीदते हैं, वे अन्य कैंपिंग आपूर्ति खरीदने के लिए भी प्रभावित होते हैं, जबकि जो लोग डेस्कटॉप कंप्यूटर खरीदते हैं, वे ऑप्टिकल माउस या प्रिंटर सहित अन्य कंप्यूटर एक्सेसरीज़ खरीदने के लिए भी प्रभावित होते हैं। यह देखते हुए कि स्लीपिंग बैग और डेस्कटॉप कंप्यूटर दोनों के साथ अक्सर कोई अन्य वस्तु नहीं खरीदी जाती है, इन असंबंधित वस्तुओं के लिए समर्थन कम होना चाहिए।
दूसरे शब्दों में, विचार करें कि चिप्स और कुकीज़ के साथ आहार और नियमित सोडा खरीदा जाता है। अवधारणा पदानुक्रम का उपयोग किए बिना भी, दोनों मदों के मध्यम रूप से संबंधित होने की उम्मीद की जाती है और उनका समर्थन उच्च होना चाहिए। उनके वास्तविक समर्थन कम होने के कारण, आहार और नियमित सोडा एक प्रभावशाली विरल पैटर्न बनाते हैं। ऐसे पैटर्न को अप्रत्यक्ष जुड़ाव पैटर्न कहा जाता है।
इनडायरेक्ट एसोसिएशन में कई एप्लिकेशन हैं जैसे मार्केट बास्केट डोमेन में, ए और बी डेस्कटॉप और लैपटॉप कंप्यूटर सहित प्रतिस्पर्धी वस्तुओं को परिभाषित कर सकते हैं। टेक्स्ट माइनिंग में, अप्रत्यक्ष संघ का उपयोग समानार्थक शब्द, विलोम या कई संदर्भों में उपयोग किए जाने वाले शब्दों को पहचानने के लिए किया जा सकता है। उदाहरण के लिए, फाइलों के एक सेट को देखते हुए, डेटा शब्द अप्रत्यक्ष रूप से मध्यस्थ खनन के माध्यम से सोने से संबंधित हो सकता है।