एसोसिएशन रूल क्लस्टरिंग सिस्टम में निम्नलिखित चरण शामिल हैं जो इस प्रकार हैं -
बिनिंग - मात्रात्मक विशेषताओं में उनके डोमेन का प्रतिनिधित्व करने वाले मूल्यों की एक विस्तृत श्रृंखला हो सकती है। यह सोच सकता है कि 2-डी ग्रिड कितना बड़ा होगा यदि यह आयु और आय को कुल्हाड़ियों के रूप में प्लॉट कर सकता है, जहां उम्र के हर संभव मूल्य को एक धुरी पर एक विशिष्ट स्थान बनाया गया था, और उसी तरह, आय का हर संभव मूल्य एक विशिष्ट बनाया गया था दूसरी धुरी पर स्थिति।
यह ग्रिड को एक प्रबंधनीय आकार तक बनाए रख सकता है, इसके बजाय यह मात्रात्मक विशेषताओं के क्षेत्रों को अंतराल में विभाजित कर सकता है। ये अंतराल इस मायने में शक्तिशाली हैं कि इन्हें खनन चरण के दौरान जोड़ा जा सकता है। विभाजन चरण को बिनिंग के रूप में परिभाषित किया गया है, यानी, जहां अंतराल को "बिन" माना जाता है।
तीन सामान्य बिनिंग रणनीति क्षेत्र इस प्रकार हैं -
समान-चौड़ाई वाली बिनिंग - समान-चौड़ाई वाली बाइनिंग में, जहां प्रत्येक बिन का अंतराल आकार समान होता है।
समान-आवृत्ति बिनिंग - समान फ़्रीक्वेंसी बाइनिंग में, जहाँ प्रत्येक बिन में लगभग समान संख्या में ट्यूपल्स असाइन किए जाते हैं।
क्लस्टरिंग-आधारित बिनिंग - क्लस्टरिंग-आधारित बिनिंग में, जहां एक ही बिन में पड़ोसी बिंदुओं (विभिन्न दूरी उपायों के आधार पर निर्णय) को समूहबद्ध करने के लिए मात्रात्मक विशेषता पर क्लस्टरिंग की जाती है।
एआरसीएस को समान-चौड़ाई वाली बिनिंग की आवश्यकता होती है, जहां प्रत्येक मात्रात्मक विशेषता के लिए बिन आकार उपयोगकर्ता द्वारा इनपुट किया जाता है। दोनों मात्रात्मक विशेषताओं सहित हर संभव बिन संयोजन के लिए एक 2-डी सरणी तैयार की जाती है।
प्रत्येक सरणी सेल नियम के दाहिने हाथ की स्पष्ट विशेषता के प्रत्येक प्राप्त करने योग्य वर्ग के लिए संबंधित गणना वितरण को प्रभावित करता है। इस डेटा संरचना को बनाकर, आवश्यक कार्य-प्रासंगिक डेटा को केवल एक बार स्कैन किया जाता है। समान 2-डी सरणी का उपयोग श्रेणीबद्ध विशेषता के कुछ मूल्य के लिए नियम बनाने के लिए किया जा सकता है, जो समान दो मात्रात्मक विशेषताओं पर निर्भर करता है।
अक्सर विधेय सेट ढूंढना - क्योंकि प्रत्येक श्रेणी के लिए गणना वितरण सहित 2-डी सरणी सेट की गई है, इसे लगातार विधेय सेट (जो न्यूनतम समर्थन को संतुष्ट करते हैं) को खोजने के लिए स्कैन किया जा सकता है जो न्यूनतम आत्मविश्वास को भी संतुष्ट करते हैं।
एल्गोरिदम नियमों के आयताकार समूहों की तलाश में ग्रिड की जांच करता है। इस पद्धति में, एक नियम क्लस्टर के भीतर प्रदर्शित होने वाली मात्रात्मक विशेषताओं के डिब्बे को जोड़ा जा सकता है, और इसलिए मात्रात्मक विशेषताओं का गतिशील विवेकीकरण प्रकट होता है।
ग्रिड-आधारित पद्धति का वर्णन है कि मूल संघ नियमों को आयताकार क्षेत्रों में समूहीकृत किया जा सकता है। क्लस्टरिंग को लागू करने से पहले, रिकॉर्ड से शोर और आउटलेयर को हटाने के लिए चौरसाई विधियों का उपयोग किया जा सकता है। आयताकार क्लस्टर जानकारी को सरल बना सकते हैं।
मात्रात्मक संघ के नियमों की खोज के लिए एक गैर-ग्रिड-आधारित दृष्टिकोण की सिफारिश की गई है जो अधिक सामान्य हैं, जहां नियमों के दोनों ओर कई मात्रात्मक और स्पष्ट गुण हो सकते हैं।
इस दृष्टिकोण में, मात्रात्मक विशेषताओं को समान आवृत्ति बिनिंग का उपयोग करके गतिशील रूप से अलग किया जाता है, और विभाजन संयुक्त होते हैं जो आंशिक पूर्णता के माप पर निर्भर करता है, जो विभाजन के कारण खोए गए डेटा को मापता है।