एसोसिएशन रूल लर्निंग एक प्रकार की अनसुनी शिक्षण तकनीक है जो एक डेटा तत्व की दूसरे डेटा तत्व पर निर्भरता के लिए परीक्षण करती है और तदनुसार मानचित्र बनाती है ताकि यह अधिक व्यावसायिक हो सके। यह डेटासेट के चरों के बीच कुछ दिलचस्प संबंधों या संघों की खोज करने का प्रयास करता है। यह डेटाबेस में चरों के बीच दिलचस्प संबंध खोजने के लिए कई नियमों पर निर्भर करता है।
एसोसिएशन रूल लर्निंग मशीन लर्निंग की आवश्यक अवधारणा है, और इसे मार्केट बास्केट विश्लेषण, वेब उपयोग खनन, निरंतर उत्पादन आदि में नियोजित किया जाता है। इसलिए मार्केट बास्केट विश्लेषण कई बड़े खुदरा विक्रेताओं द्वारा वस्तुओं के बीच संबंध खोजने के लिए उपयोग किया जाने वाला दृष्टिकोण है।पी>
बाजार टोकरी विश्लेषण में, ग्राहकों की खरीदारी की आदतों का विश्लेषण उन विभिन्न वस्तुओं के बीच संबंध ढूंढकर किया जाता है जिन्हें ग्राहक अपने शॉपिंग बास्केट में रखते हैं।
ऐसे संघों की खोज करके, खुदरा विक्रेता यह विश्लेषण करके विपणन दृष्टिकोण बनाते हैं कि ग्राहक द्वारा आमतौर पर कौन सी वस्तुएं खरीदी जाती हैं। यह जुड़ाव खुदरा विक्रेताओं को चुनिंदा मार्केटिंग करने और उनके शेल्फ क्षेत्र के लिए योजना बनाने में सहायता करके बिक्री में वृद्धि कर सकता है।
मल्टी-लेवल एसोसिएशन के लिए आवेदन का लोकप्रिय क्षेत्र मार्केट बास्केट विश्लेषण है, जो ग्राहकों की खरीदारी की आदतों का अध्ययन उन वस्तुओं के सेट की खोज करके करता है जिन्हें अक्सर एक साथ खरीदा जाता है जो अवधारणा पदानुक्रम की अवधारणा में प्रदर्शित किया गया था।
दो या दो से अधिक आयामों या विधेय वाले एसोसिएशन नियमों को बहुआयामी एसोसिएशन नियमों के रूप में संदर्भित किया जा सकता है। उदाहरण के लिए,
आयु (X, "20...29") ^व्यवसाय (X,"छात्र") =>खरीदता है (X,"Laptop")
इस नियम में तीन विधेय (आयु, व्यवसाय और खरीद) शामिल हैं, जिनमें से प्रत्येक नियम में केवल एक बार होता है, ऐसे नियमों को अंतःआयामी संघ नियम कहा जाता है। दोहराए गए विधेय वाले या कुछ विधेय के कई बार होने वाले नियम हाइब्रिड-आयाम संघ नियम कहलाते हैं।
उदाहरण के लिए,
आयु (X, "20...29") ^buys (X,"Laptop") =>buys (X,"Printer")
डेटाबेस विशेषताएँ श्रेणीबद्ध या मात्रात्मक होनी चाहिए।
श्रेणीबद्ध विशेषताओं में संभावित मूल्यों की एक सीमित संख्या होती है, मूल्यों के बीच कोई क्रम नहीं होता है जिसे नाममात्र गुण भी कहा जाता है।
मात्रात्मक विशेषताएँ संख्यात्मक होती हैं और मूल्यों के बीच एक अंतर्निहित अनुक्रमण होता है। मात्रात्मक विशेषताओं के उपचार के संबंध में तीन बुनियादी दृष्टिकोण इस प्रकार हैं -
-
पहले दृष्टिकोण में, मात्रात्मक विशेषताओं को पूर्वनिर्धारित अवधारणा पदानुक्रम का उपयोग करके अलग किया जाता है, जो खनन से पहले होता है। असतत संख्यात्मक विशेषताओं को उनके श्रेणी मानों के साथ श्रेणीबद्ध विशेषताओं के रूप में माना जा सकता है।
-
दूसरे दृष्टिकोण में, मात्रात्मक विशेषताओं को डिब्बे में वर्गीकृत किया जाता है और यह डेटा के वितरण पर आधारित होता है। खनन प्रक्रिया के दौरान इन डिब्बे को आगे जोड़ा जा सकता है। इसलिए विवेकीकरण की प्रक्रिया गतिशील और स्थापित है।
-
तीसरे दृष्टिकोण में, इस तरह के अंतराल डेटा के अर्थ अर्थ को पकड़ने के लिए मात्रात्मक विशेषताओं को अलग किया जाता है। इस शक्तिशाली विवेकीकरण चरण ने डेटा बिंदुओं के बीच की दूरी का इलाज किया।