Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

रिलेशनल डेटाबेस और डेटा वेयरहाउस से माइनिंग मल्टीडायमेंशनल एसोसिएशन नियम क्या हैं?

<घंटा/>

एसोसिएशन रूल लर्निंग एक प्रकार की अनसुनी शिक्षण तकनीक है जो एक डेटा तत्व की दूसरे डेटा तत्व पर निर्भरता के लिए परीक्षण करती है और तदनुसार मानचित्र बनाती है ताकि यह अधिक व्यावसायिक हो सके। यह डेटासेट के चरों के बीच कुछ दिलचस्प संबंधों या संघों की खोज करने का प्रयास करता है। यह डेटाबेस में चरों के बीच दिलचस्प संबंध खोजने के लिए कई नियमों पर निर्भर करता है।

एसोसिएशन रूल लर्निंग मशीन लर्निंग की आवश्यक अवधारणा है, और इसे मार्केट बास्केट विश्लेषण, वेब उपयोग खनन, निरंतर उत्पादन आदि में नियोजित किया जाता है। इसलिए मार्केट बास्केट विश्लेषण कई बड़े खुदरा विक्रेताओं द्वारा वस्तुओं के बीच संबंध खोजने के लिए उपयोग किया जाने वाला दृष्टिकोण है।

बाजार टोकरी विश्लेषण में, ग्राहकों की खरीदारी की आदतों का विश्लेषण उन विभिन्न वस्तुओं के बीच संबंध ढूंढकर किया जाता है जिन्हें ग्राहक अपने शॉपिंग बास्केट में रखते हैं।

ऐसे संघों की खोज करके, खुदरा विक्रेता यह विश्लेषण करके विपणन दृष्टिकोण बनाते हैं कि ग्राहक द्वारा आमतौर पर कौन सी वस्तुएं खरीदी जाती हैं। यह जुड़ाव खुदरा विक्रेताओं को चुनिंदा मार्केटिंग करने और उनके शेल्फ क्षेत्र के लिए योजना बनाने में सहायता करके बिक्री में वृद्धि कर सकता है।

मल्टी-लेवल एसोसिएशन के लिए आवेदन का लोकप्रिय क्षेत्र मार्केट बास्केट विश्लेषण है, जो ग्राहकों की खरीदारी की आदतों का अध्ययन उन वस्तुओं के सेट की खोज करके करता है जिन्हें अक्सर एक साथ खरीदा जाता है जो अवधारणा पदानुक्रम की अवधारणा में प्रदर्शित किया गया था।

दो या दो से अधिक आयामों या विधेय वाले एसोसिएशन नियमों को बहुआयामी एसोसिएशन नियमों के रूप में संदर्भित किया जा सकता है। उदाहरण के लिए,

आयु (X, "20...29") ^व्यवसाय (X,"छात्र") =>खरीदता है (X,"Laptop")

इस नियम में तीन विधेय (आयु, व्यवसाय और खरीद) शामिल हैं, जिनमें से प्रत्येक नियम में केवल एक बार होता है, ऐसे नियमों को अंतःआयामी संघ नियम कहा जाता है। दोहराए गए विधेय वाले या कुछ विधेय के कई बार होने वाले नियम हाइब्रिड-आयाम संघ नियम कहलाते हैं।

उदाहरण के लिए,

आयु (X, "20...29") ^buys (X,"Laptop") =>buys (X,"Printer")

डेटाबेस विशेषताएँ श्रेणीबद्ध या मात्रात्मक होनी चाहिए।

श्रेणीबद्ध विशेषताओं में संभावित मूल्यों की एक सीमित संख्या होती है, मूल्यों के बीच कोई क्रम नहीं होता है जिसे नाममात्र गुण भी कहा जाता है।

मात्रात्मक विशेषताएँ संख्यात्मक होती हैं और मूल्यों के बीच एक अंतर्निहित अनुक्रमण होता है। मात्रात्मक विशेषताओं के उपचार के संबंध में तीन बुनियादी दृष्टिकोण इस प्रकार हैं -

  • पहले दृष्टिकोण में, मात्रात्मक विशेषताओं को पूर्वनिर्धारित अवधारणा पदानुक्रम का उपयोग करके अलग किया जाता है, जो खनन से पहले होता है। असतत संख्यात्मक विशेषताओं को उनके श्रेणी मानों के साथ श्रेणीबद्ध विशेषताओं के रूप में माना जा सकता है।

  • दूसरे दृष्टिकोण में, मात्रात्मक विशेषताओं को डिब्बे में वर्गीकृत किया जाता है और यह डेटा के वितरण पर आधारित होता है। खनन प्रक्रिया के दौरान इन डिब्बे को आगे जोड़ा जा सकता है। इसलिए विवेकीकरण की प्रक्रिया गतिशील और स्थापित है।

  • तीसरे दृष्टिकोण में, इस तरह के अंतराल डेटा के अर्थ अर्थ को पकड़ने के लिए मात्रात्मक विशेषताओं को अलग किया जाता है। इस शक्तिशाली विवेकीकरण चरण ने डेटा बिंदुओं के बीच की दूरी का इलाज किया।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. डेटा वेयरहाउस में बैकअप और रिकवरी की रणनीति क्या है?

    बैकअप और पुनर्प्राप्ति एक हानि की विधि में रिकॉर्ड का बैकअप लेने की प्रक्रिया को परिभाषित करता है और सिस्टम स्थापित करता है जो डेटा हानि के कारण डेटा पुनर्प्राप्ति को सक्षम करता है। डेटा का बैकअप लेने के लिए कंप्यूटर की जानकारी को कॉपी और संग्रहीत करना आवश्यक है, ताकि यह डेटा हटाने या भ्रष्टाचार के

  1. घुसपैठ का पता लगाने और रोकथाम के लिए डेटा माइनिंग के तरीके क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के