Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में समर्थन और विश्वास का उपयोग क्यों करें?

<घंटा/>

समर्थन एक महत्वपूर्ण उपाय है क्योंकि बहुत कम समर्थन वाला नियम संयोग से आसानी से प्रकट हो सकता है। एक कम समर्थन नियम एक व्यावसायिक दृष्टिकोण से थकाऊ होने के लिए भी संभव है क्योंकि यह उन वस्तुओं को बढ़ाने के लिए लाभदायक नहीं हो सकता है जिन्हें उपयोगकर्ता शायद ही कभी एक साथ खरीदते हैं।

एक एसोसिएशन नियम फॉर्म एक्स → वाई का एक निहितार्थ विवरण है जहां एक्स और वाई अलग-अलग आइटमसेट हैं, यानी, $\mathrm{X\cap\:Y=\phi}$। एक एसोसिएशन नियम के स्थायित्व की गणना उसके समर्थन और विश्वास के संदर्भ में की जा सकती है। समर्थन तय करता है कि किसी दिए गए डेटा सेट के लिए सुलभ नियम कैसे प्रदान किया जाए, जबकि आत्मविश्वास तय करता है कि वाई में आइटम कितनी बार लेन-देन में होते हैं जिनमें एक्स शामिल है।

विश्वास एक नियम द्वारा उत्पादित अनुमान की सटीकता को मापता है। किसी दिए गए नियम फॉर्म X→Y के लिए, जितना बड़ा कॉन्फिडेंस होगा, उतना ही अधिक स्वीकार्य होगा कि Y लेन-देन में उपस्थित हो जिसमें X शामिल हो। कॉन्फिडेंस भी Y दिए गए X की सशर्त संभावना के अनुमान का समर्थन करता है।

एसोसिएशन विश्लेषण परिणामों को सावधानी से निष्पादित किया जाना चाहिए। एक संघ नियम द्वारा निर्मित निष्कर्ष अनिवार्य रूप से कार्य-कारण का संकेत नहीं देता है। इसके बजाय यह पूर्ववर्ती और नियम के परिणामस्वरूप तत्वों के बीच एक शक्तिशाली सह-उपस्थिति संबंध का सुझाव देता है। कार्य-कारण को जानकारी में कारण और प्रभाव विशेषताओं के बारे में ज्ञान की आवश्यकता होती है और आम तौर पर समय के साथ दिखाई देने वाले संबंध होते हैं।

एसोसिएशन रूल माइनिंग प्रॉब्लम को इस प्रकार बताया जा सकता है -

एसोसिएशन रूल डिस्कवरी - लेन-देन टी के एक सेट को देखते हुए, कुछ नियमों की खोज करें जिनमें समर्थन minsup और विश्वास ≥ minconf है, जहां minconf और minconf समान समर्थन और विश्वास सीमा हैं।

खनन संघ के नियमों के लिए एक क्रूर-बल विधि प्रत्येक लागू नियम के लिए समर्थन और विश्वास की गणना करना है। यह तरीका बहुत महंगा है क्योंकि ऐसे कई नियम हैं जिन्हें डेटा सेट से कॉपी किया जा सकता है।

एसोसिएशन नियम खनन एल्गोरिदम के कार्यान्वयन को बढ़ाने की दिशा में एक मूल कदम समर्थन और विश्वास आवश्यकताओं को कम करना है। यदि आइटमसेट विषम है, इसलिए सभी छह उम्मीदवार नियमों को उनके विश्वास मूल्यों की गणना किए बिना सीधे काट दिया जा सकता है।

इस प्रकार, कई एसोसिएशन नियम खनन एल्गोरिदम द्वारा एक आम रणनीति अपतटीय मुद्दों को दो प्रमुख उप-कार्यों में विघटित करना है -

अक्सर आइटम सेट बनाना - इसका उद्देश्य कुछ ऐसे आइटम सेट की खोज करना है जिन्हें एक सीमा की आवश्यकता होती है। इन आइटमसेट को फ़्रीक्वेंट आइटमसेट के रूप में जाना जाता है।

नियम निर्माण - इसका उद्देश्य पिछले चरण में खोजे गए लगातार आइटमसेट से कुछ उच्च-विश्वास नियमों को निकालना है। इन नियमों को मजबूत नियम के रूप में जाना जाता है। बार-बार आइटमसेट बनाने के लिए कम्प्यूटेशनल आवश्यकताएं नियम निर्माण की तुलना में अक्सर अधिक महंगी होती हैं।


  1. हम TKinter में आयात * और फिर ttk का उपयोग क्यों करते हैं?

    टिंकर एप्लिकेशन के साथ काम करने के लिए, हमें अपने वातावरण में टिंकर लाइब्रेरी को स्थापित और आयात करना होगा। आम तौर पर, हम tkinter आयात से . का उपयोग करके पर्यावरण में tkinter लाइब्रेरी आयात करते हैं * आदेश। आयात * . का महत्व टिंकर लाइब्रेरी में सभी कार्यों और अंतर्निहित मॉड्यूल का प्रतिनिधित्व करता

  1. ZFS स्नैपशॉट और क्लोन का उपयोग कैसे करें

    यदि आपने अपने भंडारण उपकरणों पर ZFS का उपयोग करने का निर्णय लिया है, बधाई हो! आप ग्रह पर सबसे जटिल और सुविधा संपन्न फाइल सिस्टम में से एक का उपयोग कर रहे हैं। और यदि आप कभी भी पारिवारिक फ़ोटो और वीडियो जैसे दीर्घकालिक डेटा संग्रहीत करने का निर्णय लेते हैं, तो ZFS पर गंभीरता से विचार करें। एक बेमानी

  1. Windows Sandbox का उपयोग कैसे (और क्यों) करें

    विंडोज 10 का मई 2019 अपडेट (बिल्ड 1903) एक दिलचस्प नई सुविधा के साथ जहाज। हालांकि अधिक अनुभवी उपयोगकर्ताओं के उद्देश्य से, यह विभिन्न सामान्य कार्यों की सुरक्षा में भी सुधार कर सकता है। विंडोज सैंडबॉक्स नामित, यह आपको सेकंड के भीतर, आपकी मुख्य मशीन से अलग एक अलग विंडोज वातावरण को फायर करने में सक्षम