Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

एफपी-ट्री का प्रतिनिधित्व क्या हैं?

<घंटा/>

एफपी-ट्री इनपुट डेटा का एक ठोस विवरण है। यह डेटा सेट को एक समय में एक लेनदेन को पढ़कर और एफपी-ट्री में एक मार्ग पर प्रत्येक लेनदेन को मापने के द्वारा इकट्ठा किया जाता है। कई लेन-देन में कई आइटम समान हो सकते हैं, उनका मार्ग ओवरलैप हो सकता है।

जितने अधिक मार्ग एक दूसरे के साथ ओवरलैप होते हैं, उतना ही अधिक संपीड़न FP-tree आर्किटेक्चर का उपयोग करके कार्यान्वित कर सकता है। यदि एफपी-ट्री का आकार मुख्य मेमोरी में फिट होने के लिए पर्याप्त है, तो यह हमें डिस्क पर सहेजे गए डेटा पर बार-बार पास बनाने के बजाय मेमोरी में आर्किटेक्चर से सीधे बार-बार आइटमसेट निकालने में सक्षम करेगा।

ट्री में प्रत्येक नोड में एक काउंटर के साथ एक आइटम का लेबल शामिल होता है जो दिए गए मार्ग पर मैप किए गए कई लेनदेन को प्रदर्शित करता है। मूल रूप से, एफपी-ट्री में केवल रूट नोड शामिल होता है जो कि नल्फ सिंबल द्वारा परिभाषित होता है।

एफपी-ट्री को निम्नलिखित विधियों में जारी रखा जाता है जो इस प्रकार हैं -

प्रत्येक आइटम की समर्थन संख्या तय करने के लिए डेटा सेट को एक बार खोजा जाता है। कम आइटम गिराए जाते हैं, जबकि बारंबार आइटम समर्थन संख्या को कम करने में स्थिर होते हैं।

एल्गोरिदम FP ट्री बनाने के लिए डेटा पर दूसरा पास बनाता है। पहले लेन-देन की समीक्षा करने के बाद, {ए, बी}, ए और बी के रूप में लेबल किए गए नोड्स उत्पन्न होते हैं। लेन-देन को एन्क्रिप्ट करने के लिए null→a→b से एक पथ बनता है। मार्ग के प्रत्येक नोड की आवृत्ति संख्या 1 होती है।

दूसरे लेन-देन की समीक्षा करने के बाद, {b, c, d}, आइटम b, c, और d के लिए नोड्स का एक नया सेट तैयार किया जाता है। फिर नोड्स नल → बी → सी → डी को जोड़कर लेनदेन को परिभाषित करने के लिए एक मार्ग बनाया जाता है।

इस मार्ग के प्रत्येक नोड की आवृत्ति गणना भी एक के समान होती है। हालाँकि पहले दो लेन-देन में एक आइटम बारंबार होता है, जो कि b है, उनके मार्ग असंबद्ध हैं क्योंकि लेन-देन लगातार उपसर्ग साझा नहीं करते हैं।

तीसरा लेन-देन, {a, c, d, e}, पहले लेन-देन के साथ एक फ़्रीक्वेंट प्रीफ़िक्स आइटम (जो कि a) साझा करता है। तदनुसार, तीसरे लेन-देन के लिए मार्ग, नल → ए → सी → डी → ई, पहले लेनदेन के लिए मार्ग के साथ ओवरलैप करता है, एनयूआईआई → ए → बी। उनके अतिव्यापी मार्ग के कारण, नोड o के लिए आवृत्ति गणना दो तक बढ़ जाती है, जबकि हाल ही में बनाए गए नोड्स, c, d, और e के लिए आवृत्ति गणना एक के समान होती है।

यह चरण तब तक जारी रहता है जब तक कि प्रत्येक लेन-देन को एफपी-ट्री में दिए गए मार्गों में से किसी एक पर मैप नहीं किया जाता है। FP-ट्री का आकार असम्पीडित डेटा के आकार से छोटा होता है क्योंकि बाज़ार टोकरी जानकारी में कई लेन-देन समान रूप से अधिक आइटम साझा करते हैं।


  1. डेटा माइनिंग के उपकरण क्या हैं?

    डेटा माइनिंग के विभिन्न उपकरण हैं जो इस प्रकार हैं - मंकी लर्न - मंकीलर्न एक मशीन लर्निंग प्लेटफॉर्म है जो टेक्स्ट माइनिंग में माहिर है। यह एक उपयोगकर्ता के अनुकूल इंटरफेस में सुलभ है, इसलिए यह वास्तविक समय में डेटा माइनिंग को लागू करने के लिए मंकीलर्न को मौजूदा टूल के साथ एकीकृत कर सकता है। यह नीच

  1. सी टोकन क्या हैं?

    सी प्रोग्राम निर्देशों का एक संग्रह है और प्रत्येक निर्देश अलग-अलग इकाइयों का संग्रह है। C प्रोग्राम की प्रत्येक छोटी व्यक्तिगत इकाई को आम तौर पर टोकन कहा जाता है और C प्रोग्राम में प्रत्येक निर्देश टोकन का एक संग्रह होता है। टोकन का उपयोग C प्रोग्राम के निर्माण के लिए किया जाता है और उन्हें C प्र

  1. सी # में टिप्पणियां क्या हैं?

    टिप्पणियों का उपयोग कोड समझाने के लिए किया जाता है। संकलक टिप्पणी प्रविष्टियों की उपेक्षा करते हैं। C# प्रोग्राम में बहुपंक्ति टिप्पणियाँ /* से शुरू होती हैं और नीचे दिखाए गए अनुसार */ के साथ समाप्त होती हैं। बहु-पंक्ति टिप्पणियां /* The following is a mult-line comment In C# /* . में एक बहु-पंक्ति