Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

हम बारंबार अवसंरचना की खोज कैसे कर सकते हैं?

<घंटा/>

लगातार अवसंरचना की खोज में आमतौर पर दो चरण होते हैं। पहले चरण में, यह बार-बार सबस्ट्रक्चर उम्मीदवार बना सकता है। दूसरे चरण में प्रत्येक उम्मीदवार की आवृत्ति का परीक्षण किया जाता है। बारंबार अवसंरचना की खोज पर अधिकांश अध्ययन पहले चरण के अनुकूलन पर ध्यान केंद्रित करते हैं क्योंकि दूसरे चरण में एक सबग्राफ समरूपता परीक्षण शामिल होता है जिसकी कम्प्यूटेशनल जटिलता अत्यधिक अधिक होती है (यानी, एनपी-पूर्ण)।

लगातार अवसंरचना खनन के लिए विभिन्न तरीके हैं जो इस प्रकार हैं -

अप्रियोरी-आधारित दृष्टिकोण - एप्रीओरी-आधारित फ़्रीक्वेंट सबस्ट्रक्चर माइनिंग एल्गोरिदम, एप्रीओरी-आधारित फ़्रीक्वेंट आइटमसेट माइनिंग एल्गोरिदम के साथ समान सुविधाएँ भेजते हैं। बार-बार होने वाले ग्राफ़ की खोज छोटे "आकार" के ग्राफ़ से शुरू होती है और उम्मीदवारों के पास एक अतिरिक्त शीर्ष, किनारा या पथ बनाकर नीचे से ऊपर की ओर आगे बढ़ती है। ग्राफ़ आकार का प्रतिनिधित्व उपयोग किए गए एल्गोरिथम पर आधारित है।

अप्रियोरी-आधारित सबस्ट्रक्चर माइनिंग एल्गोरिदम की मुख्य डिजाइन जटिलता उम्मीदवार पीढ़ी कदम है। बार-बार आइटमसेट खनन में उम्मीदवार का उत्पादन सत्य है। उदाहरण के लिए, मान लें कि हमारे पास आकार-3:(abc) और (bcd) के दो लगातार आइटम सेट हैं।

उनसे उत्पन्न आकार -4 के लगातार आइटमसेट उम्मीदवार आसानी से (एबीसीडी) होते हैं, जो एक जॉइन से बदल जाते हैं। हालांकि, बार-बार सबस्ट्रक्चर माइनिंग में कैंडिडेट जनरेशन की समस्या बार-बार आइटमसेट माइनिंग की तुलना में कठिन होती है, क्योंकि दो सबस्ट्रक्चर को जोड़ने के कई तरीके हैं।

पैटर्न-विकास दृष्टिकोण - एप्रीओरी-आधारित दृष्टिकोण को अपनी स्तर-वार उम्मीदवार पीढ़ी के कारण चौड़ाई-प्रथम खोज (बीएफएस) रणनीति का उपयोग करना पड़ता है। यह निर्धारित करने के लिए कि क्या एक आकार-(के + 1) ग्राफ अक्सर होता है, इसकी आवृत्ति की ऊपरी सीमा प्राप्त करने के लिए इसके सभी संबंधित आकार-के सबग्राफ की जांच करनी चाहिए। इस प्रकार, किसी भी आकार-(के +1) सबग्राफ को खनन करने से पहले, एप्रीओरी-जैसे दृष्टिकोण को आमतौर पर आकार-के सबग्राफ के खनन को पूरा करना होता है।

इसलिए, Apriori जैसे दृष्टिकोण के लिए BFS आवश्यक है। इसके विपरीत, पैटर्न-विकास पद्धति अपनी खोज पद्धति के संबंध में अधिक गतिशील है। यह चौड़ाई-प्रथम खोज के साथ-साथ गहराई-प्रथम खोज (डीएफएस) का उपयोग कर सकता है, जिसमें से बाद में कम मेमोरी की खपत होती है।

पैटर्न ग्रोथ ग्राफ सरल है, लेकिन कुशल नहीं है। एक ग्राफ के विस्तार की अक्षमता पर अड़चन है। एक ही ग्राफ कई बार पाया जा सकता है। उदाहरण के लिए, n भिन्न (n - 1)-किनारे ग्राफ़ मौजूद हो सकते हैं जिन्हें समान n-किनारे वाले ग्राफ़ तक बढ़ाया जा सकता है। एक ही ग्राफ की बार-बार खोज कम्प्यूटेशनल रूप से अक्षम है। हम उस ग्राफ़ को कहते हैं जिसे दूसरी बार डुप्लीकेट ग्राफ़ के रूप में खोजा जाता है।

यह डुप्लिकेट ग्राफ़ की पीढ़ी को कम कर सकता है, प्रत्येक बार-बार होने वाले ग्राफ़ को यथासंभव रूढ़िवादी रूप से बढ़ाया जाना चाहिए। यह सिद्धांत कई नए एल्गोरिदम के डिजाइन की ओर जाता है। स्पैनिंग एल्गोरिदम को डुप्लिकेट ग्राफ़ की पीढ़ी को कम करने के लिए डिज़ाइन किया गया है। इसे डुप्लिकेट डिटेक्शन के लिए पहले से खोजे गए बार-बार ग्राफ़ खोजने की आवश्यकता नहीं है। यह किसी भी डुप्लीकेट ग्राफ़ का विस्तार नहीं करता है, फिर भी लगातार ग्राफ़ के पूरे सेट की खोज की गारंटी देता है।


  1. मैं अपने डेटा का बैकअप कैसे ले सकता हूं?

    आज की आईटी दुनिया में एक व्यापक बैकअप रणनीति होना आवश्यक है। डेटा खो जाने के कई तरीकों के साथ, यह समझना महत्वपूर्ण है कि अपने डेटा का सफलतापूर्वक बैकअप कैसे लिया जाए ताकि यह सुनिश्चित हो सके कि आपको असहज स्थिति का सामना न करना पड़े। तो, आप अपने डेटा का बैकअप कैसे ले सकते हैं? डेटा हानि साइबर हमले,

  1. Google डिस्कवर फ़ीड क्या है और आप इसे कैसे प्रबंधित कर सकते हैं?

    Google की कई सुविधाओं का उपयोग हर उस व्यक्ति द्वारा किया जा रहा है जिसके पास Android फ़ोन है और वे लोग जो iPhone पर Google ऐप्स और सेवाओं का उपयोग करते हैं। हालाँकि, इनमें से कुछ विशेषताओं के बारे में बहुतों को पता नहीं है। ऐसी ही एक विशेषता है Google डिस्कवर फ़ीड जो अनजाने में सभी द्वारा उपयोग की ज

  1. एक एंटीवायरस पीसी को कैसे गति दे सकता है?

    कई उपयोगकर्ताओं को यह गलतफहमी होती है कि एक एंटीवायरस उनके पीसी को धीमा कर सकता है। हां, ऐसे कुछ उदाहरण हो सकते हैं जब एक एंटीवायरस आपके पीसी को धीमा कर सकता है जिसे हम बाद में इस ब्लॉग में कवर करेंगे। भले ही एक एंटीवायरस आपके पीसी को धीमा कर देता है (थोड़ा सा), यह ऐसा करता है ताकि यह आपके पीसी को ख