Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

एग्लोमेरेटिव क्लस्टरिंग एल्गोरिथम क्या है?

<घंटा/>

एग्लोमेरेटिव क्लस्टरिंग एक बॉटम-अप क्लस्टरिंग विधि है जहां क्लस्टर्स में सबक्लस्टर होते हैं, जो बदले में सब-क्लस्टर्स आदि होते हैं। यह प्रत्येक ऑब्जेक्ट को अपने क्लस्टर में रखकर शुरू कर सकता है और फिर इन एटॉमिक क्लस्टर्स को उच्च और उच्च क्लस्टर्स में तब तक मिला सकता है जब तक कि सभी ऑब्जेक्ट न हो जाएं। एक व्यक्तिगत क्लस्टर में या जब तक इसे निश्चित समाप्ति की स्थिति की आवश्यकता न हो। इस प्रकार के लिए उपयोग की जाने वाली कुछ पदानुक्रमित क्लस्टरिंग विधियां। केवल उनके बीच-क्लस्टर समानता के विवरण में विशिष्ट।

उदाहरण के लिए, एजीएनईएस (एग्लोमेरेटिव नेस्टिंग) नामक एक विधि को सिंगल-लिंक तकनीकों की आवश्यकता होती है और निम्नानुसार संचालित होती है। विचार करें कि आयत में रखी गई वस्तुओं के समूह हैं। प्रारंभ में, प्रत्येक वस्तु अपने स्वयं के समूह में स्थित होती है। इसलिए कुछ सिद्धांत के अनुसार क्लस्टर को चरण-दर-चरण मर्ज किया जाता है जैसे क्लस्टर में निकटतम वस्तुओं के बीच न्यूनतम यूक्लिडियन दूरी के साथ क्लस्टर का संयोजन।

क्लस्टरिंग के लिए K-मीन्स मेथड एक स्थिर संख्या में क्लस्टर्स के साथ शुरू होता है और सभी डेटा को ठीक उसी मल्टीपल क्लस्टर्स में आवंटित करता है। दृष्टिकोण का एक अन्य वर्ग समूह द्वारा संचालित होता है। ये दृष्टिकोण प्रत्येक डेटा बिंदु के साथ अपना स्वयं का क्लस्टर बनाने के साथ शुरू होता है और धीरे-धीरे उन्हें उच्च और उच्च क्लस्टर में संयोजित करता है जब तक कि सभी बिंदु एक बड़े क्लस्टर में एकत्रित नहीं हो जाते।

पहली प्रक्रिया एक समानता मैट्रिक्स का उत्पादन करना है। समानता मैट्रिक्स कुछ जोड़ी-वार दूरियों या समूहों के बीच समानता की डिग्री की एक तालिका है। मूल रूप से, समानता मैट्रिक्स में रिकॉर्ड के एकल जोड़े के बीच जोड़ी-वार दूरी शामिल है।

रिकॉर्ड के बीच समानता के कई उपाय हैं, जैसे यूक्लिडियन दूरी, वैक्टर के बीच का कोण, और गैर-कनेक्टिंग श्रेणीबद्ध क्षेत्रों से जुड़ने का अनुपात।

ऐसा लगता है कि एन डेटा बिंदुओं के लिए एन मूल समूहों के साथ, दूरी तालिका बनाने के लिए एन 2 माप गणनाओं की आवश्यकता होती है। यदि समानता माप एक वास्तविक दूरी मीट्रिक है, तो केवल आधा आवश्यक है क्योंकि कुछ वास्तविक दूरी मीट्रिक दूरी (एक्स, वाई) =दूरी (वाई, एक्स) विधि का पालन करते हैं।

गणित में, समान आव्यूह निम्न त्रिभुजाकार होता है। अगली प्रक्रिया उसी मैट्रिक्स में सबसे छोटे मान की खोज करना है। यह उन दो समूहों को पहचानता है जो एक दूसरे के समान हैं। यह इन दो क्लस्टरों को एक नए में जोड़ सकता है और पैरेंट क्लस्टर का वर्णन करने वाली दो पंक्तियों को एक नई पंक्ति के साथ पुनर्स्थापित करके समानता मैट्रिक्स को ताज़ा कर सकता है जो मर्ज किए गए क्लस्टर और शेष क्लस्टर के बीच की दूरी को परिभाषित करता है।

एक ही मैट्रिक्स में अब N-1 क्लस्टर और N-1 पंक्तियाँ हैं। यह मर्ज चरण N - 1 बार पुनरावृति कर सकता है, इसलिए कुछ डेटा समान बड़े क्लस्टर से संबंधित हैं। प्रत्येक पुनरावृत्ति पहचानती है कि कौन से क्लस्टर संयुक्त थे और उनके बीच की दूरी। यह जानकारी निर्धारित कर सकती है कि किस क्लस्टरिंग विधि का उपयोग करना है।


  1. रॉक क्या है?

    ROCK,लिंक का उपयोग करके मजबूत क्लस्टरिंग के लिए खड़ा है। यह एक पदानुक्रमित क्लस्टरिंग एल्गोरिथ्म है जो श्रेणीबद्ध विशेषताओं वाले डेटा के लिए लिंक की अवधारणा (दो वस्तुओं के बीच आम पड़ोसियों की संख्या) का विश्लेषण करता है। यह प्रदर्शित करता है कि श्रेणीबद्ध जानकारी को क्लस्टर करते समय इस तरह की दूरी क

  1. PROCLUS क्या है?

    PROCLUS,प्रोजेक्टेड क्लस्टरिंग के लिए खड़ा है। यह एक सामान्य आयाम-कमी सबस्पेस क्लस्टरिंग तकनीक है। यही है, व्यक्तिगत-आयामी रिक्त स्थान से शुरू करने के बजाय, यह उच्च-आयामी विशेषता क्षेत्र में समूहों के मूल सन्निकटन को खोजने से शुरू होता है। प्रत्येक आयाम को प्रत्येक क्लस्टर के लिए एक भार बनाया जाता ह

  1. मल्टीरिलेशनल क्लस्टरिंग क्या है?

    मल्टीरिलेशनल क्लस्टरिंग डेटा ऑब्जेक्ट्स को क्लस्टर के समूह में विभाजित करने का चरण है, जो कई संबंधों में डेटा का उपयोग करके उनकी समानता पर निर्भर करता है। क्रॉसक्लस उपयोगकर्ता मार्गदर्शन के साथ क्रॉस-रिलेशनल क्लस्टरिंग का प्रतिनिधित्व करता है। यह मल्टीरिलेशनल क्लस्टरिंग के लिए एक एल्गोरिथम है जो विश