एक पदानुक्रमित क्लस्टरिंग तकनीक डेटा ऑब्जेक्ट्स को क्लस्टर के पेड़ में जोड़कर काम करती है। पदानुक्रमित क्लस्टरिंग एल्गोरिदम या तो ऊपर-नीचे या नीचे-ऊपर हैं। एक बार मर्ज या विभाजित निर्णय पूरा हो जाने पर समायोजन को लागू करने में असमर्थता के कारण एक प्रामाणिक पदानुक्रमित क्लस्टरिंग पद्धति की गुणवत्ता बिगड़ जाती है।
क्लस्टरों का विलय क्लस्टर्स के बीच की दूरी पर आधारित होता है। समूहों के बीच की दूरी के लिए व्यापक रूप से उपयोग किए जाने वाले उपाय इस प्रकार हैं, जहां mi क्लस्टर Ci के लिए माध्य है, ni, Ci में बिंदुओं की संख्या है, और |p - p'| दो बिंदुओं p और p' के बीच की दूरी है।
पदानुक्रमित क्लस्टरिंग विधियों के प्रकार
पदानुक्रमित क्लस्टरिंग विधियाँ दो प्रकार की होती हैं जो इस प्रकार हैं -
एग्लोमेरेटिव पदानुक्रमित क्लस्टरिंग (AHC) - एएचसी एक बॉटम-अप क्लस्टरिंग विधि है जहां क्लस्टर में उप-क्लस्टर होते हैं, जो बदले में उप-क्लस्टर होते हैं, आदि। यह प्रत्येक ऑब्जेक्ट को अपने क्लस्टर में ढूंढने से शुरू होता है और फिर इन परमाणु समूहों को बड़े और बड़े क्लस्टर में जोड़ता है जब तक कि सभी ऑब्जेक्ट्स एक ही क्लस्टर में हैं या जब तक यह विशिष्ट समाप्ति की स्थिति को पूरा नहीं करता है। अधिकांश पदानुक्रमित क्लस्टरिंग विधियाँ इस प्रकार पर लागू होती हैं। वे केवल बीच-क्लस्टर समानता की अपनी परिभाषा में भिन्न हैं।
उदाहरण के लिए, AGNES (एग्लोमेरेटिव नेस्टिंग) के रूप में जानी जाने वाली एक विधि, सिंगल-लिंक तकनीकों का उपयोग करती है और निम्नानुसार काम करती है। विचार करें कि आयत में स्थित वस्तुओं का समूह है। मूल रूप से, प्रत्येक वस्तु को अपने स्वयं के समूह में रखा जाता है। फिर समूहों को कुछ सिद्धांत के अनुसार चरण-दर-चरण संयोजित किया जाता है, जिसमें क्लस्टर में निकटतम वस्तुओं के बीच न्यूनतम यूक्लिडियन दूरी के साथ समूहों को मर्ज करना शामिल है।
विभाजनकारी पदानुक्रमित क्लस्टरिंग (डीएचसी) - डीएचसी एक टॉप-डाउन दृष्टिकोण है और आमतौर पर कम उपयोग किया जाता है। यह एग्लोमेरेटिव क्लस्टरिंग के समान तरीकों से काम करता है लेकिन विपरीत दिशा में। यह विधि सभी वस्तुओं सहित एक एकल क्लस्टर से शुरू होती है, और फिर परिणामी समूहों को क्रमिक रूप से विभाजित करती है जब तक कि केवल एकल वस्तुओं के समूह नहीं रहते हैं या जब तक यह विशिष्ट समाप्ति की स्थिति को संतुष्ट नहीं करता है, जिसमें वांछित संख्या में क्लस्टर शामिल हैं या दो निकटतम समूहों के बीच की दूरी एक से ऊपर है। विशिष्ट सीमा दूरी।
विभाजनकारी विधियां आम तौर पर सुलभ नहीं होती हैं और उच्च स्तर पर विभाजन का सही निर्णय लेने में कठिनाई के कारण शायद ही कभी इनका उपयोग किया जाता है। डायना (डिविसिया विश्लेषण) विभाजनकारी श्रेणीबद्ध क्लस्टरिंग पद्धति का एक उदाहरण है। यह विपरीत क्रम में काम करता है। मूल रूप से, सभी ऑब्जेक्ट एक क्लस्टर में स्थित हैं। इस प्रकार क्लस्टर को कुछ सिद्धांत के अनुसार विभाजित किया जाता है, जिसमें क्लस्टर में निकटतम पड़ोसी वस्तुओं के बीच अधिकतम यूक्लिडियन दूरी के अनुसार समूहों को विभाजित करना शामिल है।