एक पदानुक्रमित क्लस्टरिंग दृष्टिकोण डेटा ऑब्जेक्ट को क्लस्टर के पेड़ में विलय करके संचालित होता है। पदानुक्रमित क्लस्टरिंग एल्गोरिदम टॉप-डाउन या बॉटम-अप हैं। सटीक पदानुक्रमित क्लस्टरिंग तकनीकों की विशेषता इसके समायोजन करने में कमी से उत्पन्न होती है क्योंकि विलय या विभाजन निर्णय पूरा हो जाता है।
पदानुक्रमित क्लस्टरिंग के विभिन्न तत्व हैं जो इस प्रकार हैं -
वैश्विक उद्देश्य कार्य का अभाव
सामूहिक पदानुक्रमित क्लस्टरिंग विधियाँ प्रत्येक चरण पर स्थानीय रूप से तय करने के लिए कई तत्वों का उपयोग करती हैं, कि किन समूहों को विलय किया जाना चाहिए (या विभाजनकारी दृष्टिकोणों के लिए विभाजित)।
यह विधि क्लस्टरिंग एल्गोरिदम उत्पन्न करती है जो जटिल संयोजन अनुकूलन समस्या को हल करने की कठिनाई को रोकती है।
विभिन्न क्लस्टर आकारों को संभालने की क्षमता
एग्लोमेरेटिव पदानुक्रमित क्लस्टरिंग का तत्व कि संयुक्त समूहों के समूह के सहयोगी आकारों पर कैसे विचार किया जाए। यह केवल उन निकटता योजनाओं को क्लस्टर करने के लिए उपयोग करता है जिनमें सेंट्रोइड, वार्ड और समूह औसत जैसे योग होते हैं।
भारित जैसी दो विधियाँ हैं, जो सभी समूहों को समान रूप से मानती हैं, और बिना भारित, जो प्रत्येक क्लस्टर में अंकों की संख्या को ध्यान में रखती हैं। भारित या अभारित की शब्दावली डेटा बिंदुओं को परिभाषित करती है, न कि समूहों को। दूसरे शब्दों में, असमान आकार के समूहों को समान रूप से अलग-अलग समूहों में बिंदुओं को कई भार प्रदान करते हैं, जबकि क्लस्टर आकार को खाते में बनाने से विभिन्न समूहों में समान भार मिलते हैं।
विलय के निर्णय अंतिम होते हैं
एग्लोमेरेटिव पदानुक्रमित क्लस्टरिंग एल्गोरिदम दो समूहों के संयोजन के बारे में अच्छे स्थानीय निर्णयों के निर्माण को प्रभावित करते हैं क्योंकि उन्हें सभी बिंदुओं की जोड़ीदार समानता के बारे में डेटा की आवश्यकता हो सकती है। चूंकि दो समूहों को मर्ज करने का निर्णय लिया जाता है, इसलिए इसे अगली बार पूर्ववत नहीं किया जा सकता है। यह विधि स्थानीय अनुकूलन तत्व को वैश्विक अनुकूलन मानदंड बनने से बचाती है।
उदाहरण के लिए, हालांकि के-साधनों से "न्यूनतम चुकता त्रुटि" मानदंड का उपयोग यह निर्धारित करने में किया जाता है कि वार्ड की विधि में कौन से क्लस्टर विलय करना है, प्रत्येक स्तर पर क्लस्टर कुल एसएसई से संबंधित स्थानीय मिनीमा को परिभाषित नहीं करते हैं। वास्तव में, क्लस्टर गतिशील नहीं होते हैं, इस अर्थ में कि एक क्लस्टर में एक बिंदु एक अलग क्लस्टर के केंद्रक के करीब हो सकता है, जो इसके हाल के क्लस्टर के केंद्रक के करीब है।
विलय की सीमा को दूर करने की कोशिश करने वाली कुछ विधियां अंतिम हैं। एक विधि विश्वव्यापी उद्देश्य फ़ंक्शन को बढ़ाने के लिए पेड़ की शाखाओं को संशोधित करके पदानुक्रमित क्लस्टरिंग प्रस्तुत करने का प्रयास करती है। एक अन्य विधि के लिए कुछ छोटे समूहों का निर्माण करने के लिए Kmeans सहित एक विभाजनात्मक क्लस्टरिंग तकनीक की आवश्यकता होती है और फिर इन छोटे समूहों को प्रारंभिक बिंदु के रूप में उपयोग करके श्रेणीबद्ध क्लस्टरिंग को लागू किया जाता है।