एग्लोमेरेटिव क्लस्टरिंग एक बॉटम-अप क्लस्टरिंग विधि है जहां क्लस्टर्स में सबक्लस्टर होते हैं, जो बदले में सब-क्लस्टर्स आदि होते हैं। यह प्रत्येक ऑब्जेक्ट को अपने क्लस्टर में रखकर शुरू कर सकता है और फिर इन एटॉमिक क्लस्टर्स को उच्च और उच्च क्लस्टर्स में तब तक मिला सकता है जब तक कि सभी ऑब्जेक्ट न हो जाएं। एक व्यक्तिगत क्लस्टर में या जब तक इसे निश्चित समाप्ति की स्थिति की आवश्यकता न हो। इस प्रकार के लिए उपयोग की जाने वाली कुछ पदानुक्रमित क्लस्टरिंग विधियां। केवल उनके बीच-क्लस्टर समानता के विवरण में विशिष्ट।
उदाहरण के लिए, एजीएनईएस (एग्लोमेरेटिव नेस्टिंग) नामक एक विधि को सिंगल-लिंक तकनीकों की आवश्यकता होती है और निम्नानुसार संचालित होती है। विचार करें कि आयत में रखी गई वस्तुओं के समूह हैं। प्रारंभ में, प्रत्येक वस्तु अपने स्वयं के समूह में स्थित होती है। इसलिए कुछ सिद्धांत के अनुसार क्लस्टर को चरण-दर-चरण मर्ज किया जाता है जैसे क्लस्टर में निकटतम वस्तुओं के बीच न्यूनतम यूक्लिडियन दूरी के साथ क्लस्टर का संयोजन।
क्लस्टरिंग के लिए K-मीन्स मेथड एक स्थिर संख्या में क्लस्टर्स के साथ शुरू होता है और सभी डेटा को ठीक उसी मल्टीपल क्लस्टर्स में आवंटित करता है। दृष्टिकोण का एक अन्य वर्ग समूह द्वारा संचालित होता है। ये दृष्टिकोण प्रत्येक डेटा बिंदु के साथ अपना स्वयं का क्लस्टर बनाने के साथ शुरू होता है और धीरे-धीरे उन्हें उच्च और उच्च क्लस्टर में संयोजित करता है जब तक कि सभी बिंदु एक बड़े क्लस्टर में एकत्रित नहीं हो जाते।
पहली प्रक्रिया एक समानता मैट्रिक्स का उत्पादन करना है। समानता मैट्रिक्स कुछ जोड़ी-वार दूरियों या समूहों के बीच समानता की डिग्री की एक तालिका है। मूल रूप से, समानता मैट्रिक्स में रिकॉर्ड के एकल जोड़े के बीच जोड़ी-वार दूरी शामिल है।
रिकॉर्ड के बीच समानता के कई उपाय हैं, जैसे यूक्लिडियन दूरी, वैक्टर के बीच का कोण, और गैर-कनेक्टिंग श्रेणीबद्ध क्षेत्रों से जुड़ने का अनुपात।
ऐसा लगता है कि एन डेटा बिंदुओं के लिए एन मूल समूहों के साथ, दूरी तालिका बनाने के लिए एन 2 माप गणनाओं की आवश्यकता होती है। यदि समानता माप एक वास्तविक दूरी मीट्रिक है, तो केवल आधा आवश्यक है क्योंकि कुछ वास्तविक दूरी मीट्रिक दूरी (एक्स, वाई) =दूरी (वाई, एक्स) विधि का पालन करते हैं।
गणित में, समान आव्यूह निम्न त्रिभुजाकार होता है। अगली प्रक्रिया उसी मैट्रिक्स में सबसे छोटे मान की खोज करना है। यह उन दो समूहों को पहचानता है जो एक दूसरे के समान हैं। यह इन दो क्लस्टरों को एक नए में जोड़ सकता है और पैरेंट क्लस्टर का वर्णन करने वाली दो पंक्तियों को एक नई पंक्ति के साथ पुनर्स्थापित करके समानता मैट्रिक्स को ताज़ा कर सकता है जो मर्ज किए गए क्लस्टर और शेष क्लस्टर के बीच की दूरी को परिभाषित करता है।
एक ही मैट्रिक्स में अब N-1 क्लस्टर और N-1 पंक्तियाँ हैं। यह मर्ज चरण N - 1 बार पुनरावृति कर सकता है, इसलिए कुछ डेटा समान बड़े क्लस्टर से संबंधित हैं। प्रत्येक पुनरावृत्ति पहचानती है कि कौन से क्लस्टर संयुक्त थे और उनके बीच की दूरी। यह जानकारी निर्धारित कर सकती है कि किस क्लस्टरिंग विधि का उपयोग करना है।