क्लस्टरिंग के विभिन्न तरीके हैं जो इस प्रकार हैं -
विभाजन के तरीके -एन ऑब्जेक्ट्स या डेटा टुपल्स के डेटाबेस को देखते हुए, एक विभाजन विधि जानकारी के k विभाजन को इकट्ठा करती है, जहां प्रत्येक विभाजन एक क्लस्टर को परिभाषित करता है, और k
प्रत्येक समूह में कम से कम एक वस्तु शामिल होनी चाहिए।
प्रत्येक वस्तु को सटीक रूप से एक समूह पर लागू होना चाहिए।
k को देखते हुए, निर्माण के लिए विभाजन की संख्या, एक विभाजन विधि एक प्रारंभिक विभाजन बनाती है। इसके बाद यह एक पुनरावृत्त स्थानांतरण विधि का उपयोग करता है जो वस्तुओं को एक समूह से दूसरे समूह में परिवर्तित करके विभाजन को बेहतर बनाने का प्रयास करता है।
अच्छे विभाजन का सामान्य मानदंड यह है कि एक ही क्लस्टर में वस्तुएं "करीबी" या एक-दूसरे से जुड़ी होती हैं, जबकि विभिन्न समूहों की वस्तुएं "दूर-दूर" या बहुत भिन्न होती हैं। विभाजन की गुणवत्ता निर्धारित करने के लिए कई प्रकार के अन्य मानदंड हैं।
पदानुक्रमित तरीके - एक पदानुक्रमित विधि डेटा ऑब्जेक्ट के दिए गए सेट का एक पदानुक्रमित अपघटन उत्पन्न करती है। एक पदानुक्रमित विधि को या तो समूहीय या विभाजनकारी के रूप में वर्गीकृत किया जा सकता है, यह इस बात पर निर्भर करता है कि पदानुक्रमित अपघटन कैसे उत्पन्न होता है। सामूहिक दृष्टिकोण को "बॉटम-अप" दृष्टिकोण के रूप में भी जाना जाता है। यह एक स्वतंत्र समूह बनाने वाली प्रत्येक वस्तु से शुरू हो सकता है। यह क्रमिक रूप से वस्तुओं या समूहों को एक दूसरे के करीब जोड़ता है, जब तक कि सभी समूह एक (पदानुक्रम का सबसे ऊपरी स्तर) में संयुक्त नहीं हो जाते, या जब तक समाप्ति की स्थिति नहीं हो जाती। विभाजनकारी दृष्टिकोण को "टॉप-डाउन" दृष्टिकोण के रूप में भी जाना जाता है। यह एक ही क्लस्टर में सभी वस्तुओं से शुरू हो सकता है। प्रत्येक क्रमिक पुनरावृत्ति में, एक क्लस्टर को छोटे समूहों में विभाजित किया जाता है, अंत में, प्रत्येक वस्तु एक क्लस्टर में होती है, या जब तक समाप्ति की स्थिति नहीं होती है। घनत्व-आधारित तरीके -कुछ विभाजन के तरीके वस्तुओं के बीच की दूरी के आधार पर वस्तुओं को क्लस्टर करते हैं। इस तरह की विधियाँ केवल गोलाकार आकार के समूहों की खोज कर सकती हैं और मनमाने आकार के समूहों को खोजने में कठिनाई का सामना कर सकती हैं। अन्य क्लस्टरिंग विधियों को घनत्व की अवधारणा के आधार पर बनाया गया है। DBSCAN एक विशिष्ट घनत्व-आधारित विधि है जो घनत्व सीमा के अनुसार समूहों को बढ़ाती है। ऑप्टिक्स एक घनत्व-आधारित विधि है जो स्वचालित और इंटरैक्टिव क्लस्टर विश्लेषण के लिए संवर्धित क्लस्टरिंग क्रम का मूल्यांकन करती है।
ग्रिड-आधारित तरीके - ग्रिड-आधारित विधियां ऑब्जेक्ट स्पेस को एक सीमित संख्या में कोशिकाओं में परिमाणित करती हैं जो ग्रिड आर्किटेक्चर बनाती हैं। कुछ क्लस्टरिंग ऑपरेशन ग्रिड आर्किटेक्चर (अर्थात परिमाणित स्थान पर) पर कार्यान्वित किए जाते हैं। इस दृष्टिकोण का लाभ इसका त्वरित प्रसंस्करण समय है जो आम तौर पर डेटा ऑब्जेक्ट्स की संख्या से स्वतंत्र होता है, और केवल परिमाणित स्थान में प्रत्येक आयाम में कोशिकाओं की संख्या पर निर्भर करता है। स्टिंग ग्रिड-आधारित पद्धति का एक उदाहरण है। CLIQUE और Wave-Cluster दो क्लस्टरिंग एल्गोरिदम हैं जो ग्रिड-आधारित और घनत्व-आधारित दोनों हैं। मॉडल-आधारित तरीके - मॉडल-आधारित विधियां प्रत्येक क्लस्टर के लिए एक मॉडल की परिकल्पना करती हैं और दिए गए मॉडल के लिए रिकॉर्ड के सर्वोत्तम फिट की खोज करती हैं। एक मॉडल-आधारित एल्गोरिथ्म एक घनत्व फ़ंक्शन बनाकर क्लस्टर का पता लगा सकता है जो डेटा बिंदुओं के स्थानिक वितरण को दर्शाता है। यह मानक आँकड़ों के आधार पर समूहों की संख्या को स्वचालित रूप से तय करने, "शोर" या आउटलेयर को ध्यान में रखते हुए और इस प्रकार मजबूत क्लस्टरिंग विधियों को उत्पन्न करने की एक विधि की ओर ले जाता है।