क्लस्टर विश्लेषण एक आवश्यक मानवीय गतिविधि है। क्लस्टर विश्लेषण का उपयोग इन अभिलेखों पर किए गए विभिन्न उपायों के आधार पर समान अभिलेखों के समूह या समूह बनाने के लिए किया जाता है। मुख्य डिजाइन समूहों को उन तरीकों से परिभाषित करना है जो विश्लेषण के उद्देश्य के लिए उपयोगी हो सकते हैं। इस डेटा का उपयोग कई क्षेत्रों में किया गया है, जैसे कि खगोल विज्ञान, पुरातत्व, चिकित्सा, रसायन विज्ञान, शिक्षा, मनोविज्ञान, भाषा विज्ञान और समाजशास्त्र।
क्लस्टर विश्लेषण आंकड़ों की एक शाखा है जिसका कई वर्षों से व्यापक रूप से अध्ययन किया गया है। इस तकनीक का उपयोग करने का लाभ यह है कि किसी भी पृष्ठभूमि ज्ञान, जैसे कि अवधारणा पदानुक्रम का उपयोग किए बिना दिलचस्प संरचनाओं या समूहों को सीधे डेटा से खोजा जा सकता है।
PAM या CLARA जैसे आँकड़ों में उपयोग किए जाने वाले क्लस्टरिंग एल्गोरिदम को कम्प्यूटेशनल जटिलता की दृष्टि से अक्षम बताया गया है। दक्षता संबंधी चिंता के अनुसार, क्लस्टर विश्लेषण के लिए CLARANS (रैंडमाइज्ड सर्च पर आधारित क्लस्टरिंग लार्ज एप्लिकेशन) नामक एक नया एल्गोरिथम विकसित किया गया था।
विपणन में क्लस्टर विश्लेषण का एक प्रसिद्ध उपयोग बाजार विभाजन के लिए है - उपयोगकर्ताओं को जनसांख्यिकीय और लेनदेन इतिहास डेटा के आधार पर खंडित किया जाता है, और विपणन तकनीकों को प्रत्येक खंड के लिए तैयार किया जाता है।
एक अन्य शब्द बाजार संरचना विश्लेषण के लिए है जो समानता के प्रतिस्पर्धी उपायों के अनुसार समान उत्पादों की टीमों की पहचान करता है। मार्केटिंग और राजनीतिक पूर्वानुमान में, यू.एस. पोस्टल ज़िप कोड का उपयोग करके पड़ोस के क्लस्टरिंग का उपयोग पड़ोस को जीवनशैली के आधार पर समूहबद्ध करने के लिए किया गया है।
वित्त में, क्लस्टर विश्लेषण का उपयोग संतुलित पोर्टफोलियो बनाने के लिए किया जा सकता है - स्टॉक जैसे कई निवेश अवसरों पर डेटा दिया गया है। यह उद्योग और बाजार पूंजीकरण सहित दैनिक, साप्ताहिक, या मासिक, अस्थिरता, बीटा, आदि जैसे रिटर्न सहित वित्तीय प्रदर्शन चर के आधार पर समूहों की खोज कर सकता है।
वित्त में क्लस्टर विश्लेषण का एक और ऑपरेशन बाजार विश्लेषण के लिए है। किसी दिए गए उद्योग के लिए, यह विकास दर, लाभप्रदता, उद्योग के आकार, उत्पाद श्रेणी और कई अंतरराष्ट्रीय बाजारों में उपस्थिति जैसे उपायों के आधार पर समान फर्मों की टीमों को खोजने में रुचि रखता है। फिर इन टीमों का विश्लेषण बाजार संरचना को जानने के लिए किया जा सकता है और यह निर्णय लेने के लिए किया जा सकता है, उदाहरण के लिए, कौन एक प्रतियोगी है।
बड़ी मात्रा में डेटा के लिए क्लस्टर विश्लेषण का उपयोग किया जा सकता है। उदाहरण के लिए, इंटरनेट खोज इंजन उपयोगकर्ता द्वारा सबमिट की गई क्वेरी को क्लस्टर करने के लिए क्लस्टरिंग विधियों का उपयोग करते हैं। फिर इनका उपयोग खोज एल्गोरिथम विकसित करने के लिए किया जा सकता है।
आम तौर पर, क्लस्टर के लिए उपयोग किया जाने वाला मूल डेटा विभिन्न चरों पर माप की एक तालिका होती है, जहां प्रत्येक कॉलम एक चर को परिभाषित करता है और एक पंक्ति एक रिकॉर्ड को परिभाषित करती है। इसका उद्देश्य डेटा के समूह बनाना है ताकि समान रिकॉर्ड एक ही समूह में हों। क्लस्टर की संख्या पूर्व-निर्दिष्ट या डेटा से तय की जा सकती है।