भौतिक या अमूर्त वस्तुओं के समूह को समान वस्तुओं के वर्गों में संयोजित करने की प्रक्रिया को क्लस्टरिंग के रूप में जाना जाता है। क्लस्टर डेटा ऑब्जेक्ट्स का एक सेट है जो एक ही क्लस्टर के भीतर एक दूसरे के समान होते हैं और अन्य क्लस्टर में ऑब्जेक्ट्स से अलग होते हैं। डेटा ऑब्जेक्ट्स के समूह को सामूहिक रूप से कई अनुप्रयोगों में एक समूह के रूप में माना जा सकता है। क्लस्टर विश्लेषण एक आवश्यक मानवीय गतिविधि है।
क्लस्टर विश्लेषण का उपयोग इन अभिलेखों पर किए गए विभिन्न उपायों के आधार पर समान अभिलेखों के समूह या समूह बनाने के लिए किया जाता है। मुख्य डिजाइन समूहों को उन तरीकों से परिभाषित करना है जो विश्लेषण के उद्देश्य के लिए उपयोगी हो सकते हैं। इस डेटा का उपयोग कई क्षेत्रों में किया गया है, जैसे कि खगोल विज्ञान, पुरातत्व, चिकित्सा, रसायन विज्ञान, शिक्षा, मनोविज्ञान, भाषा विज्ञान और समाजशास्त्र।
विपणन में क्लस्टर विश्लेषण का एक प्रसिद्ध उपयोग बाजार विभाजन के लिए है - उपयोगकर्ताओं को जनसांख्यिकीय और लेनदेन इतिहास डेटा के आधार पर खंडित किया जाता है, और विपणन तकनीकों को प्रत्येक खंड के लिए तैयार किया जाता है।
एक अन्य शब्द बाजार संरचना विश्लेषण के लिए है जो समानता के प्रतिस्पर्धी उपायों के अनुसार समान उत्पादों की टीमों की पहचान करता है। मार्केटिंग और राजनीतिक पूर्वानुमान में, यू.एस. पोस्टल ज़िप कोड का उपयोग करके पड़ोस के क्लस्टरिंग का उपयोग पड़ोस को जीवनशैली के आधार पर समूहबद्ध करने के लिए किया गया है।
वित्त में, क्लस्टर विश्लेषण का उपयोग संतुलित पोर्टफोलियो बनाने के लिए किया जा सकता है - कई निवेश अवसरों (जैसे, स्टॉक) पर डेटा को देखते हुए, रिटर्न (दैनिक, साप्ताहिक या मासिक), अस्थिरता, बीटा, और सहित वित्तीय प्रदर्शन चर के आधार पर क्लस्टर मिल सकते हैं। उद्योग और बाजार पूंजीकरण सहित अन्य विशेषताएं। एकाधिक समूहों से प्रतिभूतियों का चयन एक संतुलित पोर्टफोलियो बनाने में मदद कर सकता है।
वित्त में क्लस्टर विश्लेषण का एक और ऑपरेशन बाजार विश्लेषण के लिए है। किसी दिए गए उद्योग के लिए, यह विकास दर, लाभप्रदता, उद्योग के आकार, उत्पाद श्रेणी और कई अंतरराष्ट्रीय बाजारों में उपस्थिति जैसे उपायों के आधार पर समान फर्मों की टीमों को खोजने में रुचि रखता है। फिर इन टीमों का विश्लेषण बाजार संरचना को जानने के लिए किया जा सकता है और यह निर्णय लेने के लिए किया जा सकता है, उदाहरण के लिए, कौन एक प्रतियोगी है।
बड़ी मात्रा में डेटा के लिए क्लस्टर विश्लेषण का उपयोग किया जा सकता है। उदाहरण के लिए, इंटरनेट खोज इंजन उपयोगकर्ता द्वारा सबमिट की गई क्वेरी को क्लस्टर करने के लिए क्लस्टरिंग विधियों का उपयोग करते हैं। फिर इनका उपयोग खोज एल्गोरिथम विकसित करने के लिए किया जा सकता है।
आम तौर पर, क्लस्टर के लिए उपयोग किया जाने वाला मूल डेटा विभिन्न चरों पर माप की एक तालिका होती है, जहां प्रत्येक कॉलम एक चर को परिभाषित करता है और एक पंक्ति एक रिकॉर्ड को परिभाषित करती है। इसका उद्देश्य डेटा के समूह बनाना है ताकि समान रिकॉर्ड एक ही समूह में हों। क्लस्टर की संख्या पूर्व-निर्दिष्ट या डेटा से तय की जा सकती है।