भौतिक या अमूर्त वस्तुओं के समूह को समान वस्तुओं के वर्गों में संयोजित करने की प्रक्रिया को क्लस्टरिंग के रूप में जाना जाता है। क्लस्टर डेटा ऑब्जेक्ट्स का एक सेट है जो एक ही क्लस्टर के भीतर एक दूसरे के समान होते हैं और अन्य क्लस्टर में ऑब्जेक्ट्स से अलग होते हैं। डेटा ऑब्जेक्ट्स के एक समूह को सामूहिक रूप से कई अनुप्रयोगों में एक समूह के रूप में माना जा सकता है। क्लस्टर विश्लेषण एक आवश्यक मानवीय गतिविधि है।
क्लस्टर विश्लेषण का उपयोग इन अभिलेखों पर किए गए विभिन्न उपायों के आधार पर समान अभिलेखों के समूह या समूह बनाने के लिए किया जाता है। मुख्य डिजाइन समूहों को उन तरीकों से परिभाषित करना है जो विश्लेषण के उद्देश्य के लिए उपयोगी हो सकते हैं। इस डेटा का उपयोग कई क्षेत्रों में किया गया है, जैसे कि खगोल विज्ञान, पुरातत्व, चिकित्सा, रसायन विज्ञान, शिक्षा, मनोविज्ञान, भाषा विज्ञान और समाजशास्त्र।
क्लस्टरिंग के कुछ उदाहरण हैं जो इस प्रकार हैं -
जीव विज्ञान -जीवविज्ञानियों ने साम्राज्य, संघ, वर्ग, श्रृंखला, परिवार, जीनस और प्रजातियों जैसी सभी जीवित चीजों की एक वर्गीकरण (एक श्रेणीबद्ध वर्गीकरण) तैयार करने में कई साल बिताए हैं। इसलिए, यह आश्चर्य की बात नहीं है कि क्लस्टर विश्लेषण में कुछ शुरुआती काम ने संख्यात्मक वर्गीकरण का एक अनुशासन तैयार करने की मांग की जो इस तरह के वर्गीकरण ढांचे को ढूंढ सके।
इसके अलावा, जीवविज्ञानियों ने बड़ी मात्रा में आनुवंशिक डेटा का विश्लेषण करने के लिए क्लस्टरिंग का उपयोग किया है जो सुलभ हैं। उदाहरण के लिए, क्लस्टरिंग का उपयोग उन जीनों के समूहों को खोजने के लिए किया गया है जिनके समान कार्य हैं।
सूचना पुनर्प्राप्ति - वर्ल्ड वाइड वेब में अरबों वेब पेज शामिल हैं, और एक खोज इंजन के लिए एक क्वेरी के परिणाम लाखों पेजों को पुनर्स्थापित कर सकते हैं। क्लस्टरिंग का उपयोग इन खोज परिणामों को कुछ समूहों में समूहित करने के लिए किया जा सकता है, जिनमें से प्रत्येक क्वेरी का एक विशिष्ट तत्व लेता है।
उदाहरण के लिए, "मूवी" की एक क्वेरी समीक्षा, ट्रेलर, सितारों और थिएटर सहित श्रेणियों में संयुक्त वेब पेजों को पुनर्स्थापित कर सकती है। प्रत्येक क्लस्टर को उपश्रेणियों (उपसमूहों) में विभाजित किया जा सकता है, जिससे एक पदानुक्रमित संरचना बनती है जो उपयोगकर्ता के क्वेरी परिणामों के विश्लेषण का समर्थन करती है।
जलवायु - यह पृथ्वी के वातावरण और महासागर में आवश्यक खोज पैटर्न के बारे में सीख सकता है। ध्रुवीय क्षेत्रों और समुद्र के उन क्षेत्रों के वायुमंडलीय दबाव में पैटर्न की खोज के लिए क्लस्टर विश्लेषण का उपयोग किया गया है जिनका भूमि जलवायु पर एक आवश्यक प्रभाव पड़ता है।
मनोविज्ञान और चिकित्सा - एक बीमारी या स्थिति में अक्सर कई बदलाव होते हैं, और इन कई उपश्रेणियों को पहचानने के लिए क्लस्टर अध्ययन का उपयोग किया जा सकता है। उदाहरण के लिए, क्लस्टरिंग का उपयोग कई प्रकार के अवसाद की पहचान करने के लिए किया जा सकता है। किसी बीमारी के स्थानिक या लौकिक आवंटन में पैटर्न की पहचान करने के लिए क्लस्टर विश्लेषण का भी उपयोग किया जाता है।
व्यवसाय - व्यवसाय वर्तमान और संभावित उपयोगकर्ताओं पर भारी मात्रा में डेटा एकत्र करते हैं। यह आम तौर पर अधिक विश्लेषण और मार्केटिंग इवेंट के लिए उपयोगकर्ताओं को कम संख्या में टीमों में विभाजित करने के लिए उपयोग किया जाता है।