उप-स्थान खोज तकनीकों, सहसंबंध-आधारित क्लस्टरिंग तकनीकों और द्वि-क्लस्टरिंग तकनीकों सहित तीन प्रमुख समूहों में कई विधियों को वर्गीकृत किया गया है।
उप-स्थान खोज तकनीक - एक उप-स्थान खोज विधि समूहों के लिए कई उप-स्थानों की खोज करती है। इसलिए, क्लस्टर ऑब्जेक्ट्स का एक सबसेट है जो एक सबस्पेस में एक दूसरे के समान होता है। दूरी या घनत्व सहित पारंपरिक उपायों द्वारा समानता हासिल की जाती है।
उदाहरण के लिए, CLIQUE एल्गोरिदम एक सबस्पेस क्लस्टरिंग तकनीक है। यह उन उप-स्थानों में उप-स्थानों और समूहों को एक आयामी-बढ़ती श्रृंखला में निर्दिष्ट कर सकता है और उप-स्थानों को छांटने के लिए एंटीमोनोटोनिसिटी का उपयोग करता है जिसमें कोई क्लस्टर जारी नहीं रह सकता है। उप-स्थान खोज तकनीक के सामने एक बड़ी चुनौती यह है कि उप-स्थानों के अनुक्रम को प्रभावी ढंग से कैसे खोजा जाए।
दो प्रकार की विधियाँ इस प्रकार हैं -
-
बॉटम-अप विधि निम्न-आयामी उप-स्थानों से शुरू होती है और उच्च-आयामी उप-स्थानों की खोज तभी करती है जब उन बड़े-आयामी में क्लस्टर हो सकते हैं। खोज के लिए आवश्यक कई उच्च-आयामी उप-स्थानों को कम करने के लिए कई छंटाई दृष्टिकोणों का विश्लेषण किया जाता है। CLIQUE बॉटम-अप अप्रोच का एक उदाहरण है।
-
टॉप-डाउन विधि पूर्ण स्थान से शुरू होती है और छोटे और छोटे उप-स्थानों को पुनरावर्ती रूप से खोजती है। टॉप-डाउन विधियाँ तभी प्रभावी होती हैं, जब स्थानीयता की धारणा प्रभावित होती है, जिसके लिए क्लस्टर के उप-स्थान को स्थानीय पड़ोस द्वारा तय किया जा सकता है।
सहसंबंध आधारित क्लस्टरिंग विधियां - जबकि उप-स्थान खोज विधियां एक समानता वाले समूहों की खोज करती हैं जिनकी गणना पारंपरिक मीट्रिक जैसे दूरी या घनत्व का उपयोग करके की जाती है, सहसंबंध-आधारित विधियां ऐसे क्लस्टर ढूंढ सकती हैं जो उन्नत सहसंबंध मॉडल द्वारा दर्शाए जाते हैं।
एक पीसीए-आधारित दृष्टिकोण पहले नए, असंबद्ध आयामों के एक सेट को बदलने के लिए पीसीए (प्रिंसिपल कंपोनेंट्स एनालिसिस) का उपयोग करता है, और इसलिए नए स्थान या उसके उप-स्थानों में मेरा क्लस्टर। इसके अलावा पीसीए, अन्य अंतरिक्ष परिवर्तनों का उपयोग किया जा सकता है, जिसमें हफ़ ट्रांसफ़ॉर्म या फ्रैक्टल आयाम शामिल हैं।
बाइक्लस्टरिंग के तरीके - कुछ अनुप्रयोगों में, एक ही समय में वस्तुओं और विशेषताओं दोनों को क्लस्टर करना आवश्यक है। परिणामी समूहों को बाइक्लस्टर कहा जाता है और चार आवश्यकताओं को निम्नानुसार पूरा करते हैं -
-
यह केवल वस्तुओं का एक छोटा समूह है जो एक क्लस्टर में प्रदर्शन करता है।
-
क्लस्टर में केवल कुछ ही विशेषताएँ होती हैं।
-
एक वस्तु कई समूहों में भाग ले सकती है, या किसी क्लस्टर में संलग्न नहीं होती है।
-
एक विशेषता को कई समूहों में शामिल किया जा सकता है, या किसी क्लस्टर में शामिल नहीं किया जा सकता है।
जीन एक्सप्रेशन डेटा की खोज के लिए आवश्यकताओं को पूरा करने के लिए सबसे पहले बाइक्लस्टरिंग तकनीकों की सिफारिश की गई थी। एक जीन एक जीवित संरचना से उसके वंश में लक्षणों के पारित होने की एक प्रणाली है। आम तौर पर, एक जीन डीएनए के एक खंड पर बना होता है।
जीन सभी जीवित चीजों के लिए महत्वपूर्ण हैं क्योंकि वे कुछ प्रोटीन और कार्यात्मक आरएनए श्रृंखला को परिभाषित करते हैं। वे जीवित जीवों की कोशिकाओं के निर्माण और समर्थन के लिए डेटा को प्रभावित करते हैं और संतानों को आनुवंशिक लक्षण देते हैं।
एक जीनोटाइप एक कोशिका, एक जीव या एक व्यक्ति की आनुवंशिक संरचना है। फेनोटाइप एक जीव की स्पष्ट विशेषताएं हैं। जीन अभिव्यक्ति आनुवंशिकी में महत्वपूर्ण स्तर है जिसमें जीनोटाइप फेनोटाइप का कारण बनता है।