वेवक्लस्टर एक बहु-रिज़ॉल्यूशन क्लस्टरिंग एल्गोरिथम है जो पहले डेटा स्पेस पर एक बहुआयामी ग्रिड आर्किटेक्चर लगाकर रिकॉर्ड्स को सारांशित करता है। यह मूल फीचर स्पेस को बदलने के लिए वेवलेट ट्रांसफॉर्मेशन का उपयोग कर सकता है, ट्रांसफॉर्म किए गए स्पेस में डेंसडोमेन ढूंढ सकता है।
इस पद्धति में, प्रत्येक ग्रिड सेल उन बिंदुओं के समूह के डेटा को सारांशित करता है जो सेल में मैप करते हैं। यह सारांश डेटा आम तौर पर बहु-रिज़ॉल्यूशन वेवलेट ट्रांसफ़ॉर्म और बाद के क्लस्टर विश्लेषण द्वारा उपयोग के लिए मुख्य मेमोरी में फिट होता है।
वेवलेट ट्रांसफॉर्म एक सिग्नल प्रोसेसिंग दृष्टिकोण है जो एक सिग्नल को कई फ़्रीक्वेंसी सबबैंड में विघटित करता है। तरंगिका मॉडल का उपयोग d-आयामी संकेतों के लिए एक-आयामी तरंगिका परिवर्तन d बार का उपयोग करके किया जा सकता है। वेवलेट ट्रांसफॉर्म को लागू करने में, रिज़ॉल्यूशन के कई स्तरों पर वस्तुओं के बीच सापेक्ष दूरी को बनाए रखने के लिए डेटा को बदल दिया जाता है। यह डेटा में प्राकृतिक समूहों को अधिक पता लगाने योग्य बनने में सक्षम बनाता है। नए डोमेन में सघन क्षेत्रों की खोज करके समूहों को पहचाना जा सकता है।
तरंगिका परिवर्तन का लाभ इस प्रकार है -
यह अनियंत्रित क्लस्टरिंग प्रदान करता है:इसे टोपी के आकार के फिल्टर की आवश्यकता होती है जो क्लस्टर सीमाओं के बाहर कमजोर डेटा को दबाते हुए उन क्षेत्रों पर जोर देते हैं जहां पॉइंट क्लस्टर होते हैं।
-
यह बिना पर्यवेक्षित क्लस्टरिंग प्रदान करता है - इसे टोपी के आकार के फिल्टर की जरूरत होती है जो क्लस्टर सीमाओं के बाहर कमजोर डेटा को दबाते हुए, उन क्षेत्रों पर जोर देते हैं जहां बिंदु क्लस्टर होते हैं।
इसलिए, प्रारंभिक फीचर स्पेस में घने क्षेत्र आसन्न बिंदुओं के लिए आकर्षित करने वाले के रूप में और उन बिंदुओं के लिए अवरोधक के रूप में कार्य करते हैं जो आगे हैं। यह परिभाषित करता है कि डेटा में क्लस्टर स्वचालित रूप से बाहर खड़े होते हैं और उनके आस-पास के क्षेत्रों को "साफ़" करते हैं। इसलिए, एक और लाभ यह है कि तरंगिका परिवर्तन स्वचालित रूप से आउटलेर्स को समाप्त कर सकता है।
-
तरंगिका रूपांतरण की बहु-रिज़ॉल्यूशन विशेषताएं सटीकता के कई स्तरों पर समूहों का पता लगाने में सहायता कर सकती हैं।
-
वेवलेट-आधारित क्लस्टरिंग ओ (एन) की कम्प्यूटेशनल जटिलता के साथ बहुत तेज है, जहां एन डेटाबेस में ऑब्जेक्ट्स की संख्या है। एल्गोरिथम कार्यान्वयन समानांतर बनाया जा सकता है।
-
वेवक्लस्टर एक ग्रिड-आधारित और घनत्व-आधारित एल्गोरिथम है - यह एक अच्छे क्लस्टरिंग एल्गोरिथम की कई आवश्यकताओं के अनुरूप है - यह बड़े डेटा सेट को कुशलता से प्रबंधित करता है, मनमाने आकार वाले क्लस्टर ढूंढता है, आउटलेर्स को सफलतापूर्वक प्रबंधित करता है, इनपुट के क्रम के प्रति असंवेदनशील है, और इसकी संख्या सहित इनपुट मापदंडों की परिभाषा की आवश्यकता नहीं है क्लस्टर या आस-पड़ोस का दायरा.
प्रारंभिक अध्ययनों में, वेवक्लस्टर को दक्षता और क्लस्टरिंग गुणवत्ता दोनों के मामले में बर्च, क्लैरन्स और डीबीएससीएएन से बेहतर प्रदर्शन करने के लिए खोजा गया था। अध्ययन ने वेवक्लस्टर की भी खोज की जो 20 आयामों तक डेटा को प्रबंधित करने में सक्षम है।