CLIQUE उच्च-आयामी क्षेत्र में आयाम-विकास उपक्षेत्र क्लस्टरिंग के लिए अनुमानित पहला एल्गोरिदम था। डाइमेंशन-ग्रोथ सबएरिया क्लस्टरिंग में, क्लस्टरिंग प्रक्रिया सिंगल-डायमेंशनल सबस्पेस से शुरू होती है और ऊपर की तरफ हाई-डायमेंशनल तक बढ़ जाती है।
क्योंकि CLIQUE ग्रिड आर्किटेक्चर जैसे प्रत्येक आयाम को विभाजित करता है और यह तय करता है कि सेल इसमें शामिल कई बिंदुओं के आधार पर सघन है या नहीं। इसे घनत्व-आधारित और ग्रिड-आधारित क्लस्टरिंग दृष्टिकोणों के एकीकरण के रूप में देखा जा सकता है।
CLIQUE क्लस्टरिंग एल्गोरिथम के विचार इस प्रकार हैं -
-
बहुआयामी डेटा बिंदुओं के एक बड़े समूह को देखते हुए, डेटा क्षेत्र आमतौर पर डेटा बिंदुओं द्वारा समान रूप से संलग्न नहीं होता है। CLIQUE की क्लस्टरिंग अंतरिक्ष (या इकाइयों) में विरल और "भीड़" वाले क्षेत्रों को पहचानती है, जिससे डेटा सेट के पूर्ण वितरण पैटर्न का पता चलता है।
-
एक इकाई ठोस होती है यदि इसमें शामिल कुल डेटा बिंदुओं का अंश इनपुट मॉडल पैरामीटर से अधिक हो। CLIQUE में, एक क्लस्टर को लिंक की गई सघन इकाइयों के अधिकतम समूह के रूप में दर्शाया जाता है।
CLIQUE दो प्रक्रियाओं में बहुआयामी क्लस्टरिंग को लागू करता है जो इस प्रकार हैं - पहली प्रक्रिया में, CLIQUE d-आयामी डेटा क्षेत्र को गैर-अतिव्यापी आयताकार इकाइयों में विभाजित करता है, इनके बीच घनी इकाइयों को पहचानता है। यह प्रत्येक आयाम के लिए (1-डी में) पूरा किया गया है।
छात्र खोज स्थान की पहचान एसोसिएशन नियम खनन में प्रयुक्त एप्रीओरी संपत्ति पर निर्भर करती है। सामान्य तौर पर, संपत्ति खोज क्षेत्र में वस्तुओं के पूर्व ज्ञान का उपयोग करती है ताकि क्षेत्र के कुछ हिस्सों को काटा जा सके।
CLIQUE का गुण इस प्रकार है:यदि एक k-आयामी इकाई सघन है, इसलिए (k−1) -आयामी क्षेत्र में इसके अनुमान भी हैं। अर्थात्, एक k-आयामी छात्र सघन इकाई दी गई है, यदि वह अपनी (k−1) th प्रक्षेपण इकाइयों की जांच कर सकती है और कुछ ऐसी खोज कर सकती है जो सघन नहीं हैं, तो यह समझ सकता है कि kth आयामी इकाई सघन भी नहीं हो सकती है।
इस प्रकार, यह (k - 1) आयामी क्षेत्र में पाई जाने वाली सघन इकाइयों से k-आयामी क्षेत्र में संभावित या छात्र सघन इकाइयाँ बना सकता है। सामान्य तौर पर, खोजा गया परिणामी क्षेत्र मूल क्षेत्र की तुलना में बहुत छोटा होता है। क्लस्टर तय करने के लिए सघन इकाइयों की जांच की जाती है।
दूसरी प्रक्रिया में, CLIQUE प्रत्येक क्लस्टर के लिए निम्नानुसार एक न्यूनतम विवरण देता है। प्रत्येक क्लस्टर के लिए, यह अधिकतम क्षेत्र तय करता है जो जुड़े हुए घने इकाइयों के समूह को कवर करता है। यह प्रत्येक क्लस्टर के लिए एक न्यूनतम कवर (तर्क विवरण) तय करता है।
CLIQUE आवश्यक रूप से उन उप-स्थानों में मौजूद उच्च-घनत्व समूहों सहित सबसे बड़े आयामीता के उप-स्थानों की खोज करता है। यह इनपुट ऑब्जेक्ट्स की श्रृंखला के प्रति असंवेदनशील है और कुछ विहित डेटा वितरण का ढोंग नहीं करता है। यह इनपुट के आकार के साथ रैखिक रूप से मापता है और डेटा में कई आयामों को बढ़ाया जाता है क्योंकि इसमें सर्वोत्तम मापनीयता होती है।