कम आयामों में न्यूनतम, डेटा के एक सेट को व्यवस्थित करने के लिए एक ग्रिड एक प्रभावी तरीका है। अवधारणा प्रत्येक विशेषता के लागू मूल्यों को एक से अधिक सन्निहित अंतराल में विभाजित करना है, जिससे ग्रिड कोशिकाओं का एक सेट बनता है। प्रत्येक वस्तु एक ग्रिड सेल में घट जाती है जिसके समतुल्य विशेषता अंतराल में वस्तु के मान शामिल होते हैं।
ग्रिड सेल में ऑब्जेक्ट एक बार में रिकॉर्ड के माध्यम से बनाए जा सकते हैं, और सेल में बिंदुओं की संख्या सहित प्रत्येक सेल के बारे में डेटा भी समवर्ती रूप से एकत्र किया जा सकता है।
ग्रिड का उपयोग करके क्लस्टरिंग को लागू करने के कई तरीके हैं, लेकिन अधिकांश विधियां घनत्व पर आधारित हैं। ग्रिड-आधारित क्लस्टरिंग का एल्गोरिथम इस प्रकार है -
-
ग्रिड सेल के एक सेट का प्रतिनिधित्व करें।
-
उपयुक्त सेल के लिए ऑब्जेक्ट बनाएं और प्रत्येक सेल के घनत्व की गणना करें।
-
परिभाषित सीमा से नीचे घनत्व वाले सेल निकालें, r.
-
घनी कोशिकाओं के सन्निहित समूह से समूह बनाएं।
ग्रिड सेल को परिभाषित करना - यह प्रक्रिया में एक बुनियादी कदम है, लेकिन कम से कम स्पष्ट भी है, क्योंकि प्रत्येक विशेषता के संभावित मूल्यों को कई सन्निहित अंतरालों में विभाजित करने के लिए कई तरीके हैं। निरंतर विशेषताओं के लिए, एक विधि मानों को समान चौड़ाई के अंतराल में विभाजित करना है। यदि इस पद्धति का उपयोग प्रत्येक विशेषता के लिए किया जाता है, इसलिए परिणामी ग्रिड कोशिकाओं में सभी का आयतन समान होता है, और सेल के घनत्व को आसानी से सेल में कई बिंदुओं के रूप में परिभाषित किया जाता है।
ग्रिड कोशिकाओं का घनत्व - यह ग्रिड सेल के घनत्व को क्षेत्र के आयतन से विभाजित कई बिंदुओं के रूप में परिभाषित कर सकता है। दूसरे शब्दों में, घनत्व उस क्षेत्र की आयामीता की परवाह किए बिना, क्षेत्र की प्रति मात्रा में अंकों की संख्या है।
घने ग्रिड सेल से क्लस्टर बनाना - घनी कोशिकाओं के आसन्न सेट से क्लस्टर बनाना अपेक्षाकृत आसान है। कुछ समस्याएं हैं जैसे कि यह परिभाषित करना आवश्यक है कि यह आसन्न कोशिकाओं द्वारा क्या परिभाषित कर सकता है। क्लस्टरिंग पद्धति के कुछ नुकसान हैं जिन्हें थोड़ा और परिष्कृत एल्गोरिथम बनाकर संबोधित किया जा सकता है। उदाहरण के लिए, क्लस्टर की सीमा पर आंशिक रूप से अशक्त सेल होने की संभावना है।
यह घनत्व से अधिक डेटा का उपयोग करके बुनियादी ग्रिड-आधारित क्लस्टरिंग में सुधार के लिए लागू है। कुछ मामलों में, रिकॉर्ड में स्थानिक और गैर-स्थानिक दोनों गुण होते हैं। दूसरे शब्दों में, विभिन्न विशेषताएँ समय या स्थान में वस्तुओं के क्षेत्र को परिभाषित करती हैं, जबकि विभिन्न विशेषताएँ वस्तुओं के अन्य तत्वों को परिभाषित करती हैं।
एक उदाहरण घर है, जिसमें एक क्षेत्र और कई विशेषताएं हैं, जिसमें वर्ग फुट में कीमत या फर्श की जगह शामिल है। स्थानिक (या अस्थायी) स्वत:सहसंबंध के कारण, एक विशिष्ट सेल में वस्तुओं के अन्य गुणों के लिए समान मान होते हैं।