Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ग्रिड-आधारित क्लस्टरिंग के एल्गोरिदम क्या हैं?

<घंटा/>

कम आयामों में न्यूनतम, डेटा के एक सेट को व्यवस्थित करने के लिए एक ग्रिड एक प्रभावी तरीका है। अवधारणा प्रत्येक विशेषता के लागू मूल्यों को एक से अधिक सन्निहित अंतराल में विभाजित करना है, जिससे ग्रिड कोशिकाओं का एक सेट बनता है। प्रत्येक वस्तु एक ग्रिड सेल में घट जाती है जिसके समतुल्य विशेषता अंतराल में वस्तु के मान शामिल होते हैं।

ग्रिड सेल में ऑब्जेक्ट एक बार में रिकॉर्ड के माध्यम से बनाए जा सकते हैं, और सेल में बिंदुओं की संख्या सहित प्रत्येक सेल के बारे में डेटा भी समवर्ती रूप से एकत्र किया जा सकता है।

ग्रिड का उपयोग करके क्लस्टरिंग को लागू करने के कई तरीके हैं, लेकिन अधिकांश विधियां घनत्व पर आधारित हैं। ग्रिड-आधारित क्लस्टरिंग का एल्गोरिथम इस प्रकार है -

  • ग्रिड सेल के एक सेट का प्रतिनिधित्व करें।

  • उपयुक्त सेल के लिए ऑब्जेक्ट बनाएं और प्रत्येक सेल के घनत्व की गणना करें।

  • परिभाषित सीमा से नीचे घनत्व वाले सेल निकालें, r.

  • घनी कोशिकाओं के सन्निहित समूह से समूह बनाएं।

ग्रिड सेल को परिभाषित करना - यह प्रक्रिया में एक बुनियादी कदम है, लेकिन कम से कम स्पष्ट भी है, क्योंकि प्रत्येक विशेषता के संभावित मूल्यों को कई सन्निहित अंतरालों में विभाजित करने के लिए कई तरीके हैं। निरंतर विशेषताओं के लिए, एक विधि मानों को समान चौड़ाई के अंतराल में विभाजित करना है। यदि इस पद्धति का उपयोग प्रत्येक विशेषता के लिए किया जाता है, इसलिए परिणामी ग्रिड कोशिकाओं में सभी का आयतन समान होता है, और सेल के घनत्व को आसानी से सेल में कई बिंदुओं के रूप में परिभाषित किया जाता है।

ग्रिड कोशिकाओं का घनत्व - यह ग्रिड सेल के घनत्व को क्षेत्र के आयतन से विभाजित कई बिंदुओं के रूप में परिभाषित कर सकता है। दूसरे शब्दों में, घनत्व उस क्षेत्र की आयामीता की परवाह किए बिना, क्षेत्र की प्रति मात्रा में अंकों की संख्या है।

घने ग्रिड सेल से क्लस्टर बनाना - घनी कोशिकाओं के आसन्न सेट से क्लस्टर बनाना अपेक्षाकृत आसान है। कुछ समस्याएं हैं जैसे कि यह परिभाषित करना आवश्यक है कि यह आसन्न कोशिकाओं द्वारा क्या परिभाषित कर सकता है। क्लस्टरिंग पद्धति के कुछ नुकसान हैं जिन्हें थोड़ा और परिष्कृत एल्गोरिथम बनाकर संबोधित किया जा सकता है। उदाहरण के लिए, क्लस्टर की सीमा पर आंशिक रूप से अशक्त सेल होने की संभावना है।

यह घनत्व से अधिक डेटा का उपयोग करके बुनियादी ग्रिड-आधारित क्लस्टरिंग में सुधार के लिए लागू है। कुछ मामलों में, रिकॉर्ड में स्थानिक और गैर-स्थानिक दोनों गुण होते हैं। दूसरे शब्दों में, विभिन्न विशेषताएँ समय या स्थान में वस्तुओं के क्षेत्र को परिभाषित करती हैं, जबकि विभिन्न विशेषताएँ वस्तुओं के अन्य तत्वों को परिभाषित करती हैं।

एक उदाहरण घर है, जिसमें एक क्षेत्र और कई विशेषताएं हैं, जिसमें वर्ग फुट में कीमत या फर्श की जगह शामिल है। स्थानिक (या अस्थायी) स्वत:सहसंबंध के कारण, एक विशिष्ट सेल में वस्तुओं के अन्य गुणों के लिए समान मान होते हैं।


  1. प्रतिबंधों के साथ क्लस्टरिंग के तरीके क्या हैं?

    विशिष्ट बाधाओं को संभालने के लिए विभिन्न तकनीकों की आवश्यकता होती है। हार्ड और सॉफ्ट बाधाओं को संभालने के सामान्य सिद्धांत जो इस प्रकार हैं - कठिन बाधाओं को संभालना - कठिन बाधाओं से निपटने के लिए एक सामान्य तरीका क्लस्टर असाइनमेंट प्रक्रिया में बाधाओं का सख्ती से पालन करना है। डेटा सेट और उदाहरणों

  1. सी टोकन क्या हैं?

    सी प्रोग्राम निर्देशों का एक संग्रह है और प्रत्येक निर्देश अलग-अलग इकाइयों का संग्रह है। C प्रोग्राम की प्रत्येक छोटी व्यक्तिगत इकाई को आम तौर पर टोकन कहा जाता है और C प्रोग्राम में प्रत्येक निर्देश टोकन का एक संग्रह होता है। टोकन का उपयोग C प्रोग्राम के निर्माण के लिए किया जाता है और उन्हें C प्र

  1. सी # में टिप्पणियां क्या हैं?

    टिप्पणियों का उपयोग कोड समझाने के लिए किया जाता है। संकलक टिप्पणी प्रविष्टियों की उपेक्षा करते हैं। C# प्रोग्राम में बहुपंक्ति टिप्पणियाँ /* से शुरू होती हैं और नीचे दिखाए गए अनुसार */ के साथ समाप्त होती हैं। बहु-पंक्ति टिप्पणियां /* The following is a mult-line comment In C# /* . में एक बहु-पंक्ति