Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

क्लस्टरिंग के तरीके क्या हैं?

<घंटा/>

क्लस्टरिंग के विभिन्न तरीके हैं जो इस प्रकार हैं -

विभाजन के तरीके -एन ऑब्जेक्ट्स या डेटा टुपल्स के डेटाबेस को देखते हुए, एक विभाजन विधि जानकारी के k विभाजन को इकट्ठा करती है, जहां प्रत्येक विभाजन एक क्लस्टर को परिभाषित करता है, और k

  • प्रत्येक समूह में कम से कम एक वस्तु शामिल होनी चाहिए।

  • प्रत्येक वस्तु को सटीक रूप से एक समूह पर लागू होना चाहिए।

k को देखते हुए, निर्माण के लिए विभाजन की संख्या, एक विभाजन विधि एक प्रारंभिक विभाजन बनाती है। इसके बाद यह एक पुनरावृत्त स्थानांतरण विधि का उपयोग करता है जो वस्तुओं को एक समूह से दूसरे समूह में परिवर्तित करके विभाजन को बेहतर बनाने का प्रयास करता है।

अच्छे विभाजन का सामान्य मानदंड यह है कि एक ही क्लस्टर में वस्तुएं "करीबी" या एक-दूसरे से जुड़ी होती हैं, जबकि विभिन्न समूहों की वस्तुएं "दूर-दूर" या बहुत भिन्न होती हैं। विभाजन की गुणवत्ता निर्धारित करने के लिए कई प्रकार के अन्य मानदंड हैं।

पदानुक्रमित तरीके - एक पदानुक्रमित विधि डेटा ऑब्जेक्ट के दिए गए सेट का एक पदानुक्रमित अपघटन उत्पन्न करती है। एक पदानुक्रमित विधि को या तो समूहीय या विभाजनकारी के रूप में वर्गीकृत किया जा सकता है, यह इस बात पर निर्भर करता है कि पदानुक्रमित अपघटन कैसे उत्पन्न होता है। सामूहिक दृष्टिकोण को "बॉटम-अप" दृष्टिकोण के रूप में भी जाना जाता है।

यह एक स्वतंत्र समूह बनाने वाली प्रत्येक वस्तु से शुरू हो सकता है। यह क्रमिक रूप से वस्तुओं या समूहों को एक दूसरे के करीब जोड़ता है, जब तक कि सभी समूह एक (पदानुक्रम का सबसे ऊपरी स्तर) में संयुक्त नहीं हो जाते, या जब तक समाप्ति की स्थिति नहीं हो जाती। विभाजनकारी दृष्टिकोण को "टॉप-डाउन" दृष्टिकोण के रूप में भी जाना जाता है। यह एक ही क्लस्टर में सभी वस्तुओं से शुरू हो सकता है। प्रत्येक क्रमिक पुनरावृत्ति में, एक क्लस्टर को छोटे समूहों में विभाजित किया जाता है, अंत में, प्रत्येक वस्तु एक क्लस्टर में होती है, या जब तक समाप्ति की स्थिति नहीं होती है।

घनत्व-आधारित तरीके -कुछ विभाजन के तरीके वस्तुओं के बीच की दूरी के आधार पर वस्तुओं को क्लस्टर करते हैं। इस तरह की विधियाँ केवल गोलाकार आकार के समूहों की खोज कर सकती हैं और मनमाने आकार के समूहों को खोजने में कठिनाई का सामना कर सकती हैं। अन्य क्लस्टरिंग विधियों को घनत्व की अवधारणा के आधार पर बनाया गया है।

DBSCAN एक विशिष्ट घनत्व-आधारित विधि है जो घनत्व सीमा के अनुसार समूहों को बढ़ाती है। ऑप्टिक्स एक घनत्व-आधारित विधि है जो स्वचालित और इंटरैक्टिव क्लस्टर विश्लेषण के लिए संवर्धित क्लस्टरिंग क्रम का मूल्यांकन करती है।

ग्रिड-आधारित तरीके - ग्रिड-आधारित विधियां ऑब्जेक्ट स्पेस को एक सीमित संख्या में कोशिकाओं में परिमाणित करती हैं जो ग्रिड आर्किटेक्चर बनाती हैं। कुछ क्लस्टरिंग ऑपरेशन ग्रिड आर्किटेक्चर (अर्थात परिमाणित स्थान पर) पर कार्यान्वित किए जाते हैं।

इस दृष्टिकोण का लाभ इसका त्वरित प्रसंस्करण समय है जो आम तौर पर डेटा ऑब्जेक्ट्स की संख्या से स्वतंत्र होता है, और केवल परिमाणित स्थान में प्रत्येक आयाम में कोशिकाओं की संख्या पर निर्भर करता है। स्टिंग ग्रिड-आधारित पद्धति का एक उदाहरण है। CLIQUE और Wave-Cluster दो क्लस्टरिंग एल्गोरिदम हैं जो ग्रिड-आधारित और घनत्व-आधारित दोनों हैं।

मॉडल-आधारित तरीके - मॉडल-आधारित विधियां प्रत्येक क्लस्टर के लिए एक मॉडल की परिकल्पना करती हैं और दिए गए मॉडल के लिए रिकॉर्ड के सर्वोत्तम फिट की खोज करती हैं। एक मॉडल-आधारित एल्गोरिथ्म एक घनत्व फ़ंक्शन बनाकर क्लस्टर का पता लगा सकता है जो डेटा बिंदुओं के स्थानिक वितरण को दर्शाता है। यह मानक आँकड़ों के आधार पर समूहों की संख्या को स्वचालित रूप से तय करने, "शोर" या आउटलेयर को ध्यान में रखते हुए और इस प्रकार मजबूत क्लस्टरिंग विधियों को उत्पन्न करने की एक विधि की ओर ले जाता है।


  1. ऑडियो स्टेग्नोग्राफ़ी के तरीके क्या हैं?

    ऑडियो स्टेग्नोग्राफ़ी में, गुप्त संदेश को डिजीटल ऑडियो सिग्नल में स्थापित किया जाता है जिसके परिणामस्वरूप मेल खाने वाली ऑडियो फ़ाइल की बाइनरी श्रृंखला में परिवर्तन होता है। ऑडियो स्टेग्नोग्राफ़ी के लिए कई विधियाँ उपलब्ध हैं जो इस प्रकार हैं - लो-बिट एन्कोडिंग - बाइनरी जानकारी को ध्वनि फ़ाइलों के कम

  1. सी टोकन क्या हैं?

    सी प्रोग्राम निर्देशों का एक संग्रह है और प्रत्येक निर्देश अलग-अलग इकाइयों का संग्रह है। C प्रोग्राम की प्रत्येक छोटी व्यक्तिगत इकाई को आम तौर पर टोकन कहा जाता है और C प्रोग्राम में प्रत्येक निर्देश टोकन का एक संग्रह होता है। टोकन का उपयोग C प्रोग्राम के निर्माण के लिए किया जाता है और उन्हें C प्र

  1. सी # में टिप्पणियां क्या हैं?

    टिप्पणियों का उपयोग कोड समझाने के लिए किया जाता है। संकलक टिप्पणी प्रविष्टियों की उपेक्षा करते हैं। C# प्रोग्राम में बहुपंक्ति टिप्पणियाँ /* से शुरू होती हैं और नीचे दिखाए गए अनुसार */ के साथ समाप्त होती हैं। बहु-पंक्ति टिप्पणियां /* The following is a mult-line comment In C# /* . में एक बहु-पंक्ति