Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में क्लस्टरिंग के प्रकार क्या हैं?

<घंटा/>

विभिन्न प्रकार के क्लस्टरिंग हैं जो इस प्रकार हैं -

पदानुक्रमित बनाम विभाजन -कई प्रकार के क्लस्टरिंग के बीच धारणा यह है कि क्या क्लस्टर का सेट नेस्टेड या अननेस्टेड है, या लोकप्रिय शब्दावली में, पदानुक्रमित या विभाजन में है। एक विभाजनात्मक क्लस्टरिंग डेटा ऑब्जेक्ट के समूह का गैर-अतिव्यापी सबसेट (क्लस्टर) में वितरण है जिसमें प्रत्येक डेटा ऑब्जेक्ट वास्तव में एक सबसेट में होता है।

यह समूहों को उपसमूहों की अनुमति दे सकता है, इसलिए इसे पदानुक्रमित क्लस्टरिंग की आवश्यकता होती है, जो नेस्टेड समूहों का एक समूह है जिसे एक पेड़ के रूप में सौंपा गया है। पेड़ में प्रत्येक नोड (क्लस्टर) (लीफ नोड्स को छोड़कर) उसके बच्चों (सबक्लस्टर्स) का मिलन है, और पेड़ की जड़ सभी वस्तुओं सहित क्लस्टर है।

अनन्य बनाम ओवरलैपिंग बनाम फ़िज़ी -क्लस्टरिंग सभी अनन्य है, क्योंकि वे प्रत्येक ऑब्जेक्ट को एक अलग क्लस्टर में बनाते हैं। ऐसी कई स्थितियां हैं जिनमें एक बिंदु एक से अधिक क्लस्टर में स्थित हो सकता है, और इन स्थितियों को गैर-अनन्य क्लस्टरिंग द्वारा बेहतर तरीके से संबोधित किया जाता है।

इस पद्धति में, एक अतिव्यापी या गैर-अनन्य क्लस्टरिंग इस तथ्य का पालन कर सकती है कि कोई वस्तु एक से अधिक समूह (वर्ग) से संबंधित हो सकती है। उदाहरण के लिए, किसी विश्वविद्यालय में एक व्यक्ति नामांकित उम्मीदवार और विश्वविद्यालय का कर्मचारी दोनों हो सकता है।

फ़िज़ी क्लस्टरिंग में, प्रत्येक ऑब्जेक्ट प्रत्येक क्लस्टर पर सदस्यता भार के साथ लागू होता है जो 0 (स्पष्ट रूप से लागू नहीं होता) और 1 (स्पष्ट रूप से लागू होता है) के बीच होता है। दूसरे शब्दों में, समूहों को फ़िज़ी सेट के रूप में माना जाता है।

पूर्ण बनाम आंशिक - एक पूर्ण क्लस्टरिंग प्रत्येक ऑब्जेक्ट को क्लस्टर में बनाता है, जबकि आंशिक क्लस्टरिंग नहीं करता है। आंशिक क्लस्टरिंग का कारण यह है कि डेटा सेट में कुछ ऑब्जेक्ट स्पष्ट समूहों से संबंधित नहीं हो सकते हैं। डेटा सेट में कई बार ऑब्जेक्ट शोर, आउटलेयर या "अरुचिकर पृष्ठभूमि" को परिभाषित कर सकते हैं। उदाहरण के लिए, कुछ अखबारों की कहानियां ग्लोबल वार्मिंग सहित एक सामान्य डिजाइन साझा कर सकती हैं, जबकि विभिन्न कहानियां अधिक सार्वभौमिक या एक तरह की होती हैं।

इसलिए, यह पिछले महीने की कहानियों में महत्वपूर्ण विषयों की खोज कर सकता है, केवल उन दस्तावेजों के समूहों की खोज करना आवश्यक है जो शायद ही किसी सामान्य विषय से जुड़े हों। कुछ मामलों में, वस्तुओं की एक पूरी क्लस्टरिंग हासिल कर ली जाती है। उदाहरण के लिए, एक एप्लिकेशन जिसे ब्राउज़िंग के लिए फ़ाइलों को व्यवस्थित करने के लिए क्लस्टरिंग की आवश्यकता होती है, यह गारंटी देने के लिए आवश्यक है कि सभी फाइलों को ब्राउज़ किया जा सके।


  1. खनन अनुक्रम डेटा के प्रकार क्या हैं?

    अनुक्रम घटनाओं की एक क्रमबद्ध सूची है। घटनाओं की विशेषताओं के आधार पर अनुक्रमों को तीन समूहों में विभाजित किया जा सकता है, जिन्हें वे निम्नानुसार परिभाषित करते हैं - समय-श्रृंखला डेटा में समानता खोज एक समय-श्रृंखला डेटा सेट में समय की बार-बार गणना पर प्राप्त पूर्णांक मानों के अनुक्रम शामिल होते ह

  1. डेटा माइनिंग में आउटलेयर कितने प्रकार के होते हैं?

    डेटा माइनिंग में विभिन्न प्रकार के आउटलेयर हैं जो इस प्रकार हैं - वैश्विक आउटलेयर - किसी दिए गए डेटा सेट में, एक डेटा ऑब्जेक्ट एक वैश्विक बाहरी होता है यदि वह बाकी जानकारी सेट से अनिवार्य रूप से विचलित हो जाता है। वैश्विक आउटलेयर को बिंदु विसंगतियों के रूप में जाना जाता है, और सबसे आसान प्रकार के आ

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।