Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

K-मीन्स और DBSCAN में क्या अंतर है?

<घंटा/>

के-मीन्स

K- साधन क्लस्टरिंग विभाजन एल्गोरिथ्म है। K- साधन डेटासेट में प्रत्येक डेटा को बनाए गए नए समूहों में से केवल एक में फिर से बनाता है। दूरी या समानता के माप का उपयोग करके आसन्न क्लस्टर को एक डेटा या डेटा बिंदु असाइन किया जाता है।

k- साधन में, एक वस्तु निकटतम केंद्र में उत्पन्न होती है। यह कैन-लिंक बाधाओं को परिभाषित कर सकता है, और यह केंद्र असाइनमेंट प्रक्रिया को k-मीन्स में निकटतम लागू केंद्र असाइनमेंट में संशोधित करता है।

जब वस्तुओं को अनुक्रम में केंद्रों में बनाया जाता है, तो प्रत्येक चरण में यह असाइनमेंट प्रदान कर सकता है अब तक कुछ असंबद्ध बाधाओं को अव्यवस्थित नहीं करता है। ऑब्जेक्ट को निकटतम केंद्र में बनाया जाता है इसलिए असाइनमेंट कुछ लिंक नहीं कर सकने वाली बाधाओं का सम्मान करता है।

डीबीएससीएएन

DBSCAN शोर के साथ अनुप्रयोगों के घनत्व-आधारित स्थानिक क्लस्टरिंग का प्रतिनिधित्व करता है। यह एक घनत्व-आधारित क्लस्टरिंग एल्गोरिथम है। एल्गोरिथ्म पर्याप्त रूप से उच्च घनत्व वाले क्षेत्रों को समूहों में सुधारता है और शोर के साथ स्थानिक डेटाबेस में मनमानी संरचना के समूहों की खोज करता है। यह क्लस्टर को घनत्व से जुड़े बिंदुओं के अधिकतम सेट के रूप में परिभाषित करता है।

घनत्व-आधारित क्लस्टर घनत्व से जुड़ी वस्तुओं का एक सेट है जो घनत्व-पहुंच योग्यता के संबंध में अधिकतम है। प्रत्येक वस्तु जो कुछ क्लस्टर में शामिल नहीं है उसे शोर माना जाता है।

डेटाबेस में प्रत्येक बिंदु के -पड़ोस की जाँच करके DBSCAN क्लस्टर के लिए जाँच करता है। यदि किसी बिंदु p के -पड़ोस में MinPts से अधिक है, तो एक नया क्लस्टर p के साथ मूल तत्व के रूप में उत्पन्न होता है। DBSCAN इन आवश्यक तत्वों से सटीक रूप से घनत्व-पहुंच योग्य वस्तुओं को इकट्ठा करता है, जिसमें कुछ घनत्व-पहुंच योग्य समूहों का विलय शामिल हो सकता है। जब किसी क्लस्टर में कोई नया बिंदु नहीं जोड़ा जा सकता है तो प्रक्रिया समाप्त हो जाती है।

आइए देखते हैं K-मीन्स और DBSCAN के बीच तुलना।

<थ>डीबीएससीएएन
K-मीन्स
K-मीन्स आम तौर पर सभी ऑब्जेक्ट्स को क्लस्टर करता है। DBSCAN उन वस्तुओं को त्याग देता है जिन्हें वह शोर के रूप में परिभाषित करता है।
K-मीन्स को क्लस्टर के प्रोटोटाइप-आधारित अवधारणा की आवश्यकता है। DBSCAN को घनत्व-आधारित अवधारणा की आवश्यकता है।
K-मीन्स को गैर-गोलाकार समूहों और कई आकारों के समूहों के साथ कठिनाई होती है। DBSCAN का उपयोग कई आकारों और संरचनाओं के समूहों को संभालने के लिए किया जाता है और यह शोर या आउटलेयर से शक्तिशाली रूप से प्रभावित नहीं होता है।
K-साधनों का उपयोग ऐसे डेटा के लिए किया जा सकता है जिसमें माध्य या माध्यिका सहित स्पष्ट केन्द्रक हो। DBSCAN की आवश्यकता थी कि घनत्व की इसकी परिभाषा, जो घनत्व की पारंपरिक यूक्लिडियन अवधारणा पर निर्भर करती है, डेटा के लिए महत्वपूर्ण हो।
K-मीन्स का उपयोग फ़ाइल डेटा सहित, उच्च आयामी डेटा को विरल करने के लिए किया जा सकता है। DBSCAN आमतौर पर ऐसी जानकारी के लिए खराब तरीके से लागू होता है क्योंकि घनत्व की पारंपरिक यूक्लिडियन परिभाषा उच्च आयामी डेटा के लिए अच्छी तरह से काम नहीं करती है।
बुनियादी K-मीन्स एल्गोरिथम एक सांख्यिकीय क्लस्टरिंग दृष्टिकोण (मिश्रण मॉडल) के समान है, जो मानता है कि सभी क्लस्टर गोलाकार गॉसियन वितरण से कई साधनों के साथ आते हैं, लेकिन समान सहप्रसरण मैट्रिक्स। DIISCAN रिकॉर्ड के वितरण के बारे में कोई धारणा नहीं बनाता है।

  1. DirectX 11 और DirectX 12 में क्या अंतर है?

    DirectX, एपीआई या एप्लिकेशन प्रोग्रामिंग इंटरफेस का एक संग्रह है, जिसका उपयोग सॉफ्टवेयर द्वारा मल्टीमीडिया सामग्री को प्रस्तुत करने और ग्राफिकल हार्डवेयर के साथ संचार करने के लिए किया जाता है। DirectX का प्रमुख घटक API, Direct3D, सॉफ्टवेयर और ग्राफिक्स हार्डवेयर के बीच संचार को संभालता है। चूंकि सभी

  1. के बीच क्या अंतर है | और || या सी # में ऑपरेटरों?

    | संचालिका | ऑपरेटर तार्किक या उसके ऑपरेंड की गणना करता है। x का परिणाम | y सत्य है यदि या तो x या y सत्य का मूल्यांकन करता है। अन्यथा, परिणाम गलत है। | ऑपरेटर दोनों ऑपरेंड का मूल्यांकन करता है, भले ही लेफ्ट-हैंड ऑपरेंड का मूल्यांकन सही हो, ताकि ऑपरेशन का परिणाम सही हो, राइट-हैंड ऑपरेंड के मूल्य क

  1. के बीच क्या अंतर है | और || सी # में ऑपरेटरों?

    || तार्किक या . कहा जाता है ऑपरेटर और | बिटवाइज लॉजिकल OR . कहा जाता है लेकिन उनके बीच बुनियादी अंतर उन्हें निष्पादित करने के तरीके में है। के लिए वाक्य रचना || और | जैसा कि निम्नलिखित में है - बूल_एक्सप1 || bool_exp2 बूल_एक्सप1 | bool_exp2 अब 1 और 2 का सिंटैक्स एक दूसरे के समान दिखता है लेकिन जिस