Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

द्विभाजित K-मीन्स क्या है?

<घंटा/>

द्विभाजित K- साधन एल्गोरिथ्म मूल K- ​​साधन एल्गोरिथ्म का एक सरल विकास है जो एक साधारण अवधारणा पर निर्भर करता है जैसे K क्लस्टर प्राप्त करना, कुछ बिंदुओं के सेट को दो समूहों में विभाजित करना, विभाजित करने के लिए इनमें से किसी एक क्लस्टर को चुनना, आदि। , जब तक K क्लस्टर तैयार नहीं हो जाते।

k- साधन एल्गोरिथ्म इनपुट पैरामीटर, k का उत्पादन करता है, और n वस्तुओं के एक सेट को k समूहों में विभाजित करता है ताकि परिणामी इंट्राक्लस्टर समानता अधिक हो लेकिन इंटरक्लस्टर सादृश्य कम हो। क्लस्टर समानता का मूल्यांकन क्लस्टर में वस्तुओं के औसत मूल्य के संबंध में किया जाता है, जिसे क्लस्टर के केंद्रक या गुरुत्वाकर्षण के केंद्र के रूप में देखा जा सकता है।

साधनों के लिए मूल मान मनमाने ढंग से अधिकृत हैं। इन्हें बेतरतीब ढंग से अधिकृत किया जा सकता है या शायद पहले k इनपुट आइटम से मूल्यों की आवश्यकता हो सकती है। अभिसरण घटक चुकता त्रुटि पर आधारित हो सकता है, लेकिन उनका होना आवश्यक नहीं है। उदाहरण के लिए, एल्गोरिथ्म को कई समूहों को सौंपा गया है। अन्य समाप्ति विधियों को निश्चित संख्या में पुनरावृत्तियों पर बंद कर दिया गया है। अभिसरण के बिना भी खरीदारी प्रदान करने के लिए अधिकतम संख्या में पुनरावृत्तियों को शामिल किया जा सकता है।

K-मीन्स को द्विभाजित करने का एल्गोरिथम जो इस प्रकार है -

  • सभी बिंदुओं जैसे क्लस्टर को शामिल करने के लिए क्लस्टर की सूची प्रारंभ करें।

  • दोहराना

  • क्लस्टर की सूची से एक क्लस्टर निकालें।

  • {चयनित क्लस्टर के कई "परीक्षण" द्विभाजन लागू करें।}

  • i के लिए :1 से लेकर कई परीक्षण करते हैं

  • बुनियादी K-साधनों का उपयोग करते हुए चुनिंदा क्लस्टर को द्विभाजित करें।

  • के लिए समाप्त करें

  • सबसे छोटे कुल SSE वाले द्विभाजन से दो क्लस्टर चुनें।

  • इन दो समूहों को क्लस्टर के दस्तावेज़ में सम्मिलित करें।

  • जब तक क्लस्टर के दस्तावेज़ में K क्लस्टर शामिल नहीं हो जाते।

किस क्लस्टर को विभाजित करना है, यह चुनने के कई तरीके हैं। यह प्रत्येक चरण में उच्चतम क्लस्टर चुन सकता है, सबसे बड़े एसएसई के साथ एक का चयन कर सकता है, या आकार और एसएसई दोनों के आधार पर एक तत्व का उपयोग कर सकता है। एकाधिक विकल्पों का परिणाम विभिन्न समूहों में होता है।

यह आने वाले क्लस्टर्स को उनके सेंट्रोइड्स को मूल के-मीन्स एल्गोरिथम के लिए मूल सेंट्रोइड्स के रूप में उपयोग करके स्पष्ट कर सकता है। यह आवश्यक है क्योंकि यद्यपि K- साधन एल्गोरिथ्म एक क्लस्टरिंग को खोजने के लिए सुरक्षित है जो SSE से संबंधित एक स्थानीय न्यूनतम को परिभाषित करता है, K-साधनों को द्विभाजित करने में यह K- साधन एल्गोरिथ्म "स्थानीय रूप से" का उपयोग कर रहा है, अर्थात, एकल समूहों को द्विभाजित करने के लिए। इसलिए, क्लस्टर का अंतिम सेट एक क्लस्टरिंग को परिभाषित नहीं करता है जो कुल एसएसई से संबंधित एक स्थानीय न्यूनतम है।

अंत में, K-मीन्स समद्विभाजित क्लस्टर के रूप में बनाए गए क्लस्टरिंग की श्रृंखला को रिकॉर्ड करके, इसे एक श्रेणीबद्ध क्लस्टरिंग बनाने के लिए K-साधनों को द्विभाजित करने की भी आवश्यकता हो सकती है।


  1. 10.0.0.1 IP पता क्या है?

    10.0.0.1 आईपी पता एक निजी आईपी पता है जिसे क्लाइंट डिवाइस पर इस्तेमाल किया जा सकता है या नेटवर्क हार्डवेयर के एक टुकड़े को इसके डिफ़ॉल्ट आईपी पते के रूप में असाइन किया जा सकता है। 10.0.0.1 क्या है? 10.0.0.1 आमतौर पर घरेलू नेटवर्क की तुलना में व्यावसायिक कंप्यूटर नेटवर्क में अधिक देखा जाता है, जहा

  1. सूचना सुरक्षा जोखिम क्या है?

    सूचना सुरक्षा जोखिम सूचना प्रौद्योगिकी के उपयोग से संबंधित जोखिमों के प्रबंधन की प्रक्रिया है। इसमें किसी संगठन की संपत्ति की गोपनीयता, अखंडता और पहुंच के जोखिमों की पहचान करना, मूल्यांकन करना और उन पर विचार करना शामिल है। इस प्रक्रिया का उद्देश्य किसी संगठन की पूर्ण जोखिम सहनशीलता के अनुसार जोखिमों

  1. सूचना प्रणाली क्या है?

    सूचना प्रणाली व्यावसायिक लक्ष्यों को प्राप्त करने के लिए लोगों, सूचना प्रौद्योगिकी और व्यावसायिक प्रक्रिया का समूह है। सूचना प्रणाली एक संगठन में समन्वय, विज़ुअलाइज़ेशन, विश्लेषण और निर्णय लेने के लिए डेटा एकत्र करने, संसाधित करने, संग्रहीत करने और वितरित करने के लिए काम करने वाले इंटरकनेक्टेड तत्वो