द्विभाजित K- साधन एल्गोरिथ्म मूल K- साधन एल्गोरिथ्म का एक सरल विकास है जो एक साधारण अवधारणा पर निर्भर करता है जैसे K क्लस्टर प्राप्त करना, कुछ बिंदुओं के सेट को दो समूहों में विभाजित करना, विभाजित करने के लिए इनमें से किसी एक क्लस्टर को चुनना, आदि। , जब तक K क्लस्टर तैयार नहीं हो जाते।
k- साधन एल्गोरिथ्म इनपुट पैरामीटर, k का उत्पादन करता है, और n वस्तुओं के एक सेट को k समूहों में विभाजित करता है ताकि परिणामी इंट्राक्लस्टर समानता अधिक हो लेकिन इंटरक्लस्टर सादृश्य कम हो। क्लस्टर समानता का मूल्यांकन क्लस्टर में वस्तुओं के औसत मूल्य के संबंध में किया जाता है, जिसे क्लस्टर के केंद्रक या गुरुत्वाकर्षण के केंद्र के रूप में देखा जा सकता है।
साधनों के लिए मूल मान मनमाने ढंग से अधिकृत हैं। इन्हें बेतरतीब ढंग से अधिकृत किया जा सकता है या शायद पहले k इनपुट आइटम से मूल्यों की आवश्यकता हो सकती है। अभिसरण घटक चुकता त्रुटि पर आधारित हो सकता है, लेकिन उनका होना आवश्यक नहीं है। उदाहरण के लिए, एल्गोरिथ्म को कई समूहों को सौंपा गया है। अन्य समाप्ति विधियों को निश्चित संख्या में पुनरावृत्तियों पर बंद कर दिया गया है। अभिसरण के बिना भी खरीदारी प्रदान करने के लिए अधिकतम संख्या में पुनरावृत्तियों को शामिल किया जा सकता है।
K-मीन्स को द्विभाजित करने का एल्गोरिथम जो इस प्रकार है -
-
सभी बिंदुओं जैसे क्लस्टर को शामिल करने के लिए क्लस्टर की सूची प्रारंभ करें।
-
दोहराना
-
क्लस्टर की सूची से एक क्लस्टर निकालें।
-
{चयनित क्लस्टर के कई "परीक्षण" द्विभाजन लागू करें।}
-
i के लिए :1 से लेकर कई परीक्षण करते हैं
-
बुनियादी K-साधनों का उपयोग करते हुए चुनिंदा क्लस्टर को द्विभाजित करें।
-
के लिए समाप्त करें
-
सबसे छोटे कुल SSE वाले द्विभाजन से दो क्लस्टर चुनें।
-
इन दो समूहों को क्लस्टर के दस्तावेज़ में सम्मिलित करें।
-
जब तक क्लस्टर के दस्तावेज़ में K क्लस्टर शामिल नहीं हो जाते।
किस क्लस्टर को विभाजित करना है, यह चुनने के कई तरीके हैं। यह प्रत्येक चरण में उच्चतम क्लस्टर चुन सकता है, सबसे बड़े एसएसई के साथ एक का चयन कर सकता है, या आकार और एसएसई दोनों के आधार पर एक तत्व का उपयोग कर सकता है। एकाधिक विकल्पों का परिणाम विभिन्न समूहों में होता है।
यह आने वाले क्लस्टर्स को उनके सेंट्रोइड्स को मूल के-मीन्स एल्गोरिथम के लिए मूल सेंट्रोइड्स के रूप में उपयोग करके स्पष्ट कर सकता है। यह आवश्यक है क्योंकि यद्यपि K- साधन एल्गोरिथ्म एक क्लस्टरिंग को खोजने के लिए सुरक्षित है जो SSE से संबंधित एक स्थानीय न्यूनतम को परिभाषित करता है, K-साधनों को द्विभाजित करने में यह K- साधन एल्गोरिथ्म "स्थानीय रूप से" का उपयोग कर रहा है, अर्थात, एकल समूहों को द्विभाजित करने के लिए। इसलिए, क्लस्टर का अंतिम सेट एक क्लस्टरिंग को परिभाषित नहीं करता है जो कुल एसएसई से संबंधित एक स्थानीय न्यूनतम है।
अंत में, K-मीन्स समद्विभाजित क्लस्टर के रूप में बनाए गए क्लस्टरिंग की श्रृंखला को रिकॉर्ड करके, इसे एक श्रेणीबद्ध क्लस्टरिंग बनाने के लिए K-साधनों को द्विभाजित करने की भी आवश्यकता हो सकती है।