Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

एसओएम एल्गोरिदम क्या हैं?


SOM स्व-व्यवस्थित सुविधा मानचित्र का प्रतिनिधित्व करता है। यह एक क्लस्टरिंग है और डेटा विज़ुअलाइज़ेशन तकनीक एक तंत्रिका नेटवर्क दृष्टिकोण पर निर्भर करती है। एसओएम के तंत्रिका नेटवर्क आधार के बावजूद, इसे प्रोटोटाइप-आधारित क्लस्टरिंग के परिवर्तन के संदर्भ में बस प्रस्तुत किया जाता है-न्यूनतम।

एसओएम का एल्गोरिथम इस प्रकार है -

  • सेंट्रोइड्स को इनिशियलाइज़ करें।

  • दोहराना

  • अगली वस्तु चुनें।

  • वस्तु के निकटतम केन्द्रक का निर्धारण करें।

  • इस केन्द्रक और केन्द्रक को ताज़ा करें जो करीब हैं, यानी, एक निश्चित पड़ोस में।

  • जब तक केन्द्रक अधिक नहीं बदलता है या एक सीमा बाहरी स्थान नहीं है।

  • प्रत्येक वस्तु को उसके निकटतम केन्द्रक में बनाएँ और केन्द्रक और समूहों को पुनर्स्थापित करें।

आरंभीकरण - इस चरण (पंक्ति 1) को कई तरीकों से लागू किया जा सकता है। एक तरीका यह है कि एक सेंट्रोइड के प्रत्येक तत्व को उस तत्व के डेटा में देखे गए मानों की श्रेणी से यादृच्छिक रूप से चुना जाए।

जबकि यह विधि काम करती है, यह अनिवार्य रूप से सबसे अच्छी विधि नहीं है, विशेष रूप से तेजी से अभिसरण करने के लिए। एक अन्य तरीका यह है कि सुलभ डेटा बिंदुओं से मूल सेंट्रोइड्स को बेतरतीब ढंग से चुना जाए। यह K-साधनों के लिए बेतरतीब ढंग से सेंट्रोइड चुनने जैसा है।

किसी वस्तु का चयन - लूप में पहला चरण (पंक्ति 3) अगली वस्तु का चुनाव है। यह सरल है, लेकिन इसमें कई कठिनाइयाँ हैं। क्योंकि अभिसरण के लिए कुछ चरणों की आवश्यकता हो सकती है, प्रत्येक डेटा ऑब्जेक्ट को कई बार उपयोग किया जा सकता है, खासकर यदि कई ऑब्जेक्ट छोटे हैं। लेकिन अगर वस्तुओं की संख्या बड़ी है, तो प्रत्येक वस्तु का उपयोग करने की आवश्यकता नहीं है। यह प्रशिक्षण सेट में उनकी आवृत्ति में सुधार करके वस्तुओं के विशिष्ट समूहों के प्रभाव को बेहतर बनाने के लिए भी लागू होता है।

असाइनमेंट -निकटतम केंद्रक (पंक्ति 4) का निर्धारण आसान है, हालांकि इसके लिए दूरी मीट्रिक के विवरण की आवश्यकता होती है। यूक्लिडियन दूरी मीट्रिक का उपयोग किया जाता है, जैसा कि डॉट उत्पाद मीट्रिक है। डॉट उत्पाद दूरी का उपयोग करते समय, डेटा वैक्टर को आम तौर पर पहले से सामान्यीकृत किया जाता है और हर कदम पर संदर्भ वैक्टर को सामान्यीकृत किया जाता है। इस पद्धति में, कोसाइन माप का उपयोग करने के लिए डॉट उत्पाद मीट्रिक का उपयोग करना समान है।

अपडेट करें - अद्यतन चरण (पंक्ति 5) कठिन है। माना m1..., mk, केन्द्रक हो। समय चरण t के लिए, मान लें कि p(t) वर्तमान वस्तु (बिंदु) है और मान लें कि p(t) का निकटतम केन्द्रक mj है। इसलिए, समय t+1 के लिए, jth केन्द्रक को निम्न समीकरण का उपयोग करके ताज़ा किया जाता है।

$$\mathrm{mj(t + 1) =mj(t) + hj(t)(p(t) - mj(t))}$$

समाप्ति - यह निर्धारित कर रहा है कि यह सेंट्रोइड्स के एक स्थिर सेट के लिए पर्याप्त है, यह एक आवश्यक मुद्दा है। आदर्श रूप से, पुनरावृत्ति तब तक जारी रहनी चाहिए जब तक कि अभिसरण प्रकट न हो जाए, अर्थात, जब तक कि संदर्भ वैक्टर नहीं बदलते या छोटे नहीं बदलते। अभिसरण की लागत डेटा और (t) सहित कई कारकों पर आधारित होगी।


  1. ब्लोफिश एल्गोरिथम के संचालन क्या हैं?

    ब्लोफिश सिमेट्रिक ब्लॉक सिफर एल्गोरिथम है और यह एक बार में 64-बिट्स की ब्लॉकइनफॉर्मेशन को एन्क्रिप्ट करता है। यह Feistel नेटवर्क का अनुसरण करता है और इस एल्गोरिथम की कार्य प्रक्रिया को दो भागों में विभाजित किया गया है। उपकुंजी निर्माण - यह प्रक्रिया 448 बिट तक की कुंजी को 4168 बिट्स जोड़कर उपकुंज

  1. सी टोकन क्या हैं?

    सी प्रोग्राम निर्देशों का एक संग्रह है और प्रत्येक निर्देश अलग-अलग इकाइयों का संग्रह है। C प्रोग्राम की प्रत्येक छोटी व्यक्तिगत इकाई को आम तौर पर टोकन कहा जाता है और C प्रोग्राम में प्रत्येक निर्देश टोकन का एक संग्रह होता है। टोकन का उपयोग C प्रोग्राम के निर्माण के लिए किया जाता है और उन्हें C प्र

  1. सी # में टिप्पणियां क्या हैं?

    टिप्पणियों का उपयोग कोड समझाने के लिए किया जाता है। संकलक टिप्पणी प्रविष्टियों की उपेक्षा करते हैं। C# प्रोग्राम में बहुपंक्ति टिप्पणियाँ /* से शुरू होती हैं और नीचे दिखाए गए अनुसार */ के साथ समाप्त होती हैं। बहु-पंक्ति टिप्पणियां /* The following is a mult-line comment In C# /* . में एक बहु-पंक्ति