Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डिसीजन ट्री का उपयोग वर्गीकरण के लिए कैसे किया जाता है?

<घंटा/>

डिसीजन ट्री इंडक्शन क्लास-लेबल ट्रेनिंग टुपल्स से डिसीजन ट्री की सीख है। एक निर्णय वृक्ष एक अनुक्रमिक आरेख-जैसी वृक्ष संरचना है, जहां प्रत्येक आंतरिक नोड (गैर-पत्ती नोड) एक विशेषता पर एक परीक्षण इंगित करता है, प्रत्येक शाखा परीक्षण के परिणाम को परिभाषित करती है, और प्रत्येक पत्ता नोड (या टर्मिनल नोड) एक वर्ग को प्रभावित करता है लेबल। पेड़ में सबसे ऊंचा नोड रूट नोड होता है।

यह अवधारणा को परिभाषित करता है कि कंप्यूटर खरीदता है, यानी, यह भविष्यवाणी करता है कि क्या AllElectronics के उपयोगकर्ता द्वारा कंप्यूटर खरीदने की संभावना है। आंतरिक नोड्स आयतों द्वारा इंगित किए जाते हैं, और पत्ती नोड्स अंडाकार द्वारा इंगित किए जाते हैं। विभिन्न निर्णय ट्री एल्गोरिदम केवल बाइनरी ट्री बनाते हैं (जहां प्रत्येक आंतरिक नोड शाखाएं दो अन्य नोड्स को सटीक रूप से बनाती हैं), जबकि अन्य गैर-बाइनरी ट्री बना सकते हैं।

एक टपल, एक्स को देखते हुए, जिसके लिए संबंधित वर्ग लेबल अनाम है, टपल के विशेषता मानों को निर्णय ट्री के विरुद्ध जांचा जाता है। रूट से लीफ नोड तक एक दिशा का पता लगाया जाता है, जो उस टपल के लिए वर्ग की भविष्यवाणी को प्रभावित करता है। निर्णय वृक्षों को वर्गीकरण नियमों में बदला जा सकता है।

डिसीजन ट्री क्लासिफायर के विकास के लिए कुछ डोमेन ज्ञान या पैरामीटर सेटिंग की आवश्यकता नहीं होती है, और इस प्रकार यह खोजपूर्ण ज्ञान खोज के लिए उपयुक्त है।

निर्णय वृक्ष बड़े आयामी डेटा का प्रबंधन कर सकते हैं। वृक्ष के रूप में अर्जित ज्ञान का उनका विवरण सहज और आमतौर पर मनुष्यों द्वारा समझने में सरल है। डिसीजन ट्री इंडक्शन का सीखने और वर्गीकरण का चरण आसान और त्वरित है।

सामान्य तौर पर, निर्णय ट्री क्लासिफायरियर की दक्षता अच्छी होती है। हालांकि, हाथ में डेटा के आधार पर सफल उपयोग किया जा सकता है। दवा, निर्माण और उत्पादन, मौद्रिक विश्लेषण, खगोल विज्ञान और आणविक जीव विज्ञान सहित कई अनुप्रयोग क्षेत्रों में वर्गीकरण के लिए निर्णय वृक्ष प्रेरण एल्गोरिदम का उपयोग किया गया है। निर्णय वृक्ष कई वाणिज्यिक नियम प्रेरण प्रणालियों पर आधारित होते हैं।

वृक्ष निर्माण के दौरान, विशेषता चयन उपायों का उपयोग उस विशेषता को चुनने के लिए किया जाता है जो टुपल्स को विभिन्न वर्गों में विभाजित करता है। जब निर्णय वृक्षों का निर्माण किया जाता है, तो कुछ शाखाएं प्रशिक्षण रिकॉर्ड में शोर या आउटलेयर को प्रतिबिंबित कर सकती हैं। ट्री प्रूनिंग ऐसी शाखाओं को पहचानने और समाप्त करने का प्रयास करती है, जिसका उद्देश्य अनव्यू डेटा पर वर्गीकरण सटीकता में सुधार करना है।

ID3, C4.5, और CART एक लालची (यानी, गैर-बैकट्रैकिंग) विधि की पुष्टि करते हैं जिसमें निर्णय ट्री एक टॉप-डाउन रिकर्सिव डिवाइड-एंड-कॉनकर विधि में बनाए जाते हैं। निर्णय ट्री इंडक्शन के लिए कई एल्गोरिदम भी ऐसी टॉप-डाउन पद्धति का पालन करते हैं, जो टुपल्स और उनके संबंधित वर्ग लेबल के प्रशिक्षण संग्रह से शुरू होती है। जैसे ही पेड़ का निर्माण किया जा रहा है, प्रशिक्षण संग्रह छोटे उप-समूहों में पुनरावर्ती रूप से विभाजित होता है।


  1. डेटा संरचना में लाल-काले पेड़

    इस खंड में हम देखेंगे कि लाल-काला पेड़ क्या है। रेड-ब्लैक ट्री स्व-संतुलन बाइनरी सर्च ट्री हैं। प्रत्येक नोड के लिए कुछ शर्तें हैं। ये नीचे की तरह हैं - प्रत्येक नोड का रंग होता है। जो या तो लाल या काला है जड़ हमेशा काली रहेगी दो आसन्न लाल नोड नहीं होंगे किसी नोड (रूट सहित) से उसके किसी

  1. मल्टी-वे पेड़

    एक मल्टीवे ट्री को एक ऐसे पेड़ के रूप में परिभाषित किया जाता है जिसमें दो से अधिक बच्चे हो सकते हैं। यदि एक मल्टीवे ट्री में अधिकतम m बच्चे हो सकते हैं, तो इस ट्री को ऑर्डर m (या m-way ट्री) का मल्टीवे ट्री कहा जाता है। अन्य पेड़ों की तरह जिनका अध्ययन किया गया है, एम-वे ट्री में नोड्स एम-1 कुंजी फ़

  1. पीसी के लिए सर्ज रक्षक कितने महत्वपूर्ण हैं?

    नया कंप्यूटर खरीदते समय आप उसके साथ किस तरह की एक्सेसरीज खरीदते हैं? अगर यह सिर्फ एक टावर है, तो आपको इसके साथ जाने के लिए एक स्क्रीन की आवश्यकता होगी। शायद आपको माउस और कीबोर्ड की भी आवश्यकता होगी। यहां तक ​​​​कि सभी आवश्यक चीजों के साथ, अभी भी बहुत कम खरीदारी है जो आप कर सकते हैं जैसे कि स्पीकर, व