Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

कार्ट प्रूनिंग एल्गोरिथम क्या है?

<घंटा/>

कार्ट एक प्रसिद्ध डिसीजन ट्री एल्गोरिथम है जिसे पहली बार 1984 में लियो ब्रिमन, जेरोम फ्रीडमैन, रिचर्ड ओल्सेन और चार्ल्स स्टोन द्वारा निर्मित किया गया था। कार्ट वर्गीकरण और रिग्रेशन ट्री का प्रतिनिधित्व करता है। CART एल्गोरिथम बाइनरी ट्री को बेहतर बनाता है और विभाजित होना जारी रखता है, यह देखते हुए कि नए विभाजन पाए जा सकते हैं जो शुद्धता में सुधार करते हैं।

कुछ सरल उपप्रकार हैं, जिनमें से प्रत्येक मॉडल जटिलता और प्रशिक्षण समूह गलत वर्गीकरण दर के बीच एक अलग व्यापार-बंद को परिभाषित करता है। CART एल्गोरिथम ऐसे उप-समूहों के समूह को उम्मीदवार मॉडल के रूप में पहचानता है। ये उम्मीदवार उप-वृक्ष सत्यापन समूह के लिए उपयोग किए जाते हैं और न्यूनतम सत्यापन सेट गलत वर्गीकरण दर वाले पेड़ को अंतिम मॉडल के रूप में चुना जाता है।

कार्ट एल्गोरिथम बार-बार छंटाई की प्रक्रिया के माध्यम से उम्मीदवार उप-वृक्षों को पहचानता है। इसका उद्देश्य पहले उन शाखाओं को छांटना है जो प्रति पत्ती कम से कम अधिक भविष्य कहनेवाला शक्ति का समर्थन करती हैं। यह समायोजित त्रुटि दर के रूप में जानी जाने वाली अवधारणा के आधार पर इन कम से कम लाभकारी शाखाओं, कार्ट को पहचान सकता है।

यह एक ऐसा उपाय है जो प्रशिक्षण सेट पर प्रत्येक नोड की गलत वर्गीकरण लागत को प्रभावशाली जटिलता दंड द्वारा सुधारता है जो पेड़ में कई पत्तियों पर निर्भर करता है। समायोजित त्रुटि दर कमजोर शाखाओं (जिनकी गलत वर्गीकरण दर दंड से उबरने के लिए पर्याप्त नहीं है) की पहचान कर सकती है और उन्हें छंटाई के लिए इंगित कर सकती है।

अगला कार्य उम्मीदवार सबट्री के पूल से चुनना है, जो नए रिकॉर्ड पर सबसे अच्छा काम करता है। प्रत्येक उम्मीदवार उपप्रकार सत्यापन सेट में डेटा को परिभाषित कर सकता है। सबसे कम पूर्ण त्रुटि दर के साथ इस कार्य को लागू करने वाले ट्री को विजेता के रूप में परिभाषित किया गया है। ओवरट्रेनिंग के प्रभावों को खत्म करने के लिए विजेता सबट्री को पर्याप्त रूप से काटा गया है, लेकिन इतना नहीं कि मूल्यवान डेटा खो जाए।

चूंकि यह प्रूनिंग एल्गोरिदम गलत वर्गीकरण दर पर निर्भर करता है, प्रत्येक वर्गीकरण की संभावना को ध्यान में रखे बिना, यह कुछ उपट्री को पुनर्स्थापित करता है जिनके पत्ते सभी एक सामान्य माता-पिता के साथ समान वर्गीकरण बनाते हैं जो उस वर्गीकरण को भी बनाता है।

उद्देश्य डेटा का एक छोटा अनुपात (उदाहरण के लिए शीर्ष 1 प्रतिशत या 10 प्रतिशत) चुनना है, यह छंटाई एल्गोरिथ्म पेड़ के कार्यान्वयन को नुकसान पहुंचा सकता है, क्योंकि कुछ हटाए गए पत्तों में लक्ष्य वर्ग का एक बहुत ही उच्च क्षेत्र शामिल है . एसएएस एंटरप्राइज माइनर सहित विभिन्न उपकरण हैं, जो उपयोगकर्ता को इस तरह के तरीकों के लिए पेड़ों को बेहतर तरीके से काटने में सक्षम बनाता है।

सत्यापन सेट में डेटा को परिभाषित करने के कार्य के लिए उपयोग किए जाने पर विजेता उपट्री को इसकी पूर्ण त्रुटि दर के आधार पर चुना गया था। यह उम्मीद कर सकता है कि चयनित सबट्री एक से अधिक डेटासेट के लिए उपयोग किए जाने पर सबसे अच्छा कार्यान्वयन उपट्री बनी रहेगी, त्रुटि दर जो इसे चुने जाने के लिए उत्पन्न करती है, इसकी ताकत को थोड़ा बढ़ा सकती है।


  1. ब्लोफिश एल्गोरिथम के संचालन क्या हैं?

    ब्लोफिश सिमेट्रिक ब्लॉक सिफर एल्गोरिथम है और यह एक बार में 64-बिट्स की ब्लॉकइनफॉर्मेशन को एन्क्रिप्ट करता है। यह Feistel नेटवर्क का अनुसरण करता है और इस एल्गोरिथम की कार्य प्रक्रिया को दो भागों में विभाजित किया गया है। उपकुंजी निर्माण - यह प्रक्रिया 448 बिट तक की कुंजी को 4168 बिट्स जोड़कर उपकुंज

  1. ब्लोफिश एन्क्रिप्शन एल्गोरिथम क्या है?

    ब्लोफिश एन्क्रिप्शन एल्गोरिथ्म एक सममित ब्लॉक सिफर है जिसे डेस एल्गोरिथ्म में प्राप्त करने के लिए डिज़ाइन किया गया है जो धीमा और अनिश्चित था। ब्लोफिश 1993 में ब्रूस श्नेयर द्वारा आविष्कार किया गया एक कुंजीयुक्त, सममित क्रिप्टोग्राफिक ब्लॉक सिफर है और सार्वजनिक डोमेन में स्थित है। सममित एन्क्रिप्शन

  1. सूचना सुरक्षा में RSA एल्गोरिथम क्या है?

    RSA का मतलब रिवेस्ट, शमीर, एडलमैन है। वे सार्वजनिक-कुंजी एन्क्रिप्शन तकनीक के संस्थापक हैं, जो संरक्षित सूचना प्रसारण के लिए एक सार्वजनिक-कुंजी क्रिप्टोसिस्टम है। यह विशेष रूप से इंटरनेट पर डेटा स्थानांतरित करते समय प्रतिक्रियाशील जानकारी प्रसारित करने के लिए एक मानक एन्क्रिप्शन दृष्टिकोण है। रिवेस