कार्ट एक प्रसिद्ध डिसीजन ट्री एल्गोरिथम है जिसे पहली बार 1984 में लियो ब्रिमन, जेरोम फ्रीडमैन, रिचर्ड ओल्सेन और चार्ल्स स्टोन द्वारा निर्मित किया गया था। कार्ट वर्गीकरण और रिग्रेशन ट्री का प्रतिनिधित्व करता है। CART एल्गोरिथम बाइनरी ट्री को बेहतर बनाता है और विभाजित होना जारी रखता है, यह देखते हुए कि नए विभाजन पाए जा सकते हैं जो शुद्धता में सुधार करते हैं।
कुछ सरल उपप्रकार हैं, जिनमें से प्रत्येक मॉडल जटिलता और प्रशिक्षण समूह गलत वर्गीकरण दर के बीच एक अलग व्यापार-बंद को परिभाषित करता है। CART एल्गोरिथम ऐसे उप-समूहों के समूह को उम्मीदवार मॉडल के रूप में पहचानता है। ये उम्मीदवार उप-वृक्ष सत्यापन समूह के लिए उपयोग किए जाते हैं और न्यूनतम सत्यापन सेट गलत वर्गीकरण दर वाले पेड़ को अंतिम मॉडल के रूप में चुना जाता है।
कार्ट एल्गोरिथम बार-बार छंटाई की प्रक्रिया के माध्यम से उम्मीदवार उप-वृक्षों को पहचानता है। इसका उद्देश्य पहले उन शाखाओं को छांटना है जो प्रति पत्ती कम से कम अधिक भविष्य कहनेवाला शक्ति का समर्थन करती हैं। यह समायोजित त्रुटि दर के रूप में जानी जाने वाली अवधारणा के आधार पर इन कम से कम लाभकारी शाखाओं, कार्ट को पहचान सकता है।
यह एक ऐसा उपाय है जो प्रशिक्षण सेट पर प्रत्येक नोड की गलत वर्गीकरण लागत को प्रभावशाली जटिलता दंड द्वारा सुधारता है जो पेड़ में कई पत्तियों पर निर्भर करता है। समायोजित त्रुटि दर कमजोर शाखाओं (जिनकी गलत वर्गीकरण दर दंड से उबरने के लिए पर्याप्त नहीं है) की पहचान कर सकती है और उन्हें छंटाई के लिए इंगित कर सकती है।
अगला कार्य उम्मीदवार सबट्री के पूल से चुनना है, जो नए रिकॉर्ड पर सबसे अच्छा काम करता है। प्रत्येक उम्मीदवार उपप्रकार सत्यापन सेट में डेटा को परिभाषित कर सकता है। सबसे कम पूर्ण त्रुटि दर के साथ इस कार्य को लागू करने वाले ट्री को विजेता के रूप में परिभाषित किया गया है। ओवरट्रेनिंग के प्रभावों को खत्म करने के लिए विजेता सबट्री को पर्याप्त रूप से काटा गया है, लेकिन इतना नहीं कि मूल्यवान डेटा खो जाए।
चूंकि यह प्रूनिंग एल्गोरिदम गलत वर्गीकरण दर पर निर्भर करता है, प्रत्येक वर्गीकरण की संभावना को ध्यान में रखे बिना, यह कुछ उपट्री को पुनर्स्थापित करता है जिनके पत्ते सभी एक सामान्य माता-पिता के साथ समान वर्गीकरण बनाते हैं जो उस वर्गीकरण को भी बनाता है।
उद्देश्य डेटा का एक छोटा अनुपात (उदाहरण के लिए शीर्ष 1 प्रतिशत या 10 प्रतिशत) चुनना है, यह छंटाई एल्गोरिथ्म पेड़ के कार्यान्वयन को नुकसान पहुंचा सकता है, क्योंकि कुछ हटाए गए पत्तों में लक्ष्य वर्ग का एक बहुत ही उच्च क्षेत्र शामिल है . एसएएस एंटरप्राइज माइनर सहित विभिन्न उपकरण हैं, जो उपयोगकर्ता को इस तरह के तरीकों के लिए पेड़ों को बेहतर तरीके से काटने में सक्षम बनाता है।
सत्यापन सेट में डेटा को परिभाषित करने के कार्य के लिए उपयोग किए जाने पर विजेता उपट्री को इसकी पूर्ण त्रुटि दर के आधार पर चुना गया था। यह उम्मीद कर सकता है कि चयनित सबट्री एक से अधिक डेटासेट के लिए उपयोग किए जाने पर सबसे अच्छा कार्यान्वयन उपट्री बनी रहेगी, त्रुटि दर जो इसे चुने जाने के लिए उत्पन्न करती है, इसकी ताकत को थोड़ा बढ़ा सकती है।