डिसीजन ट्री इंडक्शन क्लास-लेबल ट्रेनिंग टुपल्स से डिसीजन ट्री की सीख है। एक निर्णय वृक्ष एक अनुक्रमिक आरेख-जैसी वृक्ष संरचना है, जहां प्रत्येक आंतरिक नोड (गैर-पत्ती नोड) एक विशेषता पर एक परीक्षण इंगित करता है, प्रत्येक शाखा परीक्षण के परिणाम को परिभाषित करती है, और प्रत्येक पत्ता नोड (या टर्मिनल नोड) एक वर्ग को प्रभावित करता है लेबल। पेड़ में सबसे बड़ा नोड रूट नोड होता है।
डिसीजन ट्री इंडक्शन एक फ़्लोचार्ट-जैसी संरचना उत्पन्न करता है जहाँ प्रत्येक आंतरिक (गैर-पत्ती) नोड एक विशेषता पर एक परीक्षण को इंगित करता है, प्रत्येक शाखा परीक्षण के परिणाम से मेल खाती है, और प्रत्येक बाहरी (पत्ती) नोड एक वर्ग भविष्यवाणी को इंगित करता है।
प्रत्येक नोड पर, एल्गोरिथ्म डेटा को एकल वर्गों में विभाजित करने के लिए "सर्वश्रेष्ठ" विशेषता का चयन करता है। जब डिसीजन ट्री इंडक्शन का उपयोग विशेषता उपसमुच्चय चयन के लिए किया जाता है, तो दिए गए डेटा से एक ट्री उत्पन्न होता है।
कुछ विशेषताएँ जो पेड़ में नहीं होती हैं उन्हें अप्रासंगिक माना जाता है। ट्री में होने वाली विशेषताओं का समूह विशेषताओं के घटे हुए उपसमूह का निर्माण करता है। डिसीजन ट्री इंडक्शन एल्गोरिदम एक विशेषता परीक्षण स्थिति को परिभाषित करने के लिए एक दृष्टिकोण का समर्थन करता है और कई विशेषता प्रकारों के लिए इसके सहसंबंधी परिणाम।
द्विआधारी गुण - एक द्विआधारी विशेषता 0 या 1 सहित केवल दो तत्वों या राज्यों के साथ एक नाममात्र विशेषता है, जहां 0 अक्सर दर्शाता है कि विशेषता अनुपस्थित है, और 1 यह दर्शाता है कि यह मौजूद है। बाइनरी विशेषताओं को बूलियन के रूप में परिभाषित किया जाता है यदि दो राज्य सत्य और असत्य के बराबर हैं।
एक बाइनरी विशेषता सममित होती है यदि इसके दोनों राज्य समान मूल्यवान हैं और समान वजन बनाते हैं। ऐसी कोई वरीयता नहीं है जिस पर परिणाम 0 या 1 के रूप में कोडित होना चाहिए। एक उदाहरण विशेषता लिंग हो सकता है जिसमें राज्य पुरुष और महिला हो।
एक द्विआधारी विशेषता असममित है यदि राज्यों के परिणाम समान रूप से आवश्यक नहीं हैं, जैसे एचआईवी के लिए चिकित्सा जांच के सकारात्मक और नकारात्मक परिणाम। परंपरा के अनुसार, यह सबसे आवश्यक परिणाम को कोड कर सकता है, जो आम तौर पर निकटतम होता है, 1 (जैसे, एचआईवी पॉजिटिव) और भिन्न 0 (जैसे, एचआईवी नकारात्मक)।
नाममात्र गुण -नाममात्र नामों के साथ संबद्धता को परिभाषित करता है। नाममात्र की विशेषता के मूल्य प्रतीक या चीजों के नाम हैं। प्रत्येक मान किसी प्रकार की श्रेणी, कोड, या राज्य आदि को परिभाषित करता है। नाममात्र विशेषताओं को श्रेणीबद्ध के रूप में परिभाषित किया गया है। मानों का कोई महत्वपूर्ण क्रम नहीं है। कंप्यूटर विज्ञान में, मानों को एन्यूमरेशन भी कहा जाता है।
साधारण गुण - एक क्रमसूचक विशेषता लागू मूल्यों के साथ एक विशेषता है जिसमें उनके बीच एक आवश्यक श्रृंखला या रैंकिंग होती है, लेकिन लगातार मूल्यों के बीच का परिमाण अज्ञात होता है।
सामान्य विशेषताएँ बाइनरी या मल्टीवे विभाजन कर सकती हैं। समूहीकरण विशेषता मानों की क्रम प्रकृति का उल्लंघन नहीं करता है, इस पर विचार करते हुए सामान्य विशेषता मानों को जोड़ा जा सकता है।
संख्यात्मक विशेषताएं - एक संख्यात्मक विशेषता मात्रात्मक है। यह एक गणना योग्य मात्रा है, जिसे संख्यात्मक या वास्तविक मूल्यों में दर्शाया जाता है। इसे अंतराल-स्केल या अनुपात-स्केल किया जा सकता है।