लागू डेटा श्रेणियों की व्यापक विविधता और डेटा मानों के लगातार अपडेट के कारण संख्यात्मक विशेषताओं के लिए अवधारणा पदानुक्रमों को परिभाषित करना जटिल और श्रमसाध्य है। संख्यात्मक डेटा के लिए अवधारणा पदानुक्रम पीढ़ी के विभिन्न तरीके इस प्रकार हैं -
बिनिंग - बिनिंग एक निश्चित संख्या में डिब्बे के आधार पर एक टॉप-डाउन विभाजन तकनीक है। इन विधियों का उपयोग संख्यात्मकता में कमी और अवधारणा पदानुक्रम पीढ़ी के लिए विवेकीकरण विधियों के रूप में भी किया जाता है। अवधारणा पदानुक्रम बनाने के लिए इन तकनीकों को परिणामी विभाजन के लिए पुनरावर्ती रूप से उपयोग किया जा सकता है। बिनिंग वर्ग डेटा का उपयोग नहीं करता है और इसलिए, एक अनुपयोगी विवेकीकरण तकनीक है। यह उपयोगकर्ता द्वारा निर्दिष्ट संख्या में डिब्बे, और बाहरी लोगों की उपस्थिति के लिए अतिसंवेदनशील है।
हिस्टोग्राम विश्लेषण - बिनिंग की तरह, हिस्टोग्राम विश्लेषण एक अनियंत्रित विवेकीकरण तकनीक है क्योंकि यह वर्ग डेटा का उपयोग नहीं करता है। हिस्टोग्राम एक विशेषता, ए के लिए मानों को बकेट के रूप में ज्ञात असंबद्ध श्रेणियों में विभाजित करते हैं। एक समान-चौड़ाई वाले हिस्टोग्राम में, उदाहरण के लिए, मूल्यों को समान आकार के विभाजन या मूल्य के लिए श्रेणियों में विभाजित किया जाता है, जहां प्रत्येक बाल्टी की चौड़ाई $ 10 होती है)। एक समान आवृत्ति हिस्टोग्राम के साथ, मानों को विभाजित किया जाता है, ताकि प्रत्येक विभाजन में समान संख्या में डेटा टुपल्स हों।
हिस्टोग्राम विश्लेषण एल्गोरिथ्म को प्रत्येक विभाजन के लिए पुनरावर्ती रूप से लागू किया जा सकता है ताकि स्वचालित रूप से एक बहुस्तरीय अवधारणा पदानुक्रम उत्पन्न हो, एक बार पूर्व-निर्दिष्ट अवधारणा स्तरों की संख्या तक पहुंचने के बाद प्रक्रिया समाप्त हो जाती है।
पुनरावर्ती प्रक्रिया को नियंत्रित करने के लिए प्रति स्तर न्यूनतम अंतराल आकार का भी उपयोग किया जा सकता है। यह एक विभाजन की न्यूनतम चौड़ाई या प्रत्येक स्तर पर प्रत्येक विभाजन के लिए मूल्यों की न्यूनतम संख्या निर्दिष्ट करता है।
एंट्रॉपी-आधारित विवेकीकरण - एंट्रोपी आमतौर पर विवेकाधिकार उपायों का उपयोग किया जाता है। इसे पहली बार क्लाउड शैनन ने सूचना सिद्धांत और सूचना लाभ की अवधारणा पर अपने अग्रणी कार्य में पेश किया था।
एन्ट्रॉपी-आधारित विवेकीकरण एक पर्यवेक्षित, ऊपर-नीचे विभाजन तकनीक है। यह अपनी गणना और विभाजन बिंदुओं के निर्धारण में वर्ग वितरण डेटा की खोज करता है (एक विशेषता श्रेणी को विभाजित करने के लिए डेटा मान)।
क्लस्टर विश्लेषण - क्लस्टर विश्लेषण एक लोकप्रिय डेटा विवेकीकरण विधि है। क्लस्टर या समूहों में ए के मानों को विभाजित करके एक संख्यात्मक विशेषता, ए को अलग करने के लिए क्लस्टरिंग एल्गोरिदम लागू किया जा सकता है।
क्लस्टरिंग ए के वितरण के साथ-साथ डेटा बिंदुओं की निकटता पर विचार करता है, और इसलिए उच्च गुणवत्ता वाले विवेकीकरण परिणाम उत्पन्न कर सकता है। क्लस्टरिंग का उपयोग ए के लिए एक अवधारणा पदानुक्रम उत्पन्न करने के लिए किया जा सकता है, या तो एक टॉप-डाउन विभाजन रणनीति या एक बॉटम-अप मर्जिंग रणनीति का पालन करके, जहां प्रत्येक क्लस्टर अवधारणा पदानुक्रम का एक नोड बनाता है।