इंटरैक्टिव डिसीजन ट्री निर्माण का समर्थन करने के लिए डेटा की कल्पना कैसे की जा सकती है?

<घंटा/>

धारणा-आधारित वर्गीकरण (पीबीसी) बहुआयामी विज़ुअलाइज़ेशन विधियों पर आधारित एक इंटरैक्टिव विधि है और उपयोगकर्ता को निर्णय वृक्ष का निर्माण करते समय डेटा के बारे में पृष्ठभूमि ज्ञान को शामिल करने में सक्षम बनाता है।

डेटा के साथ वैकल्पिक रूप से बातचीत करके, उपयोगकर्ता डेटा की गहन शिक्षा का उत्पादन करने की संभावना रखता है। परिणामी पेड़ पारंपरिक डिसीजन ट्री इंडक्शन तकनीकों का उपयोग करने वाले निर्माण से छोटे होने की संभावना है और इसलिए समान सटीकता प्राप्त करते हुए व्याख्या करना आसान है।

पीबीसी को अपने वर्ग लेबल डेटा के साथ बहुआयामी डेटा पर विचार करने के लिए पिक्सेल-उन्मुख विधि की आवश्यकता है। सर्कल सेगमेंट विधि को अनुकूलित किया जाता है, जो डी-डायमेंशनल इंफॉर्मेशन ऑब्जेक्ट्स को एक सर्कल में मैप करता है जो डी सेगमेंट में विभाजित होता है, प्रत्येक एक विशेषता को परिभाषित करता है।

डेटा तत्व का एक विशेषता मान एक रंगीन पिक्सेल में मैप किया जाता है, जो ऑब्जेक्ट के क्लास लेबल को आत्मनिरीक्षण करता है। यह मैपिंग प्रत्येक डेटा ऑब्जेक्ट की प्रत्येक विशेषता-मूल्य जोड़ी के लिए पूर्ण होती है। एक सेगमेंट के भीतर व्यवस्था श्रृंखला तय करने के लिए प्रत्येक विशेषता के लिए छँटाई पूरी की जाती है।

उदाहरण के लिए, किसी दिए गए सेगमेंट के भीतर विशेषता मानों को व्यवस्थित किया जा सकता है ताकि समान विशेषता मान के भीतर सजातीय (वर्ग लेबल से संबंधित) क्षेत्रों को दिखाया जा सके। एक समय में अनुमानित प्रशिक्षण जानकारी की मात्रा लगभग कई विशेषताओं और कई डेटा ऑब्जेक्ट के उत्पाद द्वारा तय की जाती है।

PBC सिस्टम एक स्प्लिट स्क्रीन दिखाता है, जिसमें डेटा इंटरेक्शन विंडो और एक नॉलेज इंटरेक्शन विंडो शामिल है। डेटा इंटरेक्शन विंडो चेकिंग के तहत डेटा के सर्कल सेगमेंट दिखाती है, जबकि नॉलेज इंटरेक्शन विंडो अब तक बनाए गए डिसीजन ट्री को दिखाती है। संपूर्ण प्रशिक्षण सेट को डेटा इंटरैक्शन विंडो में देखा जाता है, जबकि नॉलेज इंटरेक्शन विंडो एक शून्य निर्णय ट्री दिखाती है।

पारंपरिक निर्णय ट्री एल्गोरिदम सांख्यिकीय विशेषताओं के लिए केवल बाइनरी विभाजन को सक्षम करते हैं। पीबीसी उपयोगकर्ता को कई विभाजन-बिंदुओं को परिभाषित करने में सक्षम बनाता है, जिसके परिणामस्वरूप कई शाखाएं एक व्यक्तिगत पेड़ नोड से उगाई जाती हैं।

एक पेड़ अंतःक्रियात्मक रूप से निम्नानुसार बनाया गया है। उपयोगकर्ता डेटा इंटरेक्शन विंडो में बहुआयामी डेटा का अनुमान लगाता है और एक विभाजन विशेषता और कई विभाजन-बिंदुओं का चयन करता है। नॉलेज इंटरेक्शन विंडो में आधुनिक डिसीजन ट्री का विस्तार किया गया है।

उपयोगकर्ता निर्णय वृक्ष का एक नोड चुनता है। उपयोगकर्ता नोड के लिए एक क्लास लेबल बना सकता है (जो नोड को एक पत्ता बनाता है) या नोड के बराबर प्रशिक्षण जानकारी के विज़ुअलाइज़ेशन का अनुरोध कर सकता है। यह प्रत्येक विशेषता के एक नए विज़ुअलाइज़ेशन की ओर जाता है, सिवाय रूट से समान पथ पर विभाजित तत्व के लिए उपयोग किए जाने वाले को छोड़कर। इंटरएक्टिव प्रक्रिया तब तक जारी रहती है जब तक कि डिसीजन ट्री के हर पत्ते पर एक क्लास नहीं बन जाती।