Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

इंटरैक्टिव डिसीजन ट्री निर्माण का समर्थन करने के लिए डेटा की कल्पना कैसे की जा सकती है?

<घंटा/>

धारणा-आधारित वर्गीकरण (पीबीसी) बहुआयामी विज़ुअलाइज़ेशन विधियों पर आधारित एक इंटरैक्टिव विधि है और उपयोगकर्ता को निर्णय वृक्ष का निर्माण करते समय डेटा के बारे में पृष्ठभूमि ज्ञान को शामिल करने में सक्षम बनाता है।

डेटा के साथ वैकल्पिक रूप से बातचीत करके, उपयोगकर्ता डेटा की गहन शिक्षा का उत्पादन करने की संभावना रखता है। परिणामी पेड़ पारंपरिक डिसीजन ट्री इंडक्शन तकनीकों का उपयोग करने वाले निर्माण से छोटे होने की संभावना है और इसलिए समान सटीकता प्राप्त करते हुए व्याख्या करना आसान है।

पीबीसी को अपने वर्ग लेबल डेटा के साथ बहुआयामी डेटा पर विचार करने के लिए पिक्सेल-उन्मुख विधि की आवश्यकता है। सर्कल सेगमेंट विधि को अनुकूलित किया जाता है, जो डी-डायमेंशनल इंफॉर्मेशन ऑब्जेक्ट्स को एक सर्कल में मैप करता है जो डी सेगमेंट में विभाजित होता है, प्रत्येक एक विशेषता को परिभाषित करता है।

डेटा तत्व का एक विशेषता मान एक रंगीन पिक्सेल में मैप किया जाता है, जो ऑब्जेक्ट के क्लास लेबल को आत्मनिरीक्षण करता है। यह मैपिंग प्रत्येक डेटा ऑब्जेक्ट की प्रत्येक विशेषता-मूल्य जोड़ी के लिए पूर्ण होती है। एक सेगमेंट के भीतर व्यवस्था श्रृंखला तय करने के लिए प्रत्येक विशेषता के लिए छँटाई पूरी की जाती है।

उदाहरण के लिए, किसी दिए गए सेगमेंट के भीतर विशेषता मानों को व्यवस्थित किया जा सकता है ताकि समान विशेषता मान के भीतर सजातीय (वर्ग लेबल से संबंधित) क्षेत्रों को दिखाया जा सके। एक समय में अनुमानित प्रशिक्षण जानकारी की मात्रा लगभग कई विशेषताओं और कई डेटा ऑब्जेक्ट के उत्पाद द्वारा तय की जाती है।

PBC सिस्टम एक स्प्लिट स्क्रीन दिखाता है, जिसमें डेटा इंटरेक्शन विंडो और एक नॉलेज इंटरेक्शन विंडो शामिल है। डेटा इंटरेक्शन विंडो चेकिंग के तहत डेटा के सर्कल सेगमेंट दिखाती है, जबकि नॉलेज इंटरेक्शन विंडो अब तक बनाए गए डिसीजन ट्री को दिखाती है। संपूर्ण प्रशिक्षण सेट को डेटा इंटरैक्शन विंडो में देखा जाता है, जबकि नॉलेज इंटरेक्शन विंडो एक शून्य निर्णय ट्री दिखाती है।

पारंपरिक निर्णय ट्री एल्गोरिदम सांख्यिकीय विशेषताओं के लिए केवल बाइनरी विभाजन को सक्षम करते हैं। पीबीसी उपयोगकर्ता को कई विभाजन-बिंदुओं को परिभाषित करने में सक्षम बनाता है, जिसके परिणामस्वरूप कई शाखाएं एक व्यक्तिगत पेड़ नोड से उगाई जाती हैं।

एक पेड़ अंतःक्रियात्मक रूप से निम्नानुसार बनाया गया है। उपयोगकर्ता डेटा इंटरेक्शन विंडो में बहुआयामी डेटा का अनुमान लगाता है और एक विभाजन विशेषता और कई विभाजन-बिंदुओं का चयन करता है। नॉलेज इंटरेक्शन विंडो में आधुनिक डिसीजन ट्री का विस्तार किया गया है।

उपयोगकर्ता निर्णय वृक्ष का एक नोड चुनता है। उपयोगकर्ता नोड के लिए एक क्लास लेबल बना सकता है (जो नोड को एक पत्ता बनाता है) या नोड के बराबर प्रशिक्षण जानकारी के विज़ुअलाइज़ेशन का अनुरोध कर सकता है। यह प्रत्येक विशेषता के एक नए विज़ुअलाइज़ेशन की ओर जाता है, सिवाय रूट से समान पथ पर विभाजित तत्व के लिए उपयोग किए जाने वाले को छोड़कर। इंटरएक्टिव प्रक्रिया तब तक जारी रहती है जब तक कि डिसीजन ट्री के हर पत्ते पर एक क्लास नहीं बन जाती।


  1. पायथन में सीबॉर्न का उपयोग करके एक रैखिक संबंध की कल्पना कैसे की जा सकती है?

    सीबॉर्न एक पुस्तकालय है जो डेटा की कल्पना करने में मदद करता है। यह अनुकूलित थीम और एक उच्च-स्तरीय इंटरफ़ेस के साथ आता है। जब प्रतिगमन मॉडल बनाया जा रहा है, तो बहुसंकेतन की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि

  1. पायथन सीबॉर्न लाइब्रेरी में डेटा की कल्पना करने के लिए काउंटप्लॉट का उपयोग कैसे किया जा सकता है?

    सीबॉर्न एक पुस्तकालय है जो डेटा की कल्पना करने में मदद करता है। यह अनुकूलित थीम और एक उच्च-स्तरीय इंटरफ़ेस के साथ आता है। पिछले प्लॉट्स में, हमने पूरे डेटासेट को ग्राफ पर प्लॉट किया था। बार प्लॉट की मदद से हम डेटा के वितरण की केंद्रीय प्रवृत्ति को समझ सकते हैं। बारप्लॉट फ़ंक्शन एक श्रेणीगत चर और ए

  1. मैं अपने डेटा का बैकअप कैसे ले सकता हूं?

    आज की आईटी दुनिया में एक व्यापक बैकअप रणनीति होना आवश्यक है। डेटा खो जाने के कई तरीकों के साथ, यह समझना महत्वपूर्ण है कि अपने डेटा का सफलतापूर्वक बैकअप कैसे लिया जाए ताकि यह सुनिश्चित हो सके कि आपको असहज स्थिति का सामना न करना पड़े। तो, आप अपने डेटा का बैकअप कैसे ले सकते हैं? डेटा हानि साइबर हमले,