वर्गीकरण
वर्गीकरण एक डेटा माइनिंग विधि है जिसका उपयोग डेटा इंस्टेंस के लिए टीम सदस्यता की भविष्यवाणी करने के लिए किया जाता है। वर्गीकरण में, आय वर्ग सहित एक लक्षित श्रेणीगत चर होता है। उदाहरण के लिए, यह तीन वर्गों या श्रेणियों जैसे उच्च आय, मध्यम आय और निम्न आय में एक विभाजन हो सकता है।
डेटा माइनिंग मॉडल रिकॉर्ड के एक विशाल सेट का विश्लेषण करता है, प्रत्येक रिकॉर्ड जिसमें लक्ष्य चर पर डेटा और इनपुट या प्रेडिक्टर चर का एक सेट शामिल है। उदाहरण के लिए, तालिका में मौजूद डेटा सेट के अंश पर विचार करें।
आय वर्गीकृत करने के लिए डेटा सेट से अंश
विषय | <थ>आयुवें> <थ>लिंगव्यवसाय | आय ब्रैकेट | ||
---|---|---|---|---|
001 | 47 | महिला | सॉफ्टवेयर इंजीनियर | उच्च |
002 | 28 | पुरुष | सलाहकार | मध्य |
003 | 35 | पुरुष | बेरोजगार | निम्न |
मान लें कि शोधकर्ता उम्र, लिंग और व्यवसाय सहित उस व्यक्ति से संबंधित अन्य विशेषताओं के आधार पर डेटाबेस में मौजूद नहीं होने वाले व्यक्तियों के आय वर्ग को वर्गीकृत करने के लिए पर्याप्त होना चाहता है। यह कार्य एक वर्गीकरण कार्य है। यह डेटा माइनिंग विधियों और तकनीकों के लिए बहुत अच्छी तरह से विनियोजित है।
एल्गोरिथ्म लगभग निम्नानुसार आगे बढ़ेगा। सबसे पहले, डेटा सेट पर विचार करें जिसमें भविष्यवक्ता चर और (पहले वर्गीकृत) लक्ष्य चर, आय वर्ग दोनों शामिल हैं।
इस पद्धति में, एल्गोरिथम समझता है कि चर के कौन से संयोजन किस आय कोष्ठक से संबंधित हैं। उदाहरण के लिए, बड़ी उम्र की महिलाओं को उच्च आय वर्ग से संबंधित किया जा सकता है। इस डेटा सेट को प्रशिक्षण सेट के रूप में जाना जाता है।
व्यवसाय और अनुसंधान में वर्गीकरण कार्यों के उदाहरणों में शामिल हैं -
-
यह तय कर सकता है कि कोई विशिष्ट क्रेडिट कार्ड लेनदेन धोखाधड़ी है या नहीं।
-
यह कुछ आवश्यकताओं के बारे में एक विशिष्ट ट्रैक में एक नए उम्मीदवार का पता लगा सकता है।
-
इसका उपयोग यह जांचने के लिए किया जा सकता है कि बंधक सॉफ़्टवेयर एक अच्छा या बुरा क्रेडिट जोखिम है या नहीं।
-
यह जांच कर सकता है कि क्या कोई विशिष्ट बीमारी एक प्रदर्शन है।
-
यह निर्धारित कर सकता है कि कुछ वित्तीय या व्यक्तिगत व्यवहार संभावित आतंकवादी खतरे को दर्शाता है या नहीं।
भविष्यवाणियां
भविष्यवाणी वर्गीकरण के समान है, सिवाय इसके कि भविष्यवाणी के लिए, परिणाम भविष्य में गलत तरीके से प्रस्तुत किए जाते हैं।
व्यापार और अनुसंधान में पूर्वानुमान कार्यों के उदाहरणों में शामिल हैं -
-
यह भविष्य में तीन महीने में स्टॉक के मूल्य की भविष्यवाणी कर सकता है।
-
यदि गति सीमा बढ़ा दी जाती है तो यह अगले वर्ष यातायात से होने वाली मौतों में प्रतिशत वृद्धि की भविष्यवाणी कर सकता है।
-
टीम के आंकड़ों की समानता के आधार पर, यह इस गिरावट की बेसबॉल वर्ल्ड सीरीज़ के विजेता की भविष्यवाणी कर सकता है।
-
यह भविष्यवाणी कर सकता है कि दवा की खोज में एक विशिष्ट अणु एक दवा संगठन के लिए एक लाभदायक नई दवा शुरू करेगा या नहीं।