Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

वर्गीकरण और भविष्यवाणी क्या हैं?

<घंटा/>

वर्गीकरण

वर्गीकरण एक डेटा माइनिंग विधि है जिसका उपयोग डेटा इंस्टेंस के लिए टीम सदस्यता की भविष्यवाणी करने के लिए किया जाता है। वर्गीकरण में, आय वर्ग सहित एक लक्षित श्रेणीगत चर होता है। उदाहरण के लिए, यह तीन वर्गों या श्रेणियों जैसे उच्च आय, मध्यम आय और निम्न आय में एक विभाजन हो सकता है।

डेटा माइनिंग मॉडल रिकॉर्ड के एक विशाल सेट का विश्लेषण करता है, प्रत्येक रिकॉर्ड जिसमें लक्ष्य चर पर डेटा और इनपुट या प्रेडिक्टर चर का एक सेट शामिल है। उदाहरण के लिए, तालिका में मौजूद डेटा सेट के अंश पर विचार करें।

आय वर्गीकृत करने के लिए डेटा सेट से अंश

<थेड> <थ>आयु <थ>लिंग
विषय व्यवसाय आय ब्रैकेट
001 47 महिला सॉफ्टवेयर इंजीनियर उच्च
002 28 पुरुष सलाहकार मध्य
003 35 पुरुष बेरोजगार निम्न

मान लें कि शोधकर्ता उम्र, लिंग और व्यवसाय सहित उस व्यक्ति से संबंधित अन्य विशेषताओं के आधार पर डेटाबेस में मौजूद नहीं होने वाले व्यक्तियों के आय वर्ग को वर्गीकृत करने के लिए पर्याप्त होना चाहता है। यह कार्य एक वर्गीकरण कार्य है। यह डेटा माइनिंग विधियों और तकनीकों के लिए बहुत अच्छी तरह से विनियोजित है।

एल्गोरिथ्म लगभग निम्नानुसार आगे बढ़ेगा। सबसे पहले, डेटा सेट पर विचार करें जिसमें भविष्यवक्ता चर और (पहले वर्गीकृत) लक्ष्य चर, आय वर्ग दोनों शामिल हैं।

इस पद्धति में, एल्गोरिथम समझता है कि चर के कौन से संयोजन किस आय कोष्ठक से संबंधित हैं। उदाहरण के लिए, बड़ी उम्र की महिलाओं को उच्च आय वर्ग से संबंधित किया जा सकता है। इस डेटा सेट को प्रशिक्षण सेट के रूप में जाना जाता है।

व्यवसाय और अनुसंधान में वर्गीकरण कार्यों के उदाहरणों में शामिल हैं -

  • यह तय कर सकता है कि कोई विशिष्ट क्रेडिट कार्ड लेनदेन धोखाधड़ी है या नहीं।

  • यह कुछ आवश्यकताओं के बारे में एक विशिष्ट ट्रैक में एक नए उम्मीदवार का पता लगा सकता है।

  • इसका उपयोग यह जांचने के लिए किया जा सकता है कि बंधक सॉफ़्टवेयर एक अच्छा या बुरा क्रेडिट जोखिम है या नहीं।

  • यह जांच कर सकता है कि क्या कोई विशिष्ट बीमारी एक प्रदर्शन है।

  • यह निर्धारित कर सकता है कि कुछ वित्तीय या व्यक्तिगत व्यवहार संभावित आतंकवादी खतरे को दर्शाता है या नहीं।

भविष्यवाणियां

भविष्यवाणी वर्गीकरण के समान है, सिवाय इसके कि भविष्यवाणी के लिए, परिणाम भविष्य में गलत तरीके से प्रस्तुत किए जाते हैं।

व्यापार और अनुसंधान में पूर्वानुमान कार्यों के उदाहरणों में शामिल हैं -

  • यह भविष्य में तीन महीने में स्टॉक के मूल्य की भविष्यवाणी कर सकता है।

  • यदि गति सीमा बढ़ा दी जाती है तो यह अगले वर्ष यातायात से होने वाली मौतों में प्रतिशत वृद्धि की भविष्यवाणी कर सकता है।

  • टीम के आंकड़ों की समानता के आधार पर, यह इस गिरावट की बेसबॉल वर्ल्ड सीरीज़ के विजेता की भविष्यवाणी कर सकता है।

  • यह भविष्यवाणी कर सकता है कि दवा की खोज में एक विशिष्ट अणु एक दवा संगठन के लिए एक लाभदायक नई दवा शुरू करेगा या नहीं।


  1. स्टेग्नोग्राफ़ी के फायदे और नुकसान क्या हैं?

    स्टेग्नोग्राफ़ी एक दृष्टिकोण है जो एक संदेश को छिपाने को आसान बनाता है जिसे दूसरे संदेश के भीतर गुप्त बनाए रखना है। यह परिणाम स्वयं छिपे हुए संदेश की गोपनीयता है। स्टेग्नोग्राफ़ी दृष्टिकोण का उपयोग छवियों, वीडियो फ़ाइल या ऑडियो फ़ाइल के लिए किया जा सकता है। वॉटरमार्किंग जैसे स्टेग्नोग्राफ़ी का उपयो

  1. C++ में वेरिएबल और वेरिएबल के प्रकार क्या हैं?

    एक वेरिएबल हमें नामित स्टोरेज प्रदान करता है जिसे हमारे प्रोग्राम हेरफेर कर सकते हैं। C++ में प्रत्येक वेरिएबल का एक विशिष्ट प्रकार होता है, जो वेरिएबल की मेमोरी के आकार और लेआउट को निर्धारित करता है; उस स्मृति में संग्रहीत किए जा सकने वाले मानों की श्रेणी; और संचालन का सेट जिसे चर पर लागू किया जा स

  1. सी#में स्ट्रिंग और स्ट्रिंग डेटा प्रकार क्या हैं?

    String System.String के लिए खड़ा है जबकि string System.String के लिए C# में एक उपनाम है - उदाहरण के लिए - string str = "Welcome!"; यह आवश्यक नहीं है, लेकिन आमतौर पर स्ट्रिंग का उपयोग तब किया जाता है जब आप कक्षाओं के साथ काम करते हैं - string str = String.Format("Welcome! {0}!",