Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

बायेसियन वर्गीकरण के प्रमुख विचार क्या हैं?

<घंटा/>

वर्गीकरण एक डेटा माइनिंग दृष्टिकोण है जिसका उपयोग डेटा इंस्टेंस के लिए टीम सदस्यता की भविष्यवाणी करने के लिए किया जाता है। यह दो चरणों वाली प्रक्रिया है। पहले चरण में, डेटा वर्गों या दृष्टिकोणों के पूर्व निर्धारित सेट को परिभाषित करते हुए एक मॉडल बनाया जाता है। मॉडल को विशेषताओं द्वारा परिभाषित डेटाबेस टुपल्स पर विचार करके विकसित किया गया है।

यह एक ताजा प्रस्तुत वस्तु की विशेषताओं का विश्लेषण करने और इसे कक्षाओं के पूर्व-निर्धारित संग्रह में से एक बनाने का कार्य है। वर्गीकरण नियमों को सीखने के लिए, सिस्टम को उन नियमों की खोज करनी होती है जो भविष्यवाणी करने वाली विशेषताओं से कक्षा की भविष्यवाणी करते हैं, इसलिए सबसे पहले प्रत्येक वर्ग के लिए शर्तों का प्रतिनिधित्व किया जाना चाहिए। सिस्टम को विशिष्ट ज्ञात विशेषता मानों के साथ एक केस या टपल दिया जाना चाहिए ताकि यह अनुमान लगाया जा सके कि यह मामला किस वर्ग पर लागू होता है।

एक बार वर्गों को परिभाषित करने के बाद, सिस्टम को उन नियमों का अनुमान लगाना चाहिए जो वर्गीकरण को नियंत्रित करते हैं, इस प्रकार सिस्टम को प्रत्येक वर्ग के प्रतिनिधित्व की खोज करने में सक्षम होना चाहिए। विवरण को केवल प्रशिक्षण सेट की भविष्यवाणी विशेषताओं को परिभाषित करना चाहिए ताकि केवल सकारात्मक उदाहरण ही लक्षण वर्णन को संतुष्ट कर सकें, न कि नकारात्मक उदाहरण। एक नियम सही है यदि इसकी परिभाषा में सभी सकारात्मक उदाहरण शामिल हैं और किसी वर्ग के नकारात्मक उदाहरणों में से कोई भी शामिल नहीं है।

बायेसियन वर्गीकरण - बायेसियन क्लासिफायर सांख्यिकीय क्लासिफायरियर हैं। वे वर्ग सदस्यता संभावनाओं की भविष्यवाणी कर सकते हैं, जिसमें संभावना भी शामिल है कि दिया गया नमूना एक विशिष्ट वर्ग से संबंधित है। उच्च डेटाबेस के लिए उपयोग किए जाने पर बायेसियन क्लासिफायर ने उच्च दक्षता और गति भी दिखाई है।

भोले बायेसियन क्लासिफायर का मानना ​​​​है कि किसी दिए गए वर्ग पर एक विशेषता मान का प्रभाव विभिन्न विशेषताओं के मूल्यों से स्वायत्त होता है। इस धारणा को वर्ग सशर्त स्वतंत्रता के रूप में जाना जाता है। यह निहित मूल्यांकन को परिभाषित करने के लिए बनाया गया है और इसे भोला माना जाता है।

बेयस प्रमेयबेयस प्रमेय - मान लीजिए कि X एक डेटा टपल है। बायेसियन पद्धति में, X को "साक्ष्य" के रूप में माना जाता है। एच को कुछ परिकल्पना होने दें, जिसमें डेटा टपल एक्स एक विशेष वर्ग सी से संबंधित है। संभावना पी (एच | एक्स) डेटा को परिभाषित करने का निर्णय लिया गया है। यह प्रायिकता P (H|X) प्रायिकता है कि परिकल्पना H के प्रभाव ने "सबूत" दिया है या डेटा टपल X देखा है।

पी (एच | एक्स) एक्स पर एच की स्थिति के बाद की संभावना है। उदाहरण के लिए, डेटा टुपल्स की प्रकृति पर विचार करें, जो आमतौर पर विशेषता आयु और आय द्वारा परिभाषित उपयोगकर्ताओं तक सीमित है, और यह कि एक्स 30 वर्ष का उपयोगकर्ता है, जिसके पास रु। 20,000 आय। मान लें कि एच परिकल्पना है कि उपयोगकर्ता कंप्यूटर खरीदेगा। इस प्रकार P (H|X) इस संभावना को उलट देता है कि उपयोगकर्ता X एक कंप्यूटर खरीदेगा, यह देखते हुए कि उपयोगकर्ता की आयु और आय को स्वीकार किया गया है।

पी (एच) एच की पूर्व संभावना है। उदाहरण के लिए, यह संभावना है कि कोई भी उपयोगकर्ता उम्र, आय या कुछ अन्य डेटा की परवाह किए बिना कंप्यूटर खरीदेगा। पश्च प्रायिकता P (H|X) पूर्व प्रायिकता P (H) की तुलना में अधिक डेटा पर स्थित है, जो X से मुक्त है।

इसी तरह, P (X|H) H पर वातानुकूलित X की पश्च प्रायिकता है। यह संभावना है कि एक उपयोगकर्ता X 30 वर्ष का है और रुपये का लाभ उठाता है। 20,000.

पी (एच), पी (एक्स|एच), और पी (एक्स) को दी गई जानकारी से मापा जा सकता है। बेयस प्रमेय पी (एच), पी (एक्स | एच), और पी (एक्स) से पश्च संभाव्यता पी (एच | एक्स) की गणना करने की एक विधि का समर्थन करता है। यह

. द्वारा दिया गया है

$$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$$


  1. सूचना सुरक्षा में सुरक्षा हमलों का वर्गीकरण क्या है?

    सुरक्षा हमले के विभिन्न वर्गीकरण इस प्रकार हैं - क्रिप्टैनालिटिक हमले - ये हमले सांख्यिकीय और बीजगणितीय तकनीकों का संयोजन हैं जिनका उद्देश्य एक सिफर की गुप्त कुंजी सुनिश्चित करना है। ये तकनीक क्रिप्टोग्राफ़िक एल्गोरिदम के संख्यात्मक गुणों का निरीक्षण करती हैं और इसका उद्देश्य समान वितरण से क्रिप्

  1. सी टोकन क्या हैं?

    सी प्रोग्राम निर्देशों का एक संग्रह है और प्रत्येक निर्देश अलग-अलग इकाइयों का संग्रह है। C प्रोग्राम की प्रत्येक छोटी व्यक्तिगत इकाई को आम तौर पर टोकन कहा जाता है और C प्रोग्राम में प्रत्येक निर्देश टोकन का एक संग्रह होता है। टोकन का उपयोग C प्रोग्राम के निर्माण के लिए किया जाता है और उन्हें C प्र

  1. सी # में टिप्पणियां क्या हैं?

    टिप्पणियों का उपयोग कोड समझाने के लिए किया जाता है। संकलक टिप्पणी प्रविष्टियों की उपेक्षा करते हैं। C# प्रोग्राम में बहुपंक्ति टिप्पणियाँ /* से शुरू होती हैं और नीचे दिखाए गए अनुसार */ के साथ समाप्त होती हैं। बहु-पंक्ति टिप्पणियां /* The following is a mult-line comment In C# /* . में एक बहु-पंक्ति