दो प्रकार के सांख्यिकीय-आधारित एल्गोरिदम हैं जो इस प्रकार हैं -
-
प्रतिगमन - रिग्रेशन मुद्दे इनपुट वैल्यू पर स्थित आउटपुट वैल्यू के मूल्यांकन से संबंधित हैं। जब वर्गीकरण के लिए उपयोग किया जाता है, तो इनपुट मान डेटाबेस से मान होते हैं और आउटपुट मान कक्षाओं को परिभाषित करते हैं। प्रतिगमन का उपयोग वर्गीकरण के मुद्दों को स्पष्ट करने के लिए किया जा सकता है, लेकिन इसका उपयोग पूर्वानुमान सहित विभिन्न अनुप्रयोगों के लिए किया जाता है। प्रतिगमन का प्राथमिक रूप सरल रैखिक प्रतिगमन है जिसमें केवल एक भविष्यवक्ता और एक भविष्यवाणी शामिल है।
प्रतिगमन का उपयोग दो विभिन्न विधियों का उपयोग करके वर्गीकरण को लागू करने के लिए किया जा सकता है जो इस प्रकार हैं -
-
डिवीजन - डेटा को वर्ग के आधार पर क्षेत्रों में बांटा गया है।
-
भविष्यवाणी - आउटपुट वर्ग के मूल्य का अनुमान लगाने के लिए सूत्र बनाए जाते हैं।
-
-
बायेसियन वर्गीकरण - वर्गीकरण के लिए सांख्यिकीय वर्गीकरण का उपयोग किया जाता है। बायेसियन वर्गीकरण बेयस प्रमेय पर आधारित है। उच्च डेटाबेस के लिए उपयोग किए जाने पर बायेसियन क्लासिफायर उच्च दक्षता और गति देखते हैं।
बेयस प्रमेय - मान लीजिए कि X एक डेटा टपल है। बायेसियन पद्धति में, X को "साक्ष्य" के रूप में माना जाता है। एच को कुछ परिकल्पना होने दें, जिसमें डेटा टपल एक्स एक विशेष वर्ग सी से संबंधित है। संभावना पी (एच | एक्स) डेटा को परिभाषित करने का निर्णय लिया गया है। यह प्रायिकता P (H|X) प्रायिकता है कि परिकल्पना H के प्रभाव ने "सबूत" दिया है या डेटा टपल X देखा है।
पी (एच | एक्स) एक्स पर एच की स्थिति के बाद की संभावना है। उदाहरण के लिए, डेटा टुपल्स की प्रकृति पर विचार करें, जो आमतौर पर विशेषता आयु और आय द्वारा परिभाषित उपयोगकर्ताओं तक सीमित है, और यह कि एक्स 30 वर्ष का उपयोगकर्ता है, जिसके पास रु। 20,000 आय। मान लें कि एच परिकल्पना है कि उपयोगकर्ता कंप्यूटर खरीदेगा। इस प्रकार P (H|X) इस संभावना को उलट देता है कि उपयोगकर्ता X एक कंप्यूटर खरीदेगा, यह देखते हुए कि उपयोगकर्ता की आयु और आय को स्वीकार किया गया है।
पी (एच) एच की पूर्व संभावना है। उदाहरण के लिए, यह संभावना है कि कोई भी उपयोगकर्ता उम्र, आय या कुछ अन्य डेटा की परवाह किए बिना कंप्यूटर खरीदेगा। पश्च प्रायिकता P (H|X) पूर्व प्रायिकता P (H) की तुलना में अधिक डेटा पर स्थित है, जो X से मुक्त है।
इसी तरह, P (X|H) H पर वातानुकूलित X की पश्च प्रायिकता है। यह संभावना है कि एक उपयोगकर्ता X 30 वर्ष का है और रुपये का लाभ उठाता है। 20,000.
पी (एच), पी (एक्स|एच), और पी (एक्स) को दी गई जानकारी से मापा जा सकता है। बेयस प्रमेय पी (एच), पी (एक्स | एच), और पी (एक्स) से पश्च संभाव्यता पी (एच | एक्स) की गणना करने की एक विधि का समर्थन करता है। यह
. द्वारा दिया गया है
$$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$$