प्रतिगमन एक प्रकार की पर्यवेक्षित मशीन सीखने के दृष्टिकोण को परिभाषित करता है जिसका उपयोग किसी भी निरंतर-मूल्यवान विशेषता का पूर्वानुमान लगाने के लिए किया जा सकता है। प्रतिगमन लक्ष्य चर और भविष्यवक्ता चर संघों का पता लगाने के लिए कुछ व्यावसायिक संगठन प्रदान करता है। यह डेटा का पता लगाने के लिए एक आवश्यक उपकरण है जिसका उपयोग मौद्रिक पूर्वानुमान और समय श्रृंखला मॉडलिंग के लिए किया जा सकता है।
डेटा को फ़ंक्शन में फ़िट करके डेटा को सुचारू किया जा सकता है, जैसे प्रतिगमन के साथ। रैखिक प्रतिगमन में दो विशेषताओं (या चर) को फिट करने के लिए "सर्वश्रेष्ठ" रेखा की खोज करना शामिल है ताकि एक विशेषता का उपयोग दूसरे की भविष्यवाणी करने के लिए किया जा सके। कई रेखीय प्रतिगमन रैखिक प्रतिगमन की प्रगति है, जहां दो से अधिक विशेषताओं को शामिल किया जाता है और डेटा एक बहुआयामी स्थान के लिए उपयुक्त होते हैं।
रैखिक प्रतिगमन में, डेटा को एक सीधी रेखा में फिट करने के लिए तैयार किया जाता है। उदाहरण के लिए, एक यादृच्छिक चर, y (प्रतिक्रिया चर कहा जाता है), को एक अन्य यादृच्छिक चर, x (भविष्यवक्ता चर कहा जाता है) के रैखिक कार्य के रूप में तैयार किया जा सकता है, समीकरण y =wx + b के साथ, जहां y का विचरण माना जाता है स्थिर रहना।
प्रतिगमन मुद्दे इनपुट मानों पर रखे गए आउटपुट मान की गणना के साथ प्रबंधित होते हैं। जब वर्गीकरण के लिए उपयोग किया जाता है, तो इनपुट मान डेटाबेस से मान होते हैं और आउटपुट मान कक्षाओं का प्रतिनिधित्व करते हैं। प्रतिगमन का उपयोग वर्गीकरण समस्याओं का पता लगाने के लिए किया जा सकता है, लेकिन इसका उपयोग कई अनुप्रयोगों जैसे कि पूर्वानुमान के लिए किया जा सकता है। प्रतिगमन की प्राथमिक संरचना सरल रैखिक प्रतिगमन है जिसमें केवल एक भविष्यवक्ता और एक भविष्यवाणी शामिल है।
प्रतिगमन का उपयोग दो विधियों का उपयोग करके वर्गीकरण करने के लिए किया जा सकता है जो इस प्रकार हैं -
-
डिवीजन - डेटा को वर्ग के आधार पर क्षेत्रों में बांटा गया है।
-
भविष्यवाणी - आउटपुट वर्ग के मूल्य का अनुमान लगाने के लिए सूत्र तैयार किए जाते हैं।
इन विधियों का उपयोग एक या एक से अधिक भविष्यवक्ता (स्वतंत्र) चर से प्रतिक्रिया (आश्रित) चर के मूल्य की भविष्यवाणी करने के लिए किया जाता है जहां चर पूर्णांक होते हैं। प्रतिगमन के कई रूप हैं, जैसे रैखिक, एकाधिक, भारित, बहुपद, गैर-पैरामीट्रिक, और मजबूत (मजबूत तकनीक तब उपयोगी होती है जब त्रुटियों को सामान्य स्थिति की आवश्यकता नहीं होती है या जब डेटा में महत्वपूर्ण आउटलेयर होते हैं)।
प्रतिगमन कुछ निर्भर डेटा सेटों की भविष्यवाणी कर सकता है, जो अलग-अलग चर की अभिव्यक्ति में परिभाषित होते हैं, और प्रवृत्ति एक निश्चित अवधि के लिए सुलभ होती है। प्रतिगमन चर की भविष्यवाणी करने के लिए एक अच्छी विधि का समर्थन करता है, लेकिन विशिष्ट प्रतिबंध और धारणाएं हैं जैसे कि चर की स्वतंत्रता, चर के अंतर्निहित सामान्य वितरण।
प्रत्येक रिग्रेशन ट्री लीफ एक निरंतर-मूल्यवान भविष्यवाणी को संग्रहीत करता है, जो कि लीफ को कवर करने वाले प्रशिक्षण सेट के लिए अनुमानित विशेषता की औसत लागत है। इसके विपरीत, मॉडल ट्री में, प्रत्येक पत्ता एक प्रतिगमन मॉडल और अनुमानित विशेषता के लिए एक बहुभिन्नरूपी निरंतर समीकरण की ओर जाता है। जब डेटा को एक आसान रेखीय मॉडल द्वारा अच्छी तरह से प्रदर्शित नहीं किया जाता है, तो रिग्रेशन और मॉडल ट्री रेखीय प्रतिगमन की तुलना में प्रभावी होते हैं।