सहसंबंध कुछ सांख्यिकीय संबंधों को संदर्भित करता है जिसमें दो डेटा सेट के बीच निर्भरता शामिल होती है। जबकि रैखिक प्रतिगमन एक आश्रित चर और एक या अधिक स्वतंत्र चर के बीच संबंध स्थापित करने के लिए एक रैखिक दृष्टिकोण है। एक एकल स्वतंत्र चर को रैखिक प्रतिगमन कहा जाता है जबकि कई स्वतंत्र चर को एकाधिक प्रतिगमन कहा जाता है।
सहसंबंध
आश्रित परिघटनाओं के सरल उदाहरणों में माता-पिता और उनकी संतानों की शारीरिक बनावट और किसी उत्पाद की कीमत और उसकी आपूर्ति की गई मात्रा के बीच संबंध शामिल हैं। हम सीबॉर्न पाइथॉन लाइब्रेरी में उपलब्ध आईरिस डेटा सेट का उदाहरण लेते हैं। इसमें हम आईरिस फूल की तीन प्रजातियों के बाह्यदल और पंखुड़ियों की लंबाई और चौड़ाई के बीच संबंध स्थापित करने का प्रयास करते हैं। पाए गए सहसंबंध के आधार पर, एक मजबूत मॉडल बनाया जा सकता है जो आसानी से एक प्रजाति को दूसरे से अलग करता है।
उदाहरण
snsdf =sns.load_dataset('iris')#बिना प्रतिगमन के।pairplot(df, Kind="scatter")plt.show()आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
रैखिक प्रतिगमन
गणितीय रूप से एक रैखिक संबंध ग्राफ के रूप में प्लॉट किए जाने पर एक सीधी रेखा का प्रतिनिधित्व करता है। एक गैर-रेखीय संबंध जहां किसी भी चर का घातांक 1 के बराबर नहीं है, एक वक्र बनाता है। सीबॉर्न में रैखिक प्रतिगमन संबंध खोजने के लिए कार्य regplot है। नीचे दिया गया उदाहरण इसके उपयोग को दर्शाता है।
उदाहरण
sbfrom sbfrom pltdf =sb.load_dataset('tips')sb.regplot(x ="total_bill", y ="tip", data =df)plt.show()के रूप में आयात करें।
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -