हम सीबॉर्न लाइब्रेरी का उपयोग करेंगे, जो डेटा को विज़ुअलाइज़ करने में मदद करती है। जब रिग्रेशन मॉडल बनाए जा रहे हैं, तो मल्टीकोलिनियरिटी की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि चरों के बीच बहुसंरेखण मौजूद है, तो हमें यह सुनिश्चित करना होगा कि इसे डेटा से हटा दिया जाए। वास्तविक दुनिया में डेटा आमतौर पर गैर-रैखिक होता है।
हमें ऐसे गैर-रेखीय डेटा को मॉडल में फिट करने के लिए तंत्र खोजने की आवश्यकता है। हम इस डेटा की कल्पना करने के लिए Anscombe के डेटासेट का उपयोग करेंगे। इस गैर-रैखिक डेटा के साथ 'इम्प्लाट' फ़ंक्शन का उपयोग किया जाता है।
यहाँ उदाहरण है -
उदाहरण
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x="x", y="y", data=my_df.query("dataset == 'I'")) plt.show()
आउटपुट
स्पष्टीकरण
- आवश्यक पैकेज आयात किए जाते हैं।
- इनपुट डेटा 'anscombe' है जो सीबॉर्न लाइब्रेरी से लोड किया गया है।
- यह डेटा डेटाफ़्रेम में संग्रहीत किया जाता है।
- 'load_dataset' फ़ंक्शन का उपयोग आईरिस डेटा को लोड करने के लिए किया जाता है।
- इस डेटा को 'इम्प्लाट' फ़ंक्शन का उपयोग करके विज़ुअलाइज़ किया जाता है।
- यहां, डेटाफ्रेम पैरामीटर के रूप में दिया गया है।
- साथ ही, x और y मान निर्दिष्ट हैं।
- यह डेटा कंसोल पर प्रदर्शित होता है।