जब प्रतिगमन मॉडल बनाया जा रहा है, तो बहुसंकेतन की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि चरों के बीच बहुसंरेखण मौजूद है, तो हमें यह सुनिश्चित करना होगा कि इसे डेटा से हटा दिया जाए।
वास्तविक दुनिया में डेटा आमतौर पर गैर-रैखिक होता है। हमें ऐसे गैर-रेखीय डेटा को मॉडल में फिट करने के लिए तंत्र खोजने की आवश्यकता है। हम इस डेटा की कल्पना करने के लिए Anscombe के डेटासेट का उपयोग करेंगे।
गैर-रैखिक डेटा के साथ 'इम्प्लाट' फ़ंक्शन का उपयोग किया जाता है -
उदाहरण
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3) plt.show()
आउटपुट
स्पष्टीकरण
- आवश्यक पैकेज आयात किए जाते हैं।
- इनपुट डेटा 'anscombe' है जो सीबॉर्न लाइब्रेरी से लोड किया गया है।
- यह डेटा डेटाफ़्रेम में संग्रहीत किया जाता है।
- 'load_dataset' फ़ंक्शन का उपयोग आईरिस डेटा को लोड करने के लिए किया जाता है।
- इस डेटा को 'इम्प्लाट' फ़ंक्शन का उपयोग करके विज़ुअलाइज़ किया जाता है।
- यहां, डेटाफ्रेम पैरामीटर के रूप में दिया गया है।
- साथ ही, x मान, y मान और क्रम निर्दिष्ट किया गया है।
- यह डेटा कंसोल पर प्रदर्शित होता है।