Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पाइथन में डेटा में गैर-रैखिक प्रवृत्तियों को समझने के लिए बहुपद प्रतिगमन मॉडल कैसे उपयुक्त हो सकता है?

जब प्रतिगमन मॉडल बनाया जा रहा है, तो बहुसंकेतन की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि चरों के बीच बहुसंरेखण मौजूद है, तो हमें यह सुनिश्चित करना होगा कि इसे डेटा से हटा दिया जाए।

वास्तविक दुनिया में डेटा आमतौर पर गैर-रैखिक होता है। हमें ऐसे गैर-रेखीय डेटा को मॉडल में फिट करने के लिए तंत्र खोजने की आवश्यकता है। हम इस डेटा की कल्पना करने के लिए Anscombe के डेटासेट का उपयोग करेंगे।

गैर-रैखिक डेटा के साथ 'इम्प्लाट' फ़ंक्शन का उपयोग किया जाता है -

उदाहरण

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('anscombe')
sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3)
plt.show()

आउटपुट

पाइथन में डेटा में गैर-रैखिक प्रवृत्तियों को समझने के लिए बहुपद प्रतिगमन मॉडल कैसे उपयुक्त हो सकता है?

स्पष्टीकरण

  • आवश्यक पैकेज आयात किए जाते हैं।
  • इनपुट डेटा 'anscombe' है जो सीबॉर्न लाइब्रेरी से लोड किया गया है।
  • यह डेटा डेटाफ़्रेम में संग्रहीत किया जाता है।
  • 'load_dataset' फ़ंक्शन का उपयोग आईरिस डेटा को लोड करने के लिए किया जाता है।
  • इस डेटा को 'इम्प्लाट' फ़ंक्शन का उपयोग करके विज़ुअलाइज़ किया जाता है।
  • यहां, डेटाफ्रेम पैरामीटर के रूप में दिया गया है।
  • साथ ही, x मान, y मान और क्रम निर्दिष्ट किया गया है।
  • यह डेटा कंसोल पर प्रदर्शित होता है।

  1. पायथन में सीबॉर्न का उपयोग करके एक रैखिक संबंध की कल्पना कैसे की जा सकती है?

    सीबॉर्न एक पुस्तकालय है जो डेटा की कल्पना करने में मदद करता है। यह अनुकूलित थीम और एक उच्च-स्तरीय इंटरफ़ेस के साथ आता है। जब प्रतिगमन मॉडल बनाया जा रहा है, तो बहुसंकेतन की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि

  1. पायथन सीबॉर्न लाइब्रेरी में डेटा की कल्पना करने के लिए फ़ेसटग्रिड का उपयोग कैसे किया जा सकता है?

    बारप्लॉट फ़ंक्शन एक श्रेणीगत चर और एक सतत चर के बीच संबंध स्थापित करता है। डेटा को आयताकार बार के रूप में दर्शाया जाता है जहां बार की लंबाई उस विशिष्ट श्रेणी में डेटा के अनुपात को इंगित करती है। पॉइंट प्लॉट बार प्लॉट के समान होते हैं लेकिन फ़िल बार का प्रतिनिधित्व करने के बजाय, डेटा पॉइंट का अनुमान

  1. पायथन में एक मॉडल के लिए गैर-रेखीय डेटा कैसे फिट हो सकता है?

    हम सीबॉर्न लाइब्रेरी का उपयोग करेंगे, जो डेटा को विज़ुअलाइज़ करने में मदद करती है। जब रिग्रेशन मॉडल बनाए जा रहे हैं, तो मल्टीकोलिनियरिटी की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि चरों के बीच बहुसंरेखण मौजूद है, त