हम उपयोग कर सकते हैं pandas.DataFrame.corr नल मानों को छोड़कर, स्तंभों के जोड़ीवार सहसंबंध की गणना करने के लिए। सहसंबंध गुणांक दो चरों के बीच रैखिक जुड़ाव की ताकत को इंगित करता है। गुणांक -1 और 1 के बीच होता है।
पंडों के डेटाफ्रेम में दो संख्यात्मक स्तंभों के बीच संबंध प्राप्त करने के लिए, हम निम्नलिखित कदम उठा सकते हैं -
- आकृति का आकार सेट करें और सबप्लॉट के बीच और आसपास पैडिंग समायोजित करें।
- दो-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा का एक पांडा डेटाफ़्रेम बनाएं।
- दो स्तंभों के मानों की तुलना करें और col1.corr(col2) का उपयोग करके सहसंबंध गुणांक की गणना करें।
- कंसोल पर सहसंबंध गुणांक प्रिंट करें।
- आंकड़ा प्रदर्शित करने के लिए, दिखाएं () . का उपयोग करें विधि।
उदाहरण
import pandas as pd from matplotlib import pyplot as plt plt.rcParams["figure.figsize"] = [7.00, 3.50] plt.rcParams["figure.autolayout"] = True df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]}) col1 = df['lab'] col2 = df['value'] plt.plot(col1, col2) print("The correlation coefficient is: ", col1.corr(col2)) plt.show()
आउटपुट
यह निम्नलिखित आउटपुट का उत्पादन करेगा
The correlation coefficient is: 1.0
यहाँ सहसम्बन्ध गुणांक 1.0 है जो पूर्ण सहसम्बन्ध दर्शाता है। इसलिए, हमें एक सीधी रेखा प्राप्त होती है क्योंकि सभी बिंदु एक सीधी रेखा में होते हैं।