हम उपयोग कर सकते हैं pandas.DataFrame.corr नल मानों को छोड़कर, स्तंभों के जोड़ीवार सहसंबंध की गणना करने के लिए। सहसंबंध गुणांक दो चरों के बीच रैखिक जुड़ाव की ताकत को इंगित करता है। गुणांक -1 और 1 के बीच होता है।
पंडों के डेटाफ्रेम में दो संख्यात्मक स्तंभों के बीच संबंध प्राप्त करने के लिए, हम निम्नलिखित कदम उठा सकते हैं -
- आकृति का आकार सेट करें और सबप्लॉट के बीच और आसपास पैडिंग समायोजित करें।
- दो-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा का एक पांडा डेटाफ़्रेम बनाएं।
- दो स्तंभों के मानों की तुलना करें और col1.corr(col2) का उपयोग करके सहसंबंध गुणांक की गणना करें।
- कंसोल पर सहसंबंध गुणांक प्रिंट करें।
- आंकड़ा प्रदर्शित करने के लिए, दिखाएं () . का उपयोग करें विधि।
उदाहरण
import pandas as pd
from matplotlib import pyplot as plt
plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True
df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})
col1 = df['lab']
col2 = df['value']
plt.plot(col1, col2)
print("The correlation coefficient is: ", col1.corr(col2))
plt.show() आउटपुट
यह निम्नलिखित आउटपुट का उत्पादन करेगा
The correlation coefficient is: 1.0

यहाँ सहसम्बन्ध गुणांक 1.0 है जो पूर्ण सहसम्बन्ध दर्शाता है। इसलिए, हमें एक सीधी रेखा प्राप्त होती है क्योंकि सभी बिंदु एक सीधी रेखा में होते हैं।