Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पंडों के डेटाफ़्रेम में दो संख्यात्मक स्तंभों के बीच संबंध

हम उपयोग कर सकते हैं pandas.DataFrame.corr नल मानों को छोड़कर, स्तंभों के जोड़ीवार सहसंबंध की गणना करने के लिए। सहसंबंध गुणांक दो चरों के बीच रैखिक जुड़ाव की ताकत को इंगित करता है। गुणांक -1 और 1 के बीच होता है।

पंडों के डेटाफ्रेम में दो संख्यात्मक स्तंभों के बीच संबंध प्राप्त करने के लिए, हम निम्नलिखित कदम उठा सकते हैं -

  • आकृति का आकार सेट करें और सबप्लॉट के बीच और आसपास पैडिंग समायोजित करें।
  • दो-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा का एक पांडा डेटाफ़्रेम बनाएं।
  • दो स्तंभों के मानों की तुलना करें और col1.corr(col2) का उपयोग करके सहसंबंध गुणांक की गणना करें।
  • कंसोल पर सहसंबंध गुणांक प्रिंट करें।
  • आंकड़ा प्रदर्शित करने के लिए, दिखाएं () . का उपयोग करें विधि।

उदाहरण

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

आउटपुट

यह निम्नलिखित आउटपुट का उत्पादन करेगा

The correlation coefficient is: 1.0

पंडों के डेटाफ़्रेम में दो संख्यात्मक स्तंभों के बीच संबंध पंडों के डेटाफ़्रेम में दो संख्यात्मक स्तंभों के बीच संबंध

यहाँ सहसम्बन्ध गुणांक 1.0 है जो पूर्ण सहसम्बन्ध दर्शाता है। इसलिए, हमें एक सीधी रेखा प्राप्त होती है क्योंकि सभी बिंदु एक सीधी रेखा में होते हैं।


  1. पायथन - एक पांडा डेटाफ़्रेम में स्पष्ट रूप से नाम कॉलम

    स्तंभों को स्पष्ट रूप से नाम देने के लिए, नाम . का उपयोग करें read_csv() . का पैरामीटर तरीका। मान लें कि Microsoft Excel में बिना हेडर खोले हमारी CSV फ़ाइल निम्नलिखित है - आइए CSV फ़ाइल से डेटा लोड करें और इसके साथ नाम पैरामीटर का उपयोग करके हेडर कॉलम जोड़ें - pd.read_csv("C:\\Users\\amit_\\

  1. पायथन - पंडों के डेटाफ्रेम से कई स्तंभों का चयन करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") एक से अधिक स्तंभ अभिलेखों का चयन करने के लिए, वर्गाकार कोष्ठकों का उपयो

  1. पायथन पांडा - डेटाफ्रेम में एकाधिक डेटा कॉलम प्लॉट करें?

    कई कॉलमों को प्लॉट करने के लिए, हम एक बार ग्राफ तैयार करेंगे। प्लॉट () का प्रयोग करें विधि और प्रकार . सेट करें बार . के लिए पैरामीटर बार ग्राफ के लिए। आइए पहले आवश्यक पुस्तकालयों को आयात करें - pdimport matplotlib.pyplot को mp के रूप में आयात करें टीम रिकॉर्ड्स के साथ हमारा डेटा निम्नलिखित है - डे