Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

समूहीकृत डेटा सहप्रसरण की गणना करने के लिए पायथन में एक प्रोग्राम लिखें और किसी दिए गए डेटाफ़्रेम में दो स्तंभों के बीच समूहीकृत डेटा सहप्रसरण की गणना करें

मान लें, आपके पास डेटाफ़्रेम है और समूहित डेटा और संबंधित कॉलम से सहप्रसरण की गणना के लिए परिणाम है,

Grouped data covariance is:
                  mark1       mark2
subjects
maths    mark1    25.0    12.500000
         mark2    12.5    108.333333
science  mark1    28.0    50.000000
         mark2    50.0    233.333333

Grouped data covariance between two columns:
subjects
maths    12.5
science  50.0
dtype: float64

समाधान

इसे हल करने के लिए, हम नीचे दिए गए चरणों का पालन करेंगे -

  • डेटाफ़्रेम परिभाषित करें

  • डेटाफ़्रेम विषयों कॉलम के अंदर ग्रुपबाय फ़ंक्शन लागू करें

df.groupby('subjects')
  • समूहीकृत डेटा पर सहप्रसरण फ़ंक्शन लागू करें और समूह_डेटा संग्रहीत करें,

group_data = df.groupby('subjects').cov()
  • विषय कॉलम से ग्रुपबाय रिकॉर्ड के साथ मार्क1 और मार्क2 कॉलम के लिए लैम्ब्डा फ़ंक्शन लागू करें। इसे नीचे परिभाषित किया गया है,

df.groupby('subjects').apply(lambda x: x['mark1'].cov(x['mark2']

उदाहरण

आइए एक बेहतर समझ पाने के लिए नीचे दिया गया कोड देखें -

import pandas as pd
df =
pd.DataFrame({'subjects':['maths','maths','maths','science','science','science'],
               'mark1':[80,90,85,95,93,85],
               'mark2':[85,90,70,75,95,65]})
print("DataFrame is:\n",df)
group_data = df.groupby('subjects').cov()
print("Grouped data covariance is:\n", group_data)
result = df.groupby('subjects').apply(lambda x: x['mark1'].cov(x['mark2']))
print("Grouped data covariance between two columns:\n",result)

आउटपुट

DataFrame is:
   subjects mark1 mark2
0    maths   80    85
1    maths   90    90
2    maths   85    70
3    science 95    75
4    science 93    95
5    science 85    65
Grouped data covariance is:
               mark1    mark2
subjects
maths    mark1 25.0    12.500000
         mark2 12.5    108.333333
science  mark1 28.0    50.000000
         mark2 50.0    233.333333

Grouped data covariance between two columns:
subjects
maths    12.5
science  50.0
dtype: float64

  1. किसी दिए गए डेटाफ़्रेम के विकर्ण को 1 . से संशोधित करने के लिए पायथन में एक प्रोग्राम लिखें

    मान लें, आपके पास डेटाफ़्रेम है 0 1 2 0 10 20 30 1 40 50 60 2 70 80 90 डेटाफ़्रेम के विकर्ण द्वारा 1 को प्रतिस्थापित करने का परिणाम है - 0 1 2 0 1 20 30 1 40 1 60 2 70 80 1 समाधान इसे हल करने के लिए, हम नीचे दिए गए चरणों का पालन करेंगे - डेटाफ़्रेम परिभाषित करें सभी पंक्तियों और स्तंभों तक

  1. किसी दिए गए डेटाफ़्रेम में इंडेक्स और कॉलम को स्थानांतरित करने के लिए पायथन में एक प्रोग्राम लिखें

    इनपुट - मान लें कि आपके पास डेटाफ़्रेम है, और अनुक्रमणिका और स्तंभों के स्थानान्तरण का परिणाम है, Transposed DataFrame is   0 1 0 1 4 1 2 5 2 3 6 समाधान 1 डेटाफ़्रेम परिभाषित करें द्वि-आयामी सूची डेटा में प्रत्येक तत्व को पुनरावृत्त करने के लिए नेस्टेड सूची समझ सेट करें और इसे परिणाम में

  1. किसी दिए गए DataFrame में कर्मचारी आईडी और वेतन की न्यूनतम आयु खोजने के लिए पायथन में एक प्रोग्राम लिखें

    इनपुट - मान लें, आपके पास डेटाफ़्रेम है DataFrame is  Id    Age   Salary 0 1    27    40000 1 2    22    25000 2 3    25    40000 3 4    23    35000 4 5    24    30000 5 6