Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पांडस डेटाफ्रेम में कॉलम को समूहीकृत करना

पांडा डेटाफ़्रेम में स्तंभों को समूहित करने के लिए, groupby() का उपयोग करें। सबसे पहले, आइए पंडों का डेटाफ़्रेम बनाएं -

dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

आइए अब कार कॉलम के अनुसार समूह बनाएं -

res = dataFrame.groupby("Car")

समूहबद्ध करने के बाद, हम समूहीकृत कार नामों के पंजीकरण मूल्य (Reg_Price) के साधन खोजने के लिए फ़ंक्शन का उपयोग करेंगे -

res.mean()

यह कॉलम कार के अनुसार पंजीकरण मूल्य के माध्य की गणना करता है।

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# dataframe with one of the columns as Reg_Price
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print"DataFrame...\n",dataFrame

# grouped according to Car
res = dataFrame.groupby("Car")

print"\nMean of Registration Price grouped according to Car names...\n",res.mean()

आउटपुट

यह निम्नलिखित आउटपुट देगा -

DataFrame...
      Car    Reg_Price
0     Audi        1000
1    Lexus        1400
2     Audi        1100
3 Mercedes         900
4     Audi        1700
5    Lexus        1800
6 Mercedes        1300
7    Lexus        1150
8 Mercedes        1350
Mean of Registration Price grouped according to Car names...
           Reg_Price
    Car
    Audi   1266.666667
   Lexus   1450.000000
Mercedes   1183.333333

  1. पायथन - पंडों के डेटाफ्रेम से कई स्तंभों का चयन करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") एक से अधिक स्तंभ अभिलेखों का चयन करने के लिए, वर्गाकार कोष्ठकों का उपयो

  1. पायथन - पांडस डेटाफ्रेम के सबसेट का चयन कैसे करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") उपसमुच्चय का चयन करने के लिए वर्गाकार कोष्ठकों का प्रयोग करें। कोष्ठक म

  1. पायथन पांडा - डेटाफ्रेम में एकाधिक डेटा कॉलम प्लॉट करें?

    कई कॉलमों को प्लॉट करने के लिए, हम एक बार ग्राफ तैयार करेंगे। प्लॉट () का प्रयोग करें विधि और प्रकार . सेट करें बार . के लिए पैरामीटर बार ग्राफ के लिए। आइए पहले आवश्यक पुस्तकालयों को आयात करें - pdimport matplotlib.pyplot को mp के रूप में आयात करें टीम रिकॉर्ड्स के साथ हमारा डेटा निम्नलिखित है - डे