Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - महीने के हिसाब से पंडों के डेटाफ्रेम को कैसे समूहित करें?

हम ग्रुपबाय . का उपयोग करके पांडा डेटाफ़्रेम को समूहीकृत करेंगे . ग्रूपर फ़ंक्शन का उपयोग करके उपयोग किए जाने वाले कॉलम का चयन करें। हम कार बिक्री रिकॉर्ड के लिए नीचे दिखाए गए उदाहरण के लिए महीने-वार समूहबद्ध करेंगे और मासिक पंजीकरण मूल्य की गणना करेंगे।

सबसे पहले, मान लें कि तीन स्तंभों के साथ हमारा पंडों का डेटाफ़्रेम निम्नलिखित है -

dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),      
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
         pd.Timestamp("2021-01-22"),  
         pd.Timestamp("2021-01-06"),
         pd.Timestamp("2021-01-04"),
         pd.Timestamp("2021-05-09")
      ],
     "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

Groupby() फ़ंक्शन के भीतर Date_of_Purchase कॉलम चुनने के लिए ग्रॉपर का उपयोग करें। फ़्रीक्वेंसी फ़्रीक को 'M' को महीने के हिसाब से समूह में सेट किया जाता है -

print("\nGroup Dataframe by month...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='M')).sum())

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
    {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
         pd.Timestamp("2021-01-22"),
         pd.Timestamp("2021-01-06"),
         pd.Timestamp("2021-01-04"),
         pd.Timestamp("2021-05-09")
      ],

      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print"DataFrame...\n",dataFrame

# Grouper to select Date_of_Purchase column within groupby function
print"\nGroup Dataframe by month...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='M')).sum()

आउटपुट

यह निम्नलिखित आउटपुट का उत्पादन करेगा। हर महीने के पंजीकरण मूल्य की गणना की जाती है -

DataFrame...
     Car     Date_of_Purchase     Reg_Price
0     Audi     2021-06-10            1000
1    Lexus     2021-07-11            1400
2    Tesla     2021-06-25            1100
3 Mercedes     2021-06-29             900
4      BMW     2021-03-20            1700
5   Toyota     2021-01-22            1800
6   Nissan     2021-01-06            1300
7  Bentley     2021-01-04            1150
8  Mustang     2021-05-09            1350
 Group Dataframe by month...
                    Reg_Price
Date_of_Purchase
2021-01-31             4250.0
2021-02-28                NaN
2021-03-31             1700.0
2021-04-30                NaN
2021-05-31             1350.0
2021-06-30             3000.0
2021-07-31             1400.0

  1. पायथन - एक CSV फ़ाइल में पांडा डेटाफ़्रेम कैसे लिखें?

    Python में CSV फ़ाइल में पांडा डेटाफ़्रेम लिखने के लिए, to_csv() . का उपयोग करें तरीका। सबसे पहले, हम सूचियों का एक शब्दकोश बनाते हैं - # dictionary of lists d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_pur

  1. पायथन - पांडस डेटाफ्रेम के सबसेट का चयन कैसे करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") उपसमुच्चय का चयन करने के लिए वर्गाकार कोष्ठकों का प्रयोग करें। कोष्ठक म

  1. पायथन - एक बार ग्राफ में पांडस डेटाफ्रेम कैसे प्लॉट करें?

    मान लें कि हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं -        Car Reg_Price 0      BMW 2000 1    Lexus 1500 2     Audi 1500 3   Jaguar 2000 4  Mustang 1500 आवश्यक पुस्तकालयों को आयात करें - import