पायथन - पंडों के डेटाफ़्रेम को वर्ष के अनुसार कैसे समूहित करें?

हम पांडस डेटाफ़्रेम को ग्रुपबाय () का उपयोग करके समूहित करेंगे। ग्रूपर फ़ंक्शन का उपयोग करके उपयोग किए जाने वाले कॉलम का चयन करें। हम कार बिक्री रिकॉर्ड के लिए नीचे दिखाए गए उदाहरण के लिए वर्ष-वार समूहबद्ध करेंगे और वर्ष अंतराल के साथ पंजीकरण मूल्य की गणना करेंगे।

सबसे पहले, मान लें कि तीन स्तंभों के साथ हमारा पंडों का डेटाफ़्रेम निम्नलिखित है -

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [pd.Timestamp("2021-06-10"),
         pd.Timestamp("2019-07-11"),
         pd.Timestamp("2016-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2020-03-20"),
         pd.Timestamp("2019-01-22"),
         pd.Timestamp("2011-01-06"),
         pd.Timestamp("2013-01-04"),
         pd.Timestamp("2014-05-09")
      ],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

इसके बाद, Groupby फ़ंक्शन के अंतर्गत Date_of_Purchase कॉलम का चयन करने के लिए ग्रॉपर का उपयोग करें। फ़्रीक्वेंसी को 3Y के रूप में सेट किया गया है यानी 3 साल के अंतराल को समूहीकृत किया गया है।

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [pd.Timestamp("2021-06-10"),
         pd.Timestamp("2019-07-11"),
         pd.Timestamp("2016-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2020-03-20"),
         pd.Timestamp("2019-01-22"),
         pd.Timestamp("2011-01-06"),
         pd.Timestamp("2013-01-04"),
         pd.Timestamp("2014-05-09")
      ],

      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print("DataFrame...\n",dataFrame)

# Grouper to select Date_of_Purchase column within groupby function
print("\nGroup Dataframe by 3 years...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='3Y')).sum())

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame...
        Car   Date_of_Purchase Reg_Price
0      Audi         2021-06-10 1000
1     Lexus         2019-07-11 1400
2     Tesla         2016-06-25 1100
3  Mercedes         2021-06-29 900
4       BMW         2020-03-20 1700
5    Toyota         2019-01-22 1800
6    Nissan         2011-01-06 1300
7   Bentley         2013-01-04 1150
8   Mustang         2014-05-09 1350

Group Dataframe by 3 years...
Reg_Price
Date_of_Purchase
2011-12-31 1300
2014-12-31 2500
2017-12-31 1100
2020-12-31 4900
2023-12-31 1900