हम पांडस डेटाफ़्रेम को ग्रुपबाय () का उपयोग करके समूहित करेंगे। ग्रूपर फ़ंक्शन का उपयोग करके उपयोग किए जाने वाले कॉलम का चयन करें। हम कार बिक्री रिकॉर्ड के लिए नीचे दिखाए गए उदाहरण के लिए वर्ष-वार समूहबद्ध करेंगे और वर्ष अंतराल के साथ पंजीकरण मूल्य की गणना करेंगे।
सबसे पहले, मान लें कि तीन स्तंभों के साथ हमारा पंडों का डेटाफ़्रेम निम्नलिखित है -
# dataframe with one of the columns as Date_of_Purchase dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"], "Date_of_Purchase": [pd.Timestamp("2021-06-10"), pd.Timestamp("2019-07-11"), pd.Timestamp("2016-06-25"), pd.Timestamp("2021-06-29"), pd.Timestamp("2020-03-20"), pd.Timestamp("2019-01-22"), pd.Timestamp("2011-01-06"), pd.Timestamp("2013-01-04"), pd.Timestamp("2014-05-09") ], "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350] } )
इसके बाद, Groupby फ़ंक्शन के अंतर्गत Date_of_Purchase कॉलम का चयन करने के लिए ग्रॉपर का उपयोग करें। फ़्रीक्वेंसी को 3Y के रूप में सेट किया गया है यानी 3 साल के अंतराल को समूहीकृत किया गया है।
उदाहरण
निम्नलिखित कोड है -
import pandas as pd # dataframe with one of the columns as Date_of_Purchase dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"], "Date_of_Purchase": [pd.Timestamp("2021-06-10"), pd.Timestamp("2019-07-11"), pd.Timestamp("2016-06-25"), pd.Timestamp("2021-06-29"), pd.Timestamp("2020-03-20"), pd.Timestamp("2019-01-22"), pd.Timestamp("2011-01-06"), pd.Timestamp("2013-01-04"), pd.Timestamp("2014-05-09") ], "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350] } ) print("DataFrame...\n",dataFrame) # Grouper to select Date_of_Purchase column within groupby function print("\nGroup Dataframe by 3 years...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='3Y')).sum())
आउटपुट
यह निम्नलिखित आउटपुट उत्पन्न करेगा -
DataFrame... Car Date_of_Purchase Reg_Price 0 Audi 2021-06-10 1000 1 Lexus 2019-07-11 1400 2 Tesla 2016-06-25 1100 3 Mercedes 2021-06-29 900 4 BMW 2020-03-20 1700 5 Toyota 2019-01-22 1800 6 Nissan 2011-01-06 1300 7 Bentley 2013-01-04 1150 8 Mustang 2014-05-09 1350 Group Dataframe by 3 years... Reg_Price Date_of_Purchase 2011-12-31 1300 2014-12-31 2500 2017-12-31 1100 2020-12-31 4900 2023-12-31 1900