Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पंडों के डेटाफ़्रेम को वर्ष के अनुसार कैसे समूहित करें?

हम पांडस डेटाफ़्रेम को ग्रुपबाय () का उपयोग करके समूहित करेंगे। ग्रूपर फ़ंक्शन का उपयोग करके उपयोग किए जाने वाले कॉलम का चयन करें। हम कार बिक्री रिकॉर्ड के लिए नीचे दिखाए गए उदाहरण के लिए वर्ष-वार समूहबद्ध करेंगे और वर्ष अंतराल के साथ पंजीकरण मूल्य की गणना करेंगे।

सबसे पहले, मान लें कि तीन स्तंभों के साथ हमारा पंडों का डेटाफ़्रेम निम्नलिखित है -

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [pd.Timestamp("2021-06-10"),
         pd.Timestamp("2019-07-11"),
         pd.Timestamp("2016-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2020-03-20"),
         pd.Timestamp("2019-01-22"),
         pd.Timestamp("2011-01-06"),
         pd.Timestamp("2013-01-04"),
         pd.Timestamp("2014-05-09")
      ],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

इसके बाद, Groupby फ़ंक्शन के अंतर्गत Date_of_Purchase कॉलम का चयन करने के लिए ग्रॉपर का उपयोग करें। फ़्रीक्वेंसी को 3Y के रूप में सेट किया गया है यानी 3 साल के अंतराल को समूहीकृत किया गया है।

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [pd.Timestamp("2021-06-10"),
         pd.Timestamp("2019-07-11"),
         pd.Timestamp("2016-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2020-03-20"),
         pd.Timestamp("2019-01-22"),
         pd.Timestamp("2011-01-06"),
         pd.Timestamp("2013-01-04"),
         pd.Timestamp("2014-05-09")
      ],

      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print("DataFrame...\n",dataFrame)

# Grouper to select Date_of_Purchase column within groupby function
print("\nGroup Dataframe by 3 years...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='3Y')).sum())

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame...
        Car   Date_of_Purchase Reg_Price
0      Audi         2021-06-10 1000
1     Lexus         2019-07-11 1400
2     Tesla         2016-06-25 1100
3  Mercedes         2021-06-29 900
4       BMW         2020-03-20 1700
5    Toyota         2019-01-22 1800
6    Nissan         2011-01-06 1300
7   Bentley         2013-01-04 1150
8   Mustang         2014-05-09 1350

Group Dataframe by 3 years...
Reg_Price
Date_of_Purchase
2011-12-31 1300
2014-12-31 2500
2017-12-31 1100
2020-12-31 4900
2023-12-31 1900

  1. पायथन - एक CSV फ़ाइल में पांडा डेटाफ़्रेम कैसे लिखें?

    Python में CSV फ़ाइल में पांडा डेटाफ़्रेम लिखने के लिए, to_csv() . का उपयोग करें तरीका। सबसे पहले, हम सूचियों का एक शब्दकोश बनाते हैं - # dictionary of lists d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_pur

  1. पायथन - पांडस डेटाफ्रेम के सबसेट का चयन कैसे करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") उपसमुच्चय का चयन करने के लिए वर्गाकार कोष्ठकों का प्रयोग करें। कोष्ठक म

  1. पायथन - एक बार ग्राफ में पांडस डेटाफ्रेम कैसे प्लॉट करें?

    मान लें कि हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं -        Car Reg_Price 0      BMW 2000 1    Lexus 1500 2     Audi 1500 3   Jaguar 2000 4  Mustang 1500 आवश्यक पुस्तकालयों को आयात करें - import