Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पांडस डेटाफ्रेम में समूह के पहले मूल्यों की गणना करें

पहले समूह मानों की गणना करने के लिए, groupby.first() विधि का उपयोग करें। सबसे पहले, आवश्यक पुस्तकालय को एक उपनाम के साथ आयात करें -

import pandas as pd;

3 कॉलम के साथ डेटाफ़्रेम बनाएं -

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

अब, DataFrame को एक कॉलम के आधार पर समूहित करें -

groupDF = dataFrame.groupby("Car")

पहले समूह मानों की गणना करें और अनुक्रमणिका रीसेट करें -

res = groupDF.first()
res = res.reset_index()

उदाहरण

पूरा कोड निम्नलिखित है -

import pandas as pd;

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

print("DataFrame ...\n",dataFrame)

# grouping DataFrame by column Car
groupDF = dataFrame.groupby("Car")

res = groupDF.first()
res = res.reset_index()

print("\nFirst of group values = \n",res)

आउटपुट

यह निम्नलिखित आउटपुट का उत्पादन करेगा। दोहराए गए मानों की पहली आवृत्ति प्रदर्शित की जाती है यानी समूह मानों में से पहला -

DataFrame ...
     Car       Place   Units
0    BMW       Delhi     100
1  Lexus   Bangalore     150
2    BMW        Pune      50
3  Tesla      Punjab      80
4  Lexus  Chandigarh     110
5  Tesla      Mumbai      90

First of group values =
     Car      Place   Units
0    BMW      Delhi     100
1  Lexus  Bangalore     150
2  Tesla     Punjab      80

  1. पायथन पंडों - गैर-शून्य मानों को आगे प्रचारित करें

    “विधि . का प्रयोग करें फ़िलना . का पैरामीटर () तरीका। फॉरवर्ड फिल के लिए, ffill . मान का उपयोग करें जैसा कि नीचे दिखाया गया है - fillna(method='ffill') मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - imp

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल

  1. पायथन पंडों - गैर-शून्य मूल्यों को पीछे की ओर प्रचारित करें

    “विधि . का प्रयोग करें फ़िलना . का पैरामीटर () तरीका। बैकवर्ड फिल के लिए, bfill . मान का उपयोग करें जैसा कि नीचे दिखाया गया है - fillna(method='bfill') मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - impo