Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पांडस डेटाफ्रेम में समूह के अंतिम मूल्यों की गणना करें

समूह के अंतिम मानों की गणना करने के लिए, groupby.last() विधि का उपयोग करें। सबसे पहले, आवश्यक पुस्तकालय को एक उपनाम के साथ आयात करें -

pd के रूप में पांडा आयात करें;

3 कॉलम के साथ डेटाफ़्रेम बनाएं -

dataFrame =pd.DataFrame({"Car":['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place":['Delhi',' बैंगलोर', 'पुणे', 'पंजाब', 'चंडीगढ़', 'मुंबई'],"इकाइयां":[100, 150, 50, 80, 110, 90]})

अब, DataFrame को एक कॉलम के आधार पर समूहित करें -

groupDF =dataFrame.groupby("Car")

समूह के अंतिम मानों की गणना करें और अनुक्रमणिका को रीसेट करना -

res =groupDF.last()res =res.reset_index()

उदाहरण

निम्नलिखित पूरा कोड है। दोहराए गए मानों की अंतिम आवृत्ति प्रदर्शित की जाती है यानी समूह मानों में से अंतिम -

pd के रूप में पांडा आयात करें;dataFrame =pd.DataFrame({"Car":['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place":[ 'दिल्ली', 'बैंगलोर', 'पुणे', 'पंजाब', 'चंडीगढ़', 'मुंबई'],"इकाइयाँ":[100, 150, 50, 80, 110, 90] })प्रिंट"डेटाफ़्रेम ... \n",डेटाफ़्रेम# डेटाफ़्रेम को कॉलम CargroupDF =dataFrame.groupby("Car")res =groupDF.last()res =res.reset_index()print"\nअंतिम समूह मान =\n",res

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame ... कार प्लेस यूनिट्स0 बीएमडब्ल्यू दिल्ली 1001 लेक्सस बैंगलोर 1502 बीएमडब्ल्यू पुणे 503 टेस्ला पंजाब 804 लेक्सस चंडीगढ़ 1105 टेस्ला मुंबई 90 अंतिम ग्रुप वैल्यू =कार प्लेस यूनिट्स0 बीएमडब्ल्यू पुणे 501 लेक्सस चंडीगढ़ 1102 टेस्ला मुंबई 90

  1. पायथन पंडों - गैर-शून्य मानों को आगे प्रचारित करें

    “विधि . का प्रयोग करें फ़िलना . का पैरामीटर () तरीका। फॉरवर्ड फिल के लिए, ffill . मान का उपयोग करें जैसा कि नीचे दिखाया गया है - fillna(method='ffill') मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - imp

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल

  1. पायथन पंडों - गैर-शून्य मूल्यों को पीछे की ओर प्रचारित करें

    “विधि . का प्रयोग करें फ़िलना . का पैरामीटर () तरीका। बैकवर्ड फिल के लिए, bfill . मान का उपयोग करें जैसा कि नीचे दिखाया गया है - fillna(method='bfill') मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - impo