Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पंडों में GroupBy का उपयोग करके नकारात्मक और सकारात्मक मूल्यों का योग

आइए देखें कि ऋणात्मक और धनात्मक मानों का योग कैसे ज्ञात किया जाए। सबसे पहले, सकारात्मक और नकारात्मक मानों वाला डेटाफ़्रेम बनाएं -

dataFrame = pd.DataFrame({'Place': ['Chicago', 'Denver', 'Atlanta', 'Chicago', 'Dallas', 'Denver','Dallas', 'Atlanta'], 'Temperature': [-2, 30, -5, 10, 30, -5, 20, -10]})

इसके बाद, प्लेस कॉलम के आधार पर ग्रुपबाय टू ग्रुप का उपयोग करें -

groupRes = dataFrame.groupby(dataFrame['Place'])

सकारात्मक और नकारात्मक मानों को वापस करने के लिए लैम्ब्डा फ़ंक्शन का उपयोग करें। हमने अलग-अलग सकारात्मक और नकारात्मक मान भी जोड़े हैं -

# lambda function
def plus(val):
   return val[val > 0].sum()
def minus(val):
   return val[val < 0].sum()

उदाहरण

पूरा कोड निम्नलिखित है -

import pandas as pd

# create a DataFrame with temperature in celsius
dataFrame = pd.DataFrame({'Place': ['Chicago', 'Denver', 'Atlanta', 'Chicago', 'Dallas', 'Denver','Dallas', 'Atlanta'], 'Temperature': [-2, 30, -5, 10, 30, -5, 20, -10]})
print(dataFrame)

# using groupby to group on the basis of place
groupRes = dataFrame.groupby(dataFrame['Place'])

# lambda function
def plus(val):
   return val[val > 0].sum()
def minus(val):
   return val[val < 0].sum()

print(groupRes['Temperature'].agg([('negTemp', minus), ('posTemp', plus)]))

आउटपुट

यह निम्नलिखित कोड उत्पन्न करेगा -

      Place      Temperature
0   Chicago               -2
1    Denver               30
2   Atlanta               -5
3   Chicago               10
4    Dallas               30
5    Denver               -5
6    Dallas               20
7   Atlanta              -10
           negTemp  posTemp
Place
Atlanta        -15       0
Chicago         -2      10
Dallas           0      50
Denver          -5      30

  1. पायथन पंडों - नल का उपयोग करके अशक्त मूल्यों की जाँच करें ()

    notnull() विधि एक बूलियन मान लौटाती है, यानी यदि डेटाफ़्रेम में शून्य मान है, तो गलत लौटाया जाता है, अन्यथा सही। मान लें कि कुछ NaN यानी शून्य मानों वाली हमारी CSV फ़ाइल निम्नलिखित है - आइए सबसे पहले CSV फ़ाइल पढ़ें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल

  1. पायथन पंडों - गैर-शून्य मूल्यों को पीछे की ओर प्रचारित करें

    “विधि . का प्रयोग करें फ़िलना . का पैरामीटर () तरीका। बैकवर्ड फिल के लिए, bfill . मान का उपयोग करें जैसा कि नीचे दिखाया गया है - fillna(method='bfill') मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - impo