Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन पंडों - लापता कॉलम मानों को माध्यिका से भरना

माध्य उच्च आधे को डेटा के निचले आधे हिस्से से अलग करता है। फिलना () विधि का उपयोग करें और लापता कॉलम को माध्यिका से भरने के लिए माध्यिका सेट करें। सबसे पहले, आइए आवश्यक पुस्तकालयों को उनके संबंधित उपनामों के साथ आयात करें -

import pandas as pd
import numpy as np

2 कॉलम के साथ डेटाफ़्रेम बनाएं। हमने Numpy np.NaN . का उपयोग करके NaN मान सेट किए हैं -

dataFrame = pd.DataFrame(
   {
      "Car": ['Lexus', 'BMW', 'Audi', 'Bentley', 'Mustang', 'Tesla'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

NaN के साथ स्तंभ मानों का माध्यिका ज्ञात कीजिए, अर्थात, यहां इकाइयों के स्तंभों के लिए। NaNs को उस कॉलम के माध्यिका से बदलें, जहां वह यूनिट्स कॉलम पर माध्यिका () का उपयोग करके स्थित है -

dataFrame.fillna(dataFrame['Units'].median(), inplace = True)

उदाहरण

निम्नलिखित कोड है -

import pandas as pd
import numpy as np

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Car": ['Lexus', 'BMW', 'Audi', 'Bentley', 'Mustang', 'Tesla'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

print"DataFrame ...\n",dataFrame

# finding median of the column values with NaN i.e, for Units columns here
# Replace NaNs with the median of the column where it is located
dataFrame.fillna(dataFrame['Units'].median(), inplace = True)

print"\nUpdated Dataframe after filling NaN values with median...\n",dataFrame

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame ...
       Car   Units
0    Lexus   100.0
1      BMW   150.0
2     Audi     NaN
3  Bentley    80.0
4  Mustang     NaN
5    Tesla     NaN

Updated Dataframe after filling NaN values with median...
       Car   Units
0    Lexus   100.0
1      BMW   150.0
2     Audi   100.0
3  Bentley    80.0
4  Mustang   100.0
5    Tesla   100.0

  1. पायथन पांडा - डेटाफ़्रेम में सभी NaN तत्वों को 0s . से बदलें

    NaN मानों को बदलने के लिए, fillna() विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटाफ़्रेम में लोड करें - dataFrame = pd.read_csv("C:

  1. पंडों के डेटाफ़्रेम को एक सामान्य कॉलम के साथ मर्ज करें और बेजोड़ मानों के लिए NaN सेट करें

    दो पांडा डेटाफ़्रेम को सामान्य कॉलम के साथ मर्ज करने के लिए, मर्ज () . का उपयोग करें कार्य करें और चालू . सेट करें स्तंभ नाम के रूप में पैरामीटर। बेजोड़ मानों के लिए NaN सेट करने के लिए, कैसे . का उपयोग करें ” पैरामीटर और इसे बाएं सेट करें या दाएं . इसका मतलब होगा, बाएँ या दाएँ विलय करना। सबसे पहले

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल