Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन पांडा - मोड के साथ लापता कॉलम मान भरना

मोड वह मान है जो मानों के एक सेट में सबसे अधिक दिखाई देता है। fillna() . का उपयोग करें विधि और मोड के साथ लापता कॉलम भरने के लिए मोड सेट करें। सबसे पहले, आइए आवश्यक पुस्तकालयों को उनके संबंधित उपनामों के साथ आयात करें -

import pandas as pd
import numpy as np

2 कॉलम के साथ डेटाफ़्रेम बनाएं। हमने Numpy np.NaN . का उपयोग करके NaN मान सेट किए हैं -

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

NaN के साथ कॉलम मानों का मोड खोजें, यानी यूनिट कॉलम के लिए यहां। NaNs को उस कॉलम के मोड से बदलें, जहां वह यूनिट कॉलम पर मोड () का उपयोग करके स्थित है -

dataFrame.fillna(dataFrame['Units'].mode()[0], inplace = True)

उदाहरण

पूरा कोड निम्नलिखित है -

import pandas as pd
import numpy as np

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

print"DataFrame ...\n",dataFrame

# finding mode of the column values with NaN i.e, for Units columns here
# Replace NaNs with the mode of the column where it is located
dataFrame.fillna(dataFrame['Units'].mode()[0], inplace = True)

print"\nUpdated Dataframe after filling NaN values with mode...\n",dataFrame

आउटपुट

यह निम्नलिखित आउटपुट देगा -

DataFrame ...
       Car   Units
0      BMW   100.0
1    Lexus   150.0
2    Lexus     NaN
3  Mustang    80.0
4  Bentley     NaN
5  Mustang     NaN

Updated Dataframe after filling NaN values with mode...
       Car   Units
0      BMW   100.0
1    Lexus   150.0
2    Lexus    80.0
3  Mustang    80.0
4  Bentley    80.0
5  Mustang    80.0

  1. पायथन पांडा - डेटाफ़्रेम में सभी NaN तत्वों को 0s . से बदलें

    NaN मानों को बदलने के लिए, fillna() विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटाफ़्रेम में लोड करें - dataFrame = pd.read_csv("C:

  1. पंडों के डेटाफ़्रेम को एक सामान्य कॉलम के साथ मर्ज करें और बेजोड़ मानों के लिए NaN सेट करें

    दो पांडा डेटाफ़्रेम को सामान्य कॉलम के साथ मर्ज करने के लिए, मर्ज () . का उपयोग करें कार्य करें और चालू . सेट करें स्तंभ नाम के रूप में पैरामीटर। बेजोड़ मानों के लिए NaN सेट करने के लिए, कैसे . का उपयोग करें ” पैरामीटर और इसे बाएं सेट करें या दाएं . इसका मतलब होगा, बाएँ या दाएँ विलय करना। सबसे पहले

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल