माध्य के लिए, माध्य () फ़ंक्शन का उपयोग करें। NaN के साथ कॉलम के लिए माध्य की गणना करें और NaN मानों को माध्य से भरने के लिए fillna() का उपयोग करें।
आइए पहले आवश्यक पुस्तकालयों को आयात करें -
import pandas as pd import numpy as np
2 कॉलम और कुछ NaN मानों के साथ एक DataFrame बनाएं। हमने इन NaN मानों को numpy np.NaN -
. का उपयोग करके दर्ज किया हैdataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN] } )
NaN के साथ स्तंभ मानों का माध्य ज्ञात करना अर्थात, यहां इकाइयों के स्तंभों के लिए। तो, यूनिट कॉलम में 100, 150 और 80 हैं; इसलिए, माध्य 110 होगा -
meanVal = dataFrame['Units'].mean()
NaN को उस कॉलम के माध्य से बदलें जहां वह स्थित है। ऊपर परिकलित माध्य 110 है, इसलिए NaN मानों को 110 से बदल दिया जाएगा -
dataFrame['Units'].fillna(value=meanVal, inplace=True)
उदाहरण
निम्नलिखित कोड है -
import pandas as pd import numpy as np # Create DataFrame dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN] } ) print"DataFrame ...\n",dataFrame # finding mean of the column values with NaN i.e, for Units columns here # so the Units column has 100, 150 and 80; therefore the mean would ne 110 meanVal = dataFrame['Units'].mean() # Replace NaNs with the mean of the column where it is located # the mean calculated above is 110, so NaN values will be replaced with 110 dataFrame['Units'].fillna(value=meanVal, inplace=True) print"\nUpdated Dataframe after filling NaN values with mean...\n",dataFrame
आउटपुट
यह निम्नलिखित आउटपुट देगा -
DataFrame ... Car Units 0 BMW 100.0 1 Lexus 150.0 2 Lexus NaN 3 Mustang 80.0 4 Bentley NaN 5 Mustang NaN Updated Dataframe after filling NaN values with mean... Car Units 0 BMW 100.0 1 Lexus 150.0 2 Lexus 110.0 3 Mustang 80.0 4 Bentley 110.0 5 Mustang 110.0