Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - डेटाफ़्रेम में अनुपलब्ध (NaN) मानों को हटा दें

लापता मानों यानी NaN मानों को हटाने के लिए, dropna() . का उपयोग करें तरीका। सबसे पहले, हम आवश्यक पुस्तकालय आयात करते हैं -

import pandas as pd

CSV पढ़ें और एक DataFrame बनाएं -

dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")

ड्रापना () का उपयोग करके लापता मानों को हटा दें। ड्रॉपना () का उपयोग करने के बाद NaN लापता मानों के लिए प्रदर्शित होगा -

dataFrame.dropna()

उदाहरण

पूरा कोड निम्नलिखित है

import pandas as pd

# reading csv file
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")
print("DataFrame with some NaN (missing) values...\n",dataFrame)

# count the rows and columns in a DataFrame
print("\nNumber of rows and column in our DataFrame = ",dataFrame.shape)

# drop the missing values
print("\nDataFrame after removing NaN values...\n",dataFrame.dropna())

आउटपुट

यह निम्नलिखित आउटपुट देगा -

DataFrame with some NaN (missing) values...
          Car        Place   UnitsSold
0        Audi    Bangalore        80.0
1     Porsche       Mumbai         NaN
2  RollsRoyce         Pune       100.0
3         BMW        Delhi         NaN
4     Mercedes   Hyderabad        80.0
5  Lamborghini  Chandigarh        80.0
6         Audi      Mumbai         NaN
7     Mercedes        Pune       120.0
8  Lamborghini       Delhi       100.0

Number of rows and colums in our DataFrame = (9, 3)

DataFrame after removing NaN values ...
           Car       Place   UnitsSold
0         Audi   Bangalore        80.0
2   RollsRoyce        Pune       100.0
4     Mercedes   Hyderabad        80.0
5  Lamborghini  Chandigarh        80.0
7     Mercedes        Pune       120.0
8  Lamborghini       Delhi       100.0

  1. फ़िलना या इंटरपोलेट के बिना डेटाफ़्रेम से NaN मान निकालें (पायथन Matplotlib)

    फ़िल्टर या इंटरपोलेट के बिना डेटाफ़्रेम से NaN मान निकालने के लिए, हम निम्नलिखित कदम उठा सकते हैं - कदम फिगर साइज सेट करें और सबप्लॉट्स के बीच और आसपास पैडिंग को एडजस्ट करें। पांडा डेटा फ़्रेम बनाने के लिए एक सरणी बनाएँ। एक-आयामी ndarray अक्ष लेबल के साथ (समय श्रृंखला सहित)। प्लॉटिंग इंट

  1. पायथन पांडा - एक प्रक्षेप विधि का उपयोग करके NaN मान भरें

    NaN मान भरने के लिए इंटरपोलेट () विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN मानों को इंटरपोल

  1. पायथन में स्किकिट-लर्न का उपयोग करके किसी छवि के पिक्सेल मानों को कैसे देखें?

    डेटा प्री-प्रोसेसिंग मूल रूप से सभी डेटा (जो विभिन्न संसाधनों या एक संसाधन से एकत्र किया जाता है) को एक सामान्य प्रारूप में या एक समान डेटासेट (डेटा के प्रकार के आधार पर) में एकत्रित करने के कार्य को संदर्भित करता है। चूंकि वास्तविक दुनिया का डेटा कभी भी आदर्श नहीं होता है, इसलिए इस बात की संभावना