Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पांडा का उपयोग करके डेटाफ्रेम से पंक्तियों/स्तंभों को हटा दें। ड्रॉप ()

पंडों डेटा विश्लेषण और डेटा तकरार के लिए सबसे लोकप्रिय अजगर पुस्तकालय में से एक है। इस लेख में हम देखेंगे कि कैसे हम एक पांडा डेटाफ़्रेम बना सकते हैं और फिर इस डेटा फ़्रेम से कुछ चुनिंदा पंक्तियों या स्तंभों को हटा सकते हैं।

पंक्तियों को हटाना

नीचे दिए गए उदाहरण में हमारे पास iris.csv फ़ाइल है जिसे डेटा फ़्रेम में पढ़ा जाता है। हम पहले मौजूदा डेटा फ़्रेम पर एक नज़र डालते हैं और फिर ड्रॉप फ़ंक्शन को इंडेक्स कॉलम पर लागू करते हैं, जिस मूल्य को हम छोड़ना चाहते हैं। जैसा कि हम परिणाम सेट के निचले भाग में देख सकते हैं कि पंक्तियों की संख्या 3 से कम कर दी गई है।

उदाहरण

import pandas as pd
# making data frame from csv file
data = pd.read_csv("E:\\iris1.csv",index_col ="Id")
print(data)
# dropping passed values
data.drop([6,9,10],inplace=True)
# display
print(data)

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1    5.1                3.5             1.4             0.2       Iris-setosa
2    4.9                3.0             1.4             0.2       Iris-setosa
3    4.7                3.2             1.3             0.2       Iris-setosa
.   ..   …   .…   .…..……
[150 rows x 5 columns]

After Dropping
   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1      5.1                3.5             1.4             0.2       Iris-setosa
2      4.9                3.0             1.4             0.2       Iris-setosa
3      4.7                3.2             1.3             0.2       Iris-setosa
149    6.2                3.4             5.4             2.3       Iris-virginica
150    5.9                3.0             5.1             1.8       Iris-virginica
………………….
[147 rows x 5 columns]

ड्रॉपिंग कॉलम

स्तंभों को छोड़ने के लिए एक पांडा डेटा फ्रेम बनाते हैं, हम अक्ष पैरामीटर का उपयोग करते हैं। इसका मान ड्रॉप फ़ंक्शन में एक पर सेट होता है और हम ड्रॉप किए जाने वाले कॉलम नामों की आपूर्ति करते हैं। जैसा कि आप देख सकते हैं कि परिणाम सेट में कॉलम की संख्या 5 से घटकर 3 हो जाती है।

उदाहरण

import pandas as pd
# making data frame from csv file
data = pd.read_csv("E:\\iris1.csv",index_col ="Id")
print(data)
# dropping passed values
data.drop(['SepalWidthCm','PetalLengthCm'],axis=1,inplace=True)
print("After Dropping")
# display
print(data)

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1       5.1          3.5                1.4             0.2          Iris-setosa
2       4.9          3.0                1.4             0.2          Iris-setosa
3       4.7          3.2                1.3             0.2          Iris-setosa
.   .   .…   .…   .….   .……
[150 rows x 5 columns]
After Dropping
   SepalLengthCm    PetalWidthCm    Species
Id
1    5.1             0.2             Iris-setosa
2    4.9             0.2             Iris-setosa
3    4.7             0.2             Iris-setosa
.....….
[150 rows x 3 columns]

  1. पायथन पांडा - डेटाफ़्रेम से पंक्तियों का एक सबसेट चुनें

    पंक्तियों का एक सबसेट चुनने के लिए, शर्तों का उपयोग करें और डेटा प्राप्त करें। मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv

  1. पायथन पांडा - डेटाफ्रेम में एकाधिक डेटा कॉलम प्लॉट करें?

    कई कॉलमों को प्लॉट करने के लिए, हम एक बार ग्राफ तैयार करेंगे। प्लॉट () का प्रयोग करें विधि और प्रकार . सेट करें बार . के लिए पैरामीटर बार ग्राफ के लिए। आइए पहले आवश्यक पुस्तकालयों को आयात करें - pdimport matplotlib.pyplot को mp के रूप में आयात करें टीम रिकॉर्ड्स के साथ हमारा डेटा निम्नलिखित है - डे

  1. पायथन - पंडों के डेटाफ़्रेम से अशक्त पंक्तियों को कैसे छोड़ें?

    पंडों के डेटाफ़्रेम में अशक्त पंक्तियों को छोड़ने के लिए, ड्रॉपना () विधि का उपयोग करें। मान लें कि कुछ NaN यानी शून्य मानों वाली हमारी CSV फ़ाइल निम्नलिखित है - आइए read_csv() का उपयोग करके CSV फ़ाइल पढ़ें। हमारा सीएसवी डेस्कटॉप पर है - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\Ca