Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन पांडा - एक सबसेट बनाएं और डुप्लिकेट मानों से केवल अंतिम प्रविष्टि प्रदर्शित करें

एक सबसेट बनाने और डुप्लिकेट मानों से केवल अंतिम प्रविष्टि प्रदर्शित करने के लिए, "रखें . का उपयोग करें "अंतिम . के साथ पैरामीटर ड्रॉप_डुप्लिकेट () विधि में मूल्य। drop_duplicates() विधि ने डुप्लीकेट हटा दिए।

आइए सबसे पहले 3 कॉलम के साथ एक DataFrame बनाएं -

dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]})

डुप्लिकेट को हटाना और अंतिम प्रविष्टि प्रदर्शित करना। कीप पैरामीटर का उपयोग करते हुए, हमने "अंतिम" सेट किया है। अंतिम प्रविष्टि को छोड़कर डुप्लिकेट पंक्तियां हटा दी जाएंगी। हमने "सबसेट" पैरामीटर का उपयोग करके एक सबसेट पर विचार किया है -

dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True)

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]})

print"Dataframe...\n", dataFrame

# removing duplicates and displaying last entry
# using keep parameter, we have set "last"
# duplicate rows except the last entry will get deleted
# considered a subset using the subset parameter
dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True)
print"\nUpdated DataFrame after removing duplicates...\n",dataFrame2

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

Dataframe...
           Car       Place   UnitsSold
0          BMW       Delhi          85
1     Mercedes   Hyderabad          70
2  Lamborghini  Chandigarh          80
3          BMW       Delhi          95
4     Mercedes   Hyderabad          55
5      Porsche      Mumbai          90

Updated DataFrame after removing duplicates...
           Car       Place   UnitsSold
0  Lamborghini  Chandigarh          80
1          BMW       Delhi          95
2     Mercedes   Hyderabad          55
3      Porsche      Mumbai          90

  1. पायथन पांडा - इंडेक्सिंग ऑपरेटर का उपयोग करके एक सबसेट डेटाफ़्रेम बनाएं

    इंडेक्सिंग ऑपरेटर एक सबसेट डेटाफ़्रेम बनाने के लिए वर्गाकार कोष्ठक है। आइए पहले पंडों का डेटाफ़्रेम बनाएं। हमारे पास DataFrame में 3 कॉलम हैं dataFrame = pd.DataFrame({"Product": ["SmartTV", "ChromeCast", "Speaker", "Earphone"],"Opening_Stock&qu

  1. पायथन पांडा - इंडेक्स के आधार पर कॉलम से विशिष्ट मान चुनकर एक सबसेट बनाएं

    अनुक्रमणिका के आधार पर स्तंभों से विशिष्ट मान चुनकर एक सबसेट बनाने के लिए, iloc() विधि का उपयोग करें। आइए सबसे पहले पांडा पुस्तकालय को आयात करें import pandas as pd उत्पाद रिकॉर्ड के साथ एक पांडा डेटाफ़्रेम बनाएँ। हमारे पास इसमें 3 कॉलम हैं dataFrame = pd.DataFrame({"Product": ["Smar

  1. पायथन पांडा - डेटाफ्रेम के सूचकांक को बहु-सूचकांक के रूप में प्रदर्शित करें

    डेटाफ़्रेम के इंडेक्स को मल्टीइंडेक्स के रूप में प्रदर्शित करने के लिए, डेटाफ़्रेम.इंडेक्स () का उपयोग करें। सबसे पहले, हम सूचियों का एक शब्दकोश बनाते हैं - # dictionary of lists d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley&#