एक सबसेट बनाने और डुप्लिकेट मानों से केवल अंतिम प्रविष्टि प्रदर्शित करने के लिए, "रखें . का उपयोग करें "अंतिम . के साथ पैरामीटर ड्रॉप_डुप्लिकेट () विधि में मूल्य। drop_duplicates() विधि ने डुप्लीकेट हटा दिए।
आइए सबसे पहले 3 कॉलम के साथ एक DataFrame बनाएं -
dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]})
डुप्लिकेट को हटाना और अंतिम प्रविष्टि प्रदर्शित करना। कीप पैरामीटर का उपयोग करते हुए, हमने "अंतिम" सेट किया है। अंतिम प्रविष्टि को छोड़कर डुप्लिकेट पंक्तियां हटा दी जाएंगी। हमने "सबसेट" पैरामीटर का उपयोग करके एक सबसेट पर विचार किया है -
dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True)
उदाहरण
निम्नलिखित कोड है -
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]}) print"Dataframe...\n", dataFrame # removing duplicates and displaying last entry # using keep parameter, we have set "last" # duplicate rows except the last entry will get deleted # considered a subset using the subset parameter dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True) print"\nUpdated DataFrame after removing duplicates...\n",dataFrame2
आउटपुट
यह निम्नलिखित आउटपुट उत्पन्न करेगा -
Dataframe... Car Place UnitsSold 0 BMW Delhi 85 1 Mercedes Hyderabad 70 2 Lamborghini Chandigarh 80 3 BMW Delhi 95 4 Mercedes Hyderabad 55 5 Porsche Mumbai 90 Updated DataFrame after removing duplicates... Car Place UnitsSold 0 Lamborghini Chandigarh 80 1 BMW Delhi 95 2 Mercedes Hyderabad 55 3 Porsche Mumbai 90