हम देखेंगे कि केवल गैर-डुप्लिकेट मूल्यों को कैसे प्रदर्शित किया जाए। सबसे पहले, हम डुप्लिकेट मानों के साथ एक DataFrame बनाएंगे -
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
}
) ऊपर, हमने 2 कॉलम बनाए हैं। केवल गैर-डुप्लिकेट मानों को प्रदर्शित करने के लिए, डुप्लिकेट () विधि का उपयोग करें और तार्किक नहीं। इसके माध्यम से, गैर-डुप्लिकेट मान प्राप्त किए जाएंगे -
dataFrame[~dataFrame.duplicated('Student')]
उदाहरण
पूरा कोड निम्नलिखित है -
import pandas as pd
# Create DataFrame
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# displaying non-duplicates
res = dataFrame[~dataFrame.duplicated('Student')]
print"\nDataFrame after removing duplicates ...\n",res आउटपुट
यह निम्नलिखित आउटपुट देगा -
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Pass Ted 3 Fail Robin 4 Pass Scarlett 5 Pass Kat 6 Pass Ted DataFrame after removing duplicates ... Result Student 0 Pass Jack 1 Fail Robin 2 Pass Ted 4 Pass Scarlett 5 Pass Kat