हम एक विशिष्ट कॉलम को वर्गीकृत करके डेटा को आसानी से दोबारा बदल सकते हैं। यहां, हम "परिणाम" कॉलम यानी पास और फेल मानों को संख्याओं के रूप में वर्गीकृत करेंगे।
आवश्यक पुस्तकालय आयात करें -
import pandas as pd
2 कॉलम के साथ डेटाफ़्रेम बनाएं -
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
) मानचित्र () फ़ंक्शन का उपयोग करके डेटा को फिर से आकार दें और बस 'पास' को 1 और 'असफल' को 0 पर सेट करें -
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
उदाहरण
निम्नलिखित कोड है -
import pandas as pd
# Create DataFrame
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\nReshaped DataFrame ...\n",dataFrame आउटपुट
यह निम्नलिखित आउटपुट उत्पन्न करेगा
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat