हम एक विशिष्ट कॉलम को वर्गीकृत करके डेटा को आसानी से दोबारा बदल सकते हैं। यहां, हम "परिणाम" कॉलम यानी पास और फेल मानों को संख्याओं के रूप में वर्गीकृत करेंगे।
आवश्यक पुस्तकालय आयात करें -
import pandas as pd
2 कॉलम के साथ डेटाफ़्रेम बनाएं -
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } )
मानचित्र () फ़ंक्शन का उपयोग करके डेटा को फिर से आकार दें और बस 'पास' को 1 और 'असफल' को 0 पर सेट करें -
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
उदाहरण
निम्नलिखित कोड है -
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # reshaping into numbers dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, }) print"\nReshaped DataFrame ...\n",dataFrame
आउटपुट
यह निम्नलिखित आउटपुट उत्पन्न करेगा
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat