इस लेख में, हम स्किकिट-लर्न में लर्निंग मॉडल बिल्डिंग के बारे में जानेंगे:एक पायथन मशीन लर्निंग लाइब्रेरी।
यह एक फ्री मशीन लर्निंग लाइब्रेरी है। यह रैंडम फ़ॉरेस्ट, वेक्टर मशीन और k-निकटतम पड़ोसियों जैसे विभिन्न एल्गोरिथम का समर्थन करता है, जिसमें numpy और scipy के साथ प्रत्यक्ष कार्यान्वयन होता है।
डेटासेट आयात करना
import pandasUrl =<अपना URL यहां निर्दिष्ट करें>data=pandas.rad_csv(url)
डेटा की खोज और सफाई
हम अपनी आवश्यकताओं के अनुसार अभिलेखों को निर्दिष्ट/फ़िल्टर करने के लिए शीर्ष विधि का उपयोग कर सकते हैं।
data.head()data.head(n=4) # रिकॉर्ड को 4 तक सीमित करना
हम डेटासेट के पिछले कुछ रिकॉर्ड भी लागू कर सकते हैं
data.tail()data.tail(n=4) # रिकॉर्ड को 4 तक सीमित करना
अब डेटा विज़ुअलाइज़ेशन का चरण आता है
इसके लिए, हम अपने डेटा की कल्पना करने के लिए सीबॉर्न मॉड्यूल और मैटप्लोटलिब का उपयोग करते हैं
समुद्री जन्म को simport matplotlib.pyplot के रूप में pltsns.set(style="whitegrid", color_codes=True)# के रूप में आयात करें। /पूर्व>डेटा को प्रीप्रोसेस करना
sklearn से आयात प्रीप्रोसेसिंग =प्रीप्रोसेसिंग।LabelEncoder()# कॉलम को संख्यात्मक मानों में बदलेंencoded_value =le.fit_transform(स्तंभ नामों की सूची)प्रिंट(एन्कोडेड_वैल्यू)आखिरकार हम डेटा सेट को प्रशिक्षित करके मॉडल निर्माण के चरण तक पहुंचते हैं।
निष्कर्ष
इस लेख में, हमने स्किकिट-लर्न में मॉडल निर्माण के बारे में सीखा - एक पुस्तकालय जो पायथन में उपलब्ध है।