Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

स्किकिट-लर्न में लर्निंग मॉडल बिल्डिंग:एक पायथन मशीन लर्निंग लाइब्रेरी

इस लेख में, हम स्किकिट-लर्न में लर्निंग मॉडल बिल्डिंग के बारे में जानेंगे:एक पायथन मशीन लर्निंग लाइब्रेरी।

यह एक फ्री मशीन लर्निंग लाइब्रेरी है। यह रैंडम फ़ॉरेस्ट, वेक्टर मशीन और k-निकटतम पड़ोसियों जैसे विभिन्न एल्गोरिथम का समर्थन करता है, जिसमें numpy और scipy के साथ प्रत्यक्ष कार्यान्वयन होता है।

डेटासेट आयात करना

import pandasUrl =<अपना URL यहां निर्दिष्ट करें>data=pandas.rad_csv(url)

डेटा की खोज और सफाई

हम अपनी आवश्यकताओं के अनुसार अभिलेखों को निर्दिष्ट/फ़िल्टर करने के लिए शीर्ष विधि का उपयोग कर सकते हैं।

data.head()data.head(n=4) # रिकॉर्ड को 4 तक सीमित करना

हम डेटासेट के पिछले कुछ रिकॉर्ड भी लागू कर सकते हैं

data.tail()data.tail(n=4) # रिकॉर्ड को 4 तक सीमित करना

अब डेटा विज़ुअलाइज़ेशन का चरण आता है

इसके लिए, हम अपने डेटा की कल्पना करने के लिए सीबॉर्न मॉड्यूल और मैटप्लोटलिब का उपयोग करते हैं

समुद्री जन्म को simport matplotlib.pyplot के रूप में pltsns.set(style="whitegrid", color_codes=True)# के रूप में आयात करें। /पूर्व> 

डेटा को प्रीप्रोसेस करना

sklearn से आयात प्रीप्रोसेसिंग =प्रीप्रोसेसिंग।LabelEncoder()# कॉलम को संख्यात्मक मानों में बदलेंencoded_value =le.fit_transform(स्तंभ नामों की सूची)प्रिंट(एन्कोडेड_वैल्यू)

आखिरकार हम डेटा सेट को प्रशिक्षित करके मॉडल निर्माण के चरण तक पहुंचते हैं।

स्किकिट-लर्न में लर्निंग मॉडल बिल्डिंग:एक पायथन मशीन लर्निंग लाइब्रेरी

निष्कर्ष

इस लेख में, हमने स्किकिट-लर्न में मॉडल निर्माण के बारे में सीखा - एक पुस्तकालय जो पायथन में उपलब्ध है।


  1. पायथन में एक मॉडल के लिए गैर-रेखीय डेटा कैसे फिट हो सकता है?

    हम सीबॉर्न लाइब्रेरी का उपयोग करेंगे, जो डेटा को विज़ुअलाइज़ करने में मदद करती है। जब रिग्रेशन मॉडल बनाए जा रहे हैं, तो मल्टीकोलिनियरिटी की जाँच की जाती है। ऐसा इसलिए है क्योंकि हमें निरंतर चर के सभी विभिन्न संयोजनों के बीच मौजूद सहसंबंध को समझने की आवश्यकता है। यदि चरों के बीच बहुसंरेखण मौजूद है, त

  1. पायथन में एक छवि का संकल्प प्राप्त करने के लिए स्किकिट-लर्न लाइब्रेरी का उपयोग कैसे किया जा सकता है?

    डेटा प्री-प्रोसेसिंग मूल रूप से सभी डेटा (जो विभिन्न संसाधनों या एक संसाधन से एकत्र किया जाता है) को एक सामान्य प्रारूप में या एक समान डेटासेट (डेटा के प्रकार के आधार पर) में इकट्ठा करने के कार्य को संदर्भित करता है। चूंकि वास्तविक दुनिया का डेटा कभी भी आदर्श नहीं होता है, इस बात की संभावना है कि डे

  1. पायथन का उपयोग करके मशीन लर्निंग का परिचय

    इस लेख में, हम पायथन 3.x का उपयोग करके मशीन सीखने की मूल बातें सीखेंगे। या पहले। सबसे पहले, हमें मशीन सीखने के माहौल को स्थापित करने के लिए मौजूदा पुस्तकालयों का उपयोग करने की आवश्यकता है >>> pip install numpy >>> pip install scipy >>> pip install matplotlib >>>