Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

बताएं कि पायथन में स्किकिट-लर्न लाइब्रेरी का उपयोग करके L1 सामान्यीकरण कैसे लागू किया जा सकता है?

मूल्यों की एक श्रेणी को मूल्यों की मानकीकृत श्रेणी में परिवर्तित करने की प्रक्रिया को सामान्यीकरण के रूप में जाना जाता है। ये मान -1 से +1 या 0 से 1 के बीच हो सकते हैं। डेटा को घटाव और भाग की मदद से भी सामान्यीकृत किया जा सकता है।

इनपुट के रूप में लर्निंग एल्गोरिथम को खिलाया गया डेटा सुसंगत और संरचित रहना चाहिए। मूल्यों का प्रभावी ढंग से अनुमान लगाने के लिए इनपुट डेटा की सभी विशेषताएं एकल पैमाने पर होनी चाहिए। लेकिन वास्तविक दुनिया में, डेटा असंरचित होता है, और अधिकांश समय, समान पैमाने पर नहीं होता है।

यह तब होता है जब सामान्यीकरण तस्वीर में आता है। यह सबसे महत्वपूर्ण डेटा-तैयारी प्रक्रिया में से एक है।

यह इनपुट डेटासेट के कॉलम के मानों को समान पैमाने पर बदलने में मदद करता है।

सामान्यीकरण की प्रक्रिया के दौरान, मूल्यों की श्रेणी को गैर-विकृत होना सुनिश्चित किया जाता है।

नोट - मशीन लर्निंग एल्गोरिदम को फीड किए गए सभी इनपुट डेटासेट को सामान्यीकृत नहीं करना पड़ता है। सामान्यीकरण की आवश्यकता केवल तभी होती है जब किसी डेटासेट में सुविधाओं का मान पूरी तरह से भिन्न होता है।

सामान्यीकरण विभिन्न प्रकार के होते हैं -

  • न्यूनतम-अधिकतम सामान्यीकरण
  • Z सामान्यीकरण
  • इकाई वेक्टर सामान्यीकरण

आइए समझते हैं कि L1 सामान्यीकरण कैसे काम करता है।

कम से कम निरपेक्ष विचलन के रूप में भी जाना जाता है, यह डेटा को इस तरह बदलता है कि निरपेक्ष मानों का योग प्रत्येक पंक्ति में 1 रहता है।

आइए देखें कि पायथन में स्किकिट लर्न का उपयोग करके L1 सामान्यीकरण कैसे लागू किया जा सकता है -

उदाहरण

import numpy as np
from sklearn import preprocessing
input_data = np.array(
   [[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.62],[5.9, 2.38, -55.82]]
)
data_normalized_l1 = preprocessing.normalize(input_data, norm='l1')
print("\nL1 normalized data is \n", data_normalized_l1)

आउटपुट

L1 normalized data is
[[ 0.26312604 0.24133757 -0.49553639]
[-0.16105417 0.0239141 -0.81503172]
[ 0.00372856 -0.65607755 0.34019389]
[ 0.09204368 0.03712949 -0.87082683]]

स्पष्टीकरण

  • आवश्यक पैकेज आयात किए जाते हैं।

  • इनपुट डेटा Numpy लाइब्रेरी का उपयोग करके जेनरेट किया जाता है।

  • 'प्रीप्रोसेसिंग' वर्ग में मौजूद 'नॉर्मलाइज़' फंक्शन का इस्तेमाल डेटा को नॉर्मल करने के लिए किया जाता है।

  • सामान्यीकरण के प्रकार को 'l1' के रूप में निर्दिष्ट किया गया है।

  • इस तरह, सरणी में कोई भी डेटा सामान्यीकृत हो जाता है और प्रत्येक पंक्ति का योग केवल 1 होगा।

  • यह सामान्यीकृत डेटा कंसोल पर प्रदर्शित होता है।


  1. पाइथन में सीबोर्न लाइब्रेरी में बार प्लॉट का उपयोग कैसे किया जा सकता है?

    सीबॉर्न एक पुस्तकालय है जो डेटा की कल्पना करने में मदद करता है। यह अनुकूलित थीम और उच्च स्तरीय इंटरफ़ेस के साथ आता है। पिछले प्लॉट्स में, हमने पूरे डेटासेट को ग्राफ पर प्लॉट किया था। बार प्लॉट की मदद से हम डेटा के वितरण की केंद्रीय प्रवृत्ति को समझ सकते हैं। बारप्लॉट फ़ंक्शन एक श्रेणीगत चर और एक स

  1. पायथन में 'सीबॉर्न' लाइब्रेरी का उपयोग करके डेटा को नेत्रहीन रूप से कैसे दर्शाया जा सकता है?

    मशीन लर्निंग डेटा से मॉडल बनाने और पहले कभी नहीं देखे गए डेटा पर सामान्यीकरण करने से संबंधित है। मशीन लर्निंग मॉडल को इनपुट के रूप में प्रदान किया गया डेटा ऐसा होना चाहिए कि इसे सिस्टम द्वारा ठीक से समझा जाए, ताकि यह डेटा की व्याख्या कर सके और परिणाम उत्पन्न कर सके। सीबॉर्न एक पुस्तकालय है जो डेटा

  1. पायथन में एक छवि का संकल्प प्राप्त करने के लिए स्किकिट-लर्न लाइब्रेरी का उपयोग कैसे किया जा सकता है?

    डेटा प्री-प्रोसेसिंग मूल रूप से सभी डेटा (जो विभिन्न संसाधनों या एक संसाधन से एकत्र किया जाता है) को एक सामान्य प्रारूप में या एक समान डेटासेट (डेटा के प्रकार के आधार पर) में इकट्ठा करने के कार्य को संदर्भित करता है। चूंकि वास्तविक दुनिया का डेटा कभी भी आदर्श नहीं होता है, इस बात की संभावना है कि डे