डेटा प्री-प्रोसेसिंग मूल रूप से सभी डेटा (जो विभिन्न संसाधनों या एक संसाधन से एकत्र किया जाता है) को एक सामान्य प्रारूप में या एक समान डेटासेट (डेटा के प्रकार के आधार पर) में इकट्ठा करने के कार्य को संदर्भित करता है। चूंकि वास्तविक दुनिया का डेटा कभी भी आदर्श नहीं होता है, इस बात की संभावना है कि डेटा में लापता सेल, त्रुटियां, आउटलेयर, कॉलम में विसंगतियां और बहुत कुछ होगा। कभी-कभी, छवियों को सही ढंग से संरेखित नहीं किया जा सकता है, या स्पष्ट नहीं हो सकता है या बहुत बड़ा आकार हो सकता है। प्री-प्रोसेसिंग का लक्ष्य इन विसंगतियों और त्रुटियों को दूर करना है।
एक छवि का संकल्प प्राप्त करने के लिए, 'आकृति' नामक एक अंतर्निहित फ़ंक्शन का उपयोग किया जाता है। छवि पढ़ने के बाद, पिक्सेल मान एक सरणी के रूप में संग्रहीत होते हैं। यह सरणी कुछ और नहीं बल्कि एक Numpy सरणी है। एक बार जब छवि को पढ़ लिया जाता है और एक सरणी में परिवर्तित कर दिया जाता है, तो इसके संकल्प को समझने के लिए इस छवि पर आकृति फ़ंक्शन को कॉल किया जा सकता है।
आइए हम स्किकिट-लर्न लाइब्रेरी का उपयोग करके एक छवि अपलोड करने और कंसोल पर छवि का रिज़ॉल्यूशन प्राप्त करने का एक उदाहरण लेते हैं -
उदाहरण
from skimage import io path = "path to puppy.PNG" img = io.imread(path) print("Image being read") io.imshow(img) print("Image printed on console") print("The image resolution is ") print(img.shape)
आउटपुट
Image being read Image printed on console The image resolution is (397, 558, 4)
स्पष्टीकरण
- आवश्यक पुस्तकालय आयात किए जाते हैं।
- वह पथ जहां छवि संग्रहीत है परिभाषित की गई है।
- 'इमरीड' फ़ंक्शन का उपयोग पथ पर जाने और चित्र को पढ़ने के लिए किया जाता है।
- कंसोल पर छवि प्रदर्शित करने के लिए 'इमशो' फ़ंक्शन का उपयोग किया जाता है।
- फ़ंक्शन 'shape' का उपयोग इमेज का रिजॉल्यूशन प्राप्त करने के लिए किया जाता है।
- आउटपुट का तीसरा मान 4 दिखाता है, जिसका अर्थ है कि इसमें 4 चैनल हैं- R, G, B और अल्फ़ा मान।
- डेटा कंसोल पर प्रदर्शित होता है।