मान लें कि हमारे पास फूल डेटासेट है। फूल डेटासेट को Google API का उपयोग करके डाउनलोड किया जा सकता है जो मूल रूप से फूल डेटासेट से लिंक होता है। एपीआई को पैरामीटर के रूप में पास करने के लिए 'get_file' विधि का उपयोग किया जा सकता है। एक बार ऐसा करने के बाद, डेटा पर्यावरण में डाउनलोड हो जाता है।
इसे 'मैटप्लोटलिब' लाइब्रेरी का उपयोग करके देखा जा सकता है। कंसोल पर छवि प्रदर्शित करने के लिए 'इमशो' विधि का उपयोग किया जाता है।
और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है?
हम केरस अनुक्रमिक एपीआई का उपयोग करेंगे, जो एक अनुक्रमिक मॉडल बनाने में सहायक है जिसका उपयोग परतों के एक सादे ढेर के साथ काम करने के लिए किया जाता है, जहां हर परत में एक इनपुट टेंसर और एक आउटपुट टेंसर होता है।
एक इमेज क्लासिफायरियर एक keras.Sequential मॉडल का उपयोग करके बनाया गया है, और डेटा प्रीप्रोसेसिंग.image_dataset_from_directory का उपयोग करके लोड किया जाता है। डेटा कुशलता से डिस्क से लोड होता है। ओवरफिटिंग की पहचान की जाती है और इसे कम करने के लिए तकनीकों को लागू किया जाता है। इन तकनीकों में डेटा वृद्धि, और ड्रॉपआउट शामिल हैं। 3700 फूलों के चित्र हैं। इस डेटासेट में 5 उप निर्देशिकाएं हैं, और प्रति वर्ग एक उप निर्देशिका है। वे हैं:
- डेज़ी,
- डंडेलियन,
- गुलाब,
- सूरजमुखी, और
- ट्यूलिप।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
print("Visualizing the dataset") import matplotlib.pyplot as plt plt.figure(figsize=(10, 10)) for images, labels in train_ds.take(1): for i in range(6): ax = plt.subplot(3, 3, i + 1) plt.imshow(images[i].numpy().astype("uint8")) plt.title(class_names[labels[i]]) plt.axis("off") for image_batch, labels_batch in train_ds: print(image_batch.shape) print(labels_batch.shape) break
कोड क्रेडिट:https://www.tensorflow.org/tutorials/images/classification
आउटपुट
Visualizing the dataset (32, 180, 180, 3) (32,)
स्पष्टीकरण
- एक बार फ़िट विधि का उपयोग करके डेटा को प्रशिक्षित करने के बाद, छवियों के बैचों को पुनः प्राप्त करने के लिए डेटासेट को मैन्युअल रूप से पुनरावृत्त भी किया जा सकता है।
- यह डेटा कंसोल पर प्रदर्शित होता है।
- image_batch आकार का टेंसर है (32, 180, 180, 3)।
- यह 180x180x3 आकार की 32 छवियों का एक बैच है।
- लेबल_बैच आकार (32,) का एक टेंसर है, और ये 32 छवियों के अनुरूप लेबल हैं।
- .numpy() को इमेज_बैच और लेबल_बैच टेंसर पर कॉल करके उन्हें एक numpy.ndarray में बदला जा सकता है।