Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

Tensorflow और Python का उपयोग करके समान लंबाई वाले कई स्ट्रिंग्स को कैसे एनकोड करें?

इनपुट मान के रूप में 'tf.Tensor' का उपयोग करके समान लंबाई के कई स्ट्रिंग्स को एन्कोड किया जा सकता है। जब अलग-अलग लंबाई के कई स्ट्रिंग्स को एन्कोड करने की आवश्यकता होती है, तो इनपुट के रूप में एक tf.RaggedTensor का उपयोग किया जाना चाहिए। यदि एक टेंसर में गद्देदार/विरल प्रारूप में कई तार होते हैं, तो इसे tf.RaggedTensor में परिवर्तित करने की आवश्यकता होती है। फिर, उस पर unicode_encode विधि को कॉल किया जाना चाहिए।

और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है?

आइए समझें कि पायथन का उपयोग करके यूनिकोड स्ट्रिंग्स का प्रतिनिधित्व कैसे करें, और यूनिकोड समकक्षों का उपयोग करने वालों में हेरफेर करें। सबसे पहले, हम यूनिकोड स्ट्रिंग्स को मानक स्ट्रिंग ऑप्स के यूनिकोड समकक्षों की सहायता से स्क्रिप्ट डिटेक्शन के आधार पर टोकन में अलग करते हैं।

हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।

print("When encoding multiple strings of   same lengths, tf.Tensor is used as input")
tf.strings.unicode_encode([[99, 97, 116], [100, 111, 103], [ 99, 111, 119]],output_encoding='UTF-8')
print("When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input:")
tf.strings.unicode_encode(batch_chars_ragged, output_encoding='UTF-8')
print("If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encode")
tf.strings.unicode_encode(
   tf.RaggedTensor.from_sparse(batch_chars_sparse),
   output_encoding='UTF-8')
tf.strings.unicode_encode(
   tf.RaggedTensor.from_tensor(batch_chars_padded, padding=-1),
   output_encoding='UTF-8')

कोड क्रेडिट:https://www.tensorflow.org/tutorials/load_data/unicode

आउटपुट

When encoding multiple strings of   same lengths, tf.Tensor is used as input
When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input:
If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encode

स्पष्टीकरण

  • एक ही लंबाई के कई स्ट्रिंग्स को एन्कोड करते समय, tf.Tensor को इनपुट के रूप में इस्तेमाल किया जा सकता है।
  • अलग-अलग लंबाई वाली कई स्ट्रिंग्स को एन्कोड करते समय, एक tf.RaggedTensor को इनपुट के रूप में इस्तेमाल किया जा सकता है।
  • जब पैडेड/स्पैस प्रारूप में कई स्ट्रिंग्स के साथ एक टेंसर होता है, तो इसे unicode_encode पर कॉल करने से पहले इसे एक tf.RaggedTensor में परिवर्तित करने की आवश्यकता होती है।

  1. पायथन का उपयोग करके मॉडल को प्रशिक्षित करने के लिए Tensorflow का उपयोग कैसे किया जा सकता है?

    मॉडल को Tensorflow में ट्रेन पद्धति का उपयोग करके प्रशिक्षित किया जा सकता है, जहां युगों (मॉडल को फिट करने के लिए डेटा को प्रशिक्षित करने की संख्या) और प्रशिक्षण डेटा निर्दिष्ट किया जाता है। और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है? हम

  1. केरस का उपयोग कॉलबैक बनाने और पायथन का उपयोग करके वज़न बचाने के लिए कैसे किया जा सकता है?

    Tensorflow एक मशीन लर्निंग फ्रेमवर्क है जो Google द्वारा प्रदान किया जाता है। यह एक ओपन-सोर्स फ्रेमवर्क है जिसका उपयोग एल्गोरिदम, गहन शिक्षण अनुप्रयोगों और बहुत कुछ को लागू करने के लिए पायथन के साथ संयोजन में किया जाता है। इसका उपयोग अनुसंधान और उत्पादन उद्देश्यों के लिए किया जाता है। इसमें अनुकूलन

  1. Matplotlib और Python का उपयोग करके एक ही आकृति में एकाधिक भूखंडों को कैसे प्लॉट किया जा सकता है?

    Matplotlib एक लोकप्रिय पायथन पैकेज है जिसका उपयोग डेटा विज़ुअलाइज़ेशन के लिए किया जाता है। डेटा को विज़ुअलाइज़ करना एक महत्वपूर्ण कदम है क्योंकि यह यह समझने में मदद करता है कि वास्तव में संख्याओं को देखे बिना और जटिल गणना किए बिना डेटा में क्या हो रहा है। यह दर्शकों को मात्रात्मक अंतर्दृष्टि को प्