इनपुट मान के रूप में 'tf.Tensor' का उपयोग करके समान लंबाई के कई स्ट्रिंग्स को एन्कोड किया जा सकता है। जब अलग-अलग लंबाई के कई स्ट्रिंग्स को एन्कोड करने की आवश्यकता होती है, तो इनपुट के रूप में एक tf.RaggedTensor का उपयोग किया जाना चाहिए। यदि एक टेंसर में गद्देदार/विरल प्रारूप में कई तार होते हैं, तो इसे tf.RaggedTensor में परिवर्तित करने की आवश्यकता होती है। फिर, उस पर unicode_encode विधि को कॉल किया जाना चाहिए।
और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है?
आइए समझें कि पायथन का उपयोग करके यूनिकोड स्ट्रिंग्स का प्रतिनिधित्व कैसे करें, और यूनिकोड समकक्षों का उपयोग करने वालों में हेरफेर करें। सबसे पहले, हम यूनिकोड स्ट्रिंग्स को मानक स्ट्रिंग ऑप्स के यूनिकोड समकक्षों की सहायता से स्क्रिप्ट डिटेक्शन के आधार पर टोकन में अलग करते हैं।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
print("When encoding multiple strings of same lengths, tf.Tensor is used as input") tf.strings.unicode_encode([[99, 97, 116], [100, 111, 103], [ 99, 111, 119]],output_encoding='UTF-8') print("When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input:") tf.strings.unicode_encode(batch_chars_ragged, output_encoding='UTF-8') print("If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encode") tf.strings.unicode_encode( tf.RaggedTensor.from_sparse(batch_chars_sparse), output_encoding='UTF-8') tf.strings.unicode_encode( tf.RaggedTensor.from_tensor(batch_chars_padded, padding=-1), output_encoding='UTF-8')
कोड क्रेडिट:https://www.tensorflow.org/tutorials/load_data/unicode
आउटपुट
When encoding multiple strings of same lengths, tf.Tensor is used as input When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input: If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encode
स्पष्टीकरण
- एक ही लंबाई के कई स्ट्रिंग्स को एन्कोड करते समय, tf.Tensor को इनपुट के रूप में इस्तेमाल किया जा सकता है।
- अलग-अलग लंबाई वाली कई स्ट्रिंग्स को एन्कोड करते समय, एक tf.RaggedTensor को इनपुट के रूप में इस्तेमाल किया जा सकता है।
- जब पैडेड/स्पैस प्रारूप में कई स्ट्रिंग्स के साथ एक टेंसर होता है, तो इसे unicode_encode पर कॉल करने से पहले इसे एक tf.RaggedTensor में परिवर्तित करने की आवश्यकता होती है।