एन्कोडेड स्ट्रिंग स्केलर को 'डीकोड' पद्धति का उपयोग करके कोड बिंदुओं के वेक्टर में परिवर्तित किया जा सकता है। कोड बिंदुओं के वेक्टर को 'एन्कोड' विधि का उपयोग करके एन्कोडेड स्ट्रिंग स्केलर में परिवर्तित किया जा सकता है। एन्कोडेड स्ट्रिंग स्केलर को 'ट्रांसकोड' पद्धति का उपयोग करके एक अलग एन्कोडिंग में परिवर्तित किया जा सकता है।
और पढ़ें:TensorFlow क्या है और Keras कैसे TensorFlow के साथ तंत्रिका नेटवर्क बनाने के लिए काम करता है?
आइए समझें कि पायथन का उपयोग करके यूनिकोड स्ट्रिंग्स का प्रतिनिधित्व कैसे करें, और यूनिकोड समकक्षों का उपयोग करने वालों में हेरफेर करें। सबसे पहले, हम यूनिकोड स्ट्रिंग्स को मानक स्ट्रिंग ऑप्स के यूनिकोड समकक्षों की सहायता से स्क्रिप्ट डिटेक्शन के आधार पर टोकन में अलग करते हैं।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
print("Converting encoded string scalar to a vector of code points") tf.strings.unicode_decode(text_utf8,input_encoding='UTF-8') print("Converting vector of code points to an encoded string scalar") tf.strings.unicode_encode(text_chars, output_encoding='UTF-8') print("Converting encoded string scalar to a different encoding") tf.strings.unicode_transcode(text_utf8, input_encoding='UTF8', output_encoding='UTF-16-BE')
कोड क्रेडिट:https://www.tensorflow.org/tutorials/load_data/unicode
आउटपुट
Converting encoded string scalar to a vector of code points Converting vector of code points to an encoded string scalar Converting encoded string scalar to a different encoding <tf.Tensor: shape=(), dtype=string, numpy=b'\x8b\xed\x8a\x00Y\x04t\x06'>
स्पष्टीकरण
- फ़ंक्शन 'unicode_decode' का उपयोग एन्कोडेड स्ट्रिंग स्केलर को कोड बिंदुओं के वेक्टर में बदलने के लिए किया जाता है।
- फ़ंक्शन 'unicode_encode' का उपयोग कोड बिंदुओं के वेक्टर को एन्कोडेड स्ट्रिंग स्केलर में बदलने के लिए किया जाता है।
- फ़ंक्शन 'unicode_transcode' का उपयोग एन्कोडेड स्ट्रिंग स्केलर को एक अलग एन्कोडिंग में बदलने के लिए किया जाता है।