कैरेक्टर सबस्ट्रिंग्स का उपयोग टेन्सरफ़्लो के साथ 'सबस्ट्र' विधि का उपयोग करके किया जा सकता है जो टेन्सरफ़्लो के 'स्ट्रिंग्स' मॉड्यूल में मौजूद है। फिर इसे एक Numpy सरणी में बदल दिया जाता है और फिर प्रदर्शित किया जाता है।
और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है?
हम देखेंगे कि पायथन का उपयोग करके यूनिकोड स्ट्रिंग्स का प्रतिनिधित्व कैसे किया जाता है, और यूनिकोड समकक्षों का उपयोग करने वालों में हेरफेर किया जाता है। सबसे पहले, यूनिकोड स्ट्रिंग्स को मानक स्ट्रिंग ऑप्स के यूनिकोड समकक्षों की सहायता से स्क्रिप्ट डिटेक्शन के आधार पर टोकन में अलग करें।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
print("The default unit is byte") print("When len is 1, a single byte is returned") tf.strings.substr(thanks, pos=7, len=1).numpy() print("The unit is specified as UTF8_CHAR") print("It takes up 4 bytes") print(tf.strings.substr(thanks, pos=7, len=1, unit='UTF8_CHAR').numpy())
कोड क्रेडिट:https://www.tensorflow.org/tutorials/load_data/unicode
आउटपुट
The default unit is byte When len is 1, a single byte is returned The unit is specified as UTF8_CHAR It takes up 4 bytes b''
स्पष्टीकरण
- tf.strings.substr ऑपरेशन "इकाई" पैरामीटर लेता है।
- फिर यह इसका उपयोग यह निर्धारित करने के लिए करता है कि "पॉज़" और "लेन" पैरामीटर्स में किस प्रकार के ऑफ़सेट होंगे।