यूनिकोड डेटा मॉड्यूल का उपयोग यूनिकोड वर्ण डेटाबेस का उपयोग करके सभी यूनिकोड वर्णों तक पहुँचने के लिए किया जाता है। इस डेटाबेस में, सभी वर्णों के वर्ण गुण होते हैं।
इस मॉड्यूल का उपयोग करने के लिए, हमें यूनिकोडडेटा . आयात करने की आवश्यकता है हमारे कोड में मॉड्यूल।
import unicodedata
यूनिकोड डेटाबेस तरीके
यूनिकोडडेटा मॉड्यूल के कुछ मॉड्यूल यहां वर्णित हैं।
मॉड्यूल (unicodedata.lookup(name)) -
इस पद्धति का उपयोग नाम से वर्णों को देखने के लिए किया जाता है। जब नाम मान्य है, तो उसे चरित्र वापस करना चाहिए। अन्यथा यह KeyError उठाएगा।
मॉड्यूल (unicodedata.name(chr[, default]))-
इस विधि का उपयोग दिए गए वर्ण के नाम को स्ट्रिंग के रूप में वापस करने के लिए किया जाता है। यदि डिफ़ॉल्ट मान दिया गया है, तो यह डिफ़ॉल्ट रूप से वापस आ सकता है, जब चरित्र डेटाबेस में मौजूद नहीं है, अन्यथा यह ValueError बढ़ा देगा।
मॉड्यूल (unicodedata.digit(chr[, default])) -
इस विधि का उपयोग दिए गए वर्ण के पूर्णांक अंक को वापस करने के लिए किया जाता है। यदि डिफ़ॉल्ट मान दिया गया है, तो यह डिफ़ॉल्ट रूप से वापस आ सकता है, जब चरित्र मौजूद नहीं है या डेटाबेस में सही तरीके से नहीं है, अन्यथा यह ValueError बढ़ा देगा।
मॉड्यूल (unicodedata.category(chr)) -
इस पद्धति का उपयोग सामान्य श्रेणी को वापस करने के लिए किया जाता है जिसे चरित्र के साथ सौंपा गया है। जैसे अक्षरों के लिए यह 'L' लौटाएगा, अपरकेस अक्षर के लिए, यह 'u' होगा, कोष्ठक खोलने के लिए, यह Ps (विराम चिह्न प्रारंभ) आदि लौटाएगा।
मॉड्यूल (unicodedata.mirrored(chr))-
इस पद्धति का उपयोग यह जांचने के लिए किया जाता है कि चरित्र में कोई प्रतिबिम्बित वर्ण है या नहीं। कुछ पात्रों में '(' और ')' आदि जैसे चरित्र प्रतिबिंबित होते हैं। जब यह प्रतिबिंबित चरित्र से मेल खाता है, तो यह 1 लौटाएगा, अन्यथा 0.
उदाहरण कोड
import unicodedata as ud print(ud.lookup('ASTERISK')) print(ud.lookup('Latin Capital letter G')) #The Unicode name from the characters print(ud.name(u'x')) print(ud.name(u'°')) #The Unicode character to decimal and numerics print(ud.decimal(u'6')) print(ud.numeric(u'9')) #The Unicode character categoty print(ud.category(u'A')) print(ud.category(u'9')) print(ud.category(u'[')) #Punctuation Start #Unicode character to check whether mirrored or not print(ud.mirrored(u'A')) print(ud.mirrored(u'<'))
आउटपुट
* G LATIN SMALL LETTER X DEGREE SIGN 6 9.0 Lu Nd Ps 0 1