पायथन यूनिकोड डेटाबेस

यूनिकोड डेटा मॉड्यूल का उपयोग यूनिकोड वर्ण डेटाबेस का उपयोग करके सभी यूनिकोड वर्णों तक पहुँचने के लिए किया जाता है। इस डेटाबेस में, सभी वर्णों के वर्ण गुण होते हैं।

इस मॉड्यूल का उपयोग करने के लिए, हमें यूनिकोडडेटा . आयात करने की आवश्यकता है हमारे कोड में मॉड्यूल।

import unicodedata

यूनिकोड डेटाबेस तरीके

यूनिकोडडेटा मॉड्यूल के कुछ मॉड्यूल यहां वर्णित हैं।

मॉड्यूल (unicodedata.lookup(name)) -

इस पद्धति का उपयोग नाम से वर्णों को देखने के लिए किया जाता है। जब नाम मान्य है, तो उसे चरित्र वापस करना चाहिए। अन्यथा यह KeyError उठाएगा।

मॉड्यूल (unicodedata.name(chr[, default]))-

इस विधि का उपयोग दिए गए वर्ण के नाम को स्ट्रिंग के रूप में वापस करने के लिए किया जाता है। यदि डिफ़ॉल्ट मान दिया गया है, तो यह डिफ़ॉल्ट रूप से वापस आ सकता है, जब चरित्र डेटाबेस में मौजूद नहीं है, अन्यथा यह ValueError बढ़ा देगा।

मॉड्यूल (unicodedata.digit(chr[, default])) -

इस विधि का उपयोग दिए गए वर्ण के पूर्णांक अंक को वापस करने के लिए किया जाता है। यदि डिफ़ॉल्ट मान दिया गया है, तो यह डिफ़ॉल्ट रूप से वापस आ सकता है, जब चरित्र मौजूद नहीं है या डेटाबेस में सही तरीके से नहीं है, अन्यथा यह ValueError बढ़ा देगा।

मॉड्यूल (unicodedata.category(chr)) -

इस पद्धति का उपयोग सामान्य श्रेणी को वापस करने के लिए किया जाता है जिसे चरित्र के साथ सौंपा गया है। जैसे अक्षरों के लिए यह 'L' लौटाएगा, अपरकेस अक्षर के लिए, यह 'u' होगा, कोष्ठक खोलने के लिए, यह Ps (विराम चिह्न प्रारंभ) आदि लौटाएगा।

मॉड्यूल (unicodedata.mirrored(chr))-

इस पद्धति का उपयोग यह जांचने के लिए किया जाता है कि चरित्र में कोई प्रतिबिम्बित वर्ण है या नहीं। कुछ पात्रों में '(' और ')' आदि जैसे चरित्र प्रतिबिंबित होते हैं। जब यह प्रतिबिंबित चरित्र से मेल खाता है, तो यह 1 लौटाएगा, अन्यथा 0.

उदाहरण कोड

import unicodedata as ud
print(ud.lookup('ASTERISK'))
print(ud.lookup('Latin Capital letter G'))

#The Unicode name from the characters
print(ud.name(u'x'))
print(ud.name(u'°'))

#The Unicode character to decimal and numerics
print(ud.decimal(u'6'))
print(ud.numeric(u'9'))

#The Unicode character categoty
print(ud.category(u'A'))
print(ud.category(u'9'))
print(ud.category(u'[')) #Punctuation Start

#Unicode character to check whether mirrored or not
print(ud.mirrored(u'A'))
print(ud.mirrored(u'<'))

आउटपुट

*
G
LATIN SMALL LETTER X
DEGREE SIGN
6
9.0
Lu
Nd
Ps
0
1