वर्डनेट पायथन की प्राकृतिक भाषा टूलकिट का एक हिस्सा है। यह English Nouns, Adjectives, Adverbs और Verbs का एक बड़ा शब्द डेटाबेस है। इन्हें संज्ञानात्मक पर्यायवाची शब्दों के समूह में बांटा गया है, जिन्हें सिंसेट . कहा जाता है ।
वर्डनेट का उपयोग करने के लिए, पहले हमें एनएलटीके मॉड्यूल स्थापित करना होगा, फिर वर्डनेट पैकेज डाउनलोड करना होगा।
$ sudo pip3 install nltk $ python3 >>> import nltk >>>nltk.download('wordnet')इंस्टाल करें
वर्डनेट में शब्दों के कुछ समूह होते हैं, जिनके अर्थ समान होते हैं।
पहले उदाहरण में, हम देखेंगे कि वर्डनेट किसी शब्द का अर्थ और अन्य विवरण कैसे लौटाता है। कभी-कभी, यदि कुछ उदाहरण उपलब्ध होते हैं, तो यह वह भी प्रदान कर सकता है।
उदाहरण कोड
from nltk.corpus import wordnet #Import wordnet from the NLTK synset = wordnet.synsets("Travel") print('Word and Type : ' + synset[0].name()) print('Synonym of Travel is: ' + synset[0].lemmas()[0].name()) print('The meaning of the word : ' + synset[0].definition()) print('Example of Travel : ' + str(synset[0].examples()))
आउटपुट
$ python3 322a.word_info.py Word and Type : travel.n.01 Synonym of Travel is: travel The meaning of the word : the act of going from one place to another Example of Travel : ['he enjoyed selling but he hated the travel'] $
पिछले उदाहरण में, हमें कुछ शब्दों के बारे में विस्तार से जानकारी मिल रही है। यहां हम देखेंगे कि वर्डनेट किसी दिए गए शब्द के समानार्थी और विलोम शब्द कैसे भेज सकता है।
उदाहरण कोड
import nltk from nltk.corpus import wordnet #Import wordnet from the NLTK syn = list() ant = list() for synset in wordnet.synsets("Worse"): for lemma in synset.lemmas(): syn.append(lemma.name()) #add the synonyms if lemma.antonyms(): #When antonyms are available, add them into the list ant.append(lemma.antonyms()[0].name()) print('Synonyms: ' + str(syn)) print('Antonyms: ' + str(ant))
आउटपुट
$ python3 322b.syn_ant.py Synonyms: ['worse', 'worse', 'worse', 'worsened', 'bad', 'bad', 'big', 'bad', 'tough', 'bad', 'spoiled', 'spoilt', 'regretful', 'sorry', 'bad', 'bad', 'uncollectible', 'bad', 'bad', 'bad', 'risky', 'high-risk', 'speculative', 'bad', 'unfit', 'unsound', 'bad', 'bad', 'bad', 'forged', 'bad', 'defective', 'worse'] Antonyms: ['better', 'better', 'good', 'unregretful'] $
एनएलटीके वर्डनेट में एक और बड़ी विशेषता है, इसका उपयोग करके हम जांच सकते हैं कि दो शब्द लगभग बराबर हैं या नहीं। यह शब्दों की एक जोड़ी से समानता अनुपात लौटाएगा।
उदाहरण कोड
import nltk from nltk.corpus import wordnet #Import wordnet from the NLTK first_word = wordnet.synset("Travel.v.01") second_word = wordnet.synset("Walk.v.01") print('Similarity: ' + str(first_word.wup_similarity(second_word))) first_word = wordnet.synset("Good.n.01") second_word = wordnet.synset("zebra.n.01") print('Similarity: ' + str(first_word.wup_similarity(second_word)))
आउटपुट
$ python3 322c.compare.py Similarity: 0.6666666666666666 Similarity: 0.09090909090909091 $