Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन में एनएलटीके के साथ स्टॉप शब्द हटा रहा है


जब कंप्यूटर प्राकृतिक भाषा को संसाधित करते हैं, तो कुछ अत्यंत सामान्य शब्द जो उपयोगकर्ता की आवश्यकता से मेल खाने वाले चुनिंदा दस्तावेज़ों की मदद करने में बहुत कम मूल्य के प्रतीत होते हैं, उन्हें पूरी तरह से शब्दावली से बाहर रखा गया है। इन शब्दों को स्टॉप वर्ड्स कहा जाता है।

उदाहरण के लिए, यदि आप इनपुट वाक्य को −

. के रूप में देते हैं
John is a person who takes care of the people around him.

स्टॉप वर्ड रिमूवल के बाद, आपको आउटपुट मिलेगा -

['John', 'person', 'takes', 'care', 'people', 'around', '.']

NLTK के पास इन स्टॉपवर्ड्स का एक संग्रह है जिसका उपयोग हम किसी दिए गए वाक्य से इन्हें हटाने के लिए कर सकते हैं। यह NLTK.corpus मॉड्यूल के अंदर है। हम इसका उपयोग वाक्य से स्टॉप शब्दों को फ़िल्टर करने के लिए कर सकते हैं। उदाहरण के लिए,

उदाहरण

from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

my_sent = "John is a person who takes care of people around him."
tokens = word_tokenize(my_sent)

filtered_sentence = [w for w in tokens if not w in stopwords.words()]

print(filtered_sentence)

आउटपुट

यह आउटपुट देगा -

['John', 'person', 'takes', 'care', 'people', 'around', '.']

  1. पायथन प्रोग्राम जो एक सूची से स्वर से शुरू होने वाले शब्दों को निकालता है

    जब किसी सूची से स्वर से शुरू होने वाले शब्दों को निकालने की आवश्यकता होती है, तो एक साधारण पुनरावृत्ति, एक ध्वज मान और स्टार्टविथ विधि का उपयोग किया जाता है। नीचे उसी का एक प्रदर्शन है - उदाहरण: my_list = ["abc", "phy", "and", "okay", "educate", &qu

  1. पायथन - K दूरी में N . के साथ तत्वों को हटा दें

    जब तत्वों को हटाने की आवश्यकता होती है, जो एन के साथ के दूरी पर हैं, एक विशिष्ट स्थिति के साथ एक सूची समझ का उपयोग किया जाता है। नीचे उसी का एक प्रदर्शन है - उदाहरण my_list = [13, 52, 5, 45, 65, 61, 18 ] print("The list is :") print(my_list) K = 3 print("The value of K is ") p

  1. पायथन - PyGame के साथ चित्र प्रदर्शित करें

    Pygame गेम और मल्टीमीडिया एप्लिकेशन बनाने के लिए Python के लिए एक मल्टीमीडिया लाइब्रेरी है। इस लेख में हम देखेंगे कि pygame विंडो में इसकी ऊंचाई, चौड़ाई और स्थिति को ध्यान में रखते हुए स्क्रीन पर चित्र को पेंट करने के लिए pygame मॉड्यूल का उपयोग कैसे करें। नीचे दिए गए प्रोग्राम में हम pygame मॉड्यू