स्पासी सर्वश्रेष्ठ टेक्स्ट एनालिसिस लाइब्रेरी में से एक है। स्पासी बड़े पैमाने पर सूचना निष्कर्षण कार्यों में उत्कृष्टता प्राप्त करता है और दुनिया में सबसे तेज में से एक है। यह गहन शिक्षण के लिए पाठ तैयार करने का सबसे अच्छा तरीका भी है। स्पासी एनएलटीकेटैगर और टेक्स्टब्लॉब की तुलना में बहुत तेज और सटीक है।
कैसे स्थापित करें?
pip install spacy python -m spacy download en_core_web_sm
उदाहरण
#importing loading the library import spacy # python -m spacy download en_core_web_sm nlp = spacy.load("en_core_web_sm") #POS-TAGGING # Process whole documents text = ("""My name is Vishesh. I love to work on data science problems. Please check out my github profile!""") doc = nlp(text) # Token and Tag for token in doc: print(token, token.pos_) # You want list of Verb tokens print("Verbs:", [token.text for token in doc if token.pos_ == "VERB"]) #Lemmatization : It is a process of grouping together the inflected #forms of a word so they can be analyzed as a single item, #identified by the word’s lemma, or dictionary form. import spacy # Load English tokenizer, tagger, # parser, NER and word vectors nlp = spacy.load("en_core_web_sm") # Process whole documents text = ("""My name is Vishesh. I love to work on data science problems. Please check out my github profile!""") doc = nlp(text) for token in doc: print(token, token.lemma_)