BeautifulSoup एक पायथन लाइब्रेरी है जो HTML और XML फाइलों से डेटा निकालती है। BeautifulSoup का उपयोग करके, हम HTML या XML दस्तावेज़ों में मौजूद खाली टैग को भी हटा सकते हैं और दिए गए डेटा को मानव में परिवर्तित कर सकते हैं। पठनीय फ़ाइलें।
सबसे पहले, हम कमांड का उपयोग करके अपने स्थानीय वातावरण में BeautifulSoup लाइब्रेरी स्थापित करेंगे:pip install beautifulsoup4
उदाहरण
#Import the BeautifulSoup library from bs4 import BeautifulSoup #Get the html document html_object = """ <p>Python is an interpreted, high-level and general-purpose programming language. Python's design philosophy emphasizes code readability with its notable use of significant indentation.</p> """ #Let us create the soup for the given html document soup = BeautifulSoup(html_object, "lxml") #Iterate over each line of the document and extract the data for x in soup.find_all(): if len(x.get_text(strip=True)) == 0: x.extract() print(soup)
आउटपुट
उपरोक्त कोड को चलाने से आउटपुट उत्पन्न होगा और दिए गए HTML दस्तावेज़ में खाली टैग को हटाकर मानव पठनीय कोड में परिवर्तित कर दिया जाएगा।
<html><body><p>Python is an interpreted, high−level and general−purpose programming language. Python's design philosophy emphasizes code readability with its notable use of significant indentation.</p> </body></html>