Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

ब्यूटीफुल सूप का उपयोग करके वेबपेज से शीर्षक कैसे निकाले जा सकते हैं?


BeautifulSoup एक थर्ड पार्टी पायथन लाइब्रेरी है जिसका उपयोग वेब पेजों से डेटा को पार्स करने के लिए किया जाता है। यह प्राकृतिक भाषा प्रसंस्करण अनुप्रयोगों में डेवलपर्स की मदद करता है, डेटा का विश्लेषण करने में मदद करता है, और इससे अर्थ अंतर्दृष्टि निकालने में मदद करता है।

नेचुरल लैंग्वेज प्रोसेसिंग, या एनएलपी मशीन लर्निंग का एक हिस्सा है जो टेक्स्ट डेटा और इसे मशीन लर्निंग की समस्या के इनपुट के रूप में आपूर्ति करने के लिए प्री-प्रोसेसिंग के तरीकों से संबंधित है।

वेब स्क्रैपिंग का उपयोग अनुसंधान उद्देश्यों के लिए डेटा निकालने, बाजार के रुझानों को समझने/तुलना करने, एसईओ निगरानी करने आदि के लिए भी किया जा सकता है।

विंडोज़ पर ब्यूटीफुल सूप इंस्टाल करने के लिए नीचे की लाइन चलाई जा सकती है -

pip install beautifulsoup4

निम्नलिखित एक उदाहरण है -

उदाहरण

from bs4 import BeautifulSoup
import requests
url = "https://en.wikipedia.org/wiki/Algorithm"
req = requests.get(url)
soup = BeautifulSoup(req.text, "html.parser")
print("The titles are :")
print(soup.title)

आउटपुट

The titles are :
<title>Algorithm − Wikipedia

स्पष्टीकरण

  • आवश्यक पैकेज आयात किए जाते हैं, और उपनामित होते हैं।

  • वेबसाइट परिभाषित है।

  • url खोला गया है, और इससे डेटा पढ़ा जाता है।

  • वेबपेज से टेक्स्ट निकालने के लिए 'ब्यूटीफुल सूप' फ़ंक्शन का उपयोग किया जाता है।

  • शीर्षक 'शीर्षक' विशेषता का उपयोग करके निकाले जाते हैं।

  • शीर्षक कंसोल पर मुद्रित होते हैं।


  1. पायथन में 'सीबॉर्न' लाइब्रेरी का उपयोग करके डेटा को नेत्रहीन रूप से कैसे दर्शाया जा सकता है?

    मशीन लर्निंग डेटा से मॉडल बनाने और पहले कभी नहीं देखे गए डेटा पर सामान्यीकरण करने से संबंधित है। मशीन लर्निंग मॉडल को इनपुट के रूप में प्रदान किया गया डेटा ऐसा होना चाहिए कि इसे सिस्टम द्वारा ठीक से समझा जाए, ताकि यह डेटा की व्याख्या कर सके और परिणाम उत्पन्न कर सके। सीबॉर्न एक पुस्तकालय है जो डेटा

  1. Android पर मोबाइल डेटा का उपयोग करने से ऐप्स को कैसे रोकें

    मोबाइल डेटा एक अनमोल संसाधन है। यह हमारे कई फ़ोन अनुबंधों का एक हिस्सा है जो अभी भी सीमाओं के अधीन है और यदि हम इसकी निगरानी नहीं करते हैं और इसे नियंत्रण में रखते हैं तो यह बहुत महंगा हो सकता है। हमारे मोबाइल डेटा पर नियंत्रण रखने का एक महत्वपूर्ण तरीका यह है कि प्रत्येक ऐप कितना डेटा उपयोग कर रहा

  1. मैं अपने डेटा का बैकअप कैसे ले सकता हूं?

    आज की आईटी दुनिया में एक व्यापक बैकअप रणनीति होना आवश्यक है। डेटा खो जाने के कई तरीकों के साथ, यह समझना महत्वपूर्ण है कि अपने डेटा का सफलतापूर्वक बैकअप कैसे लिया जाए ताकि यह सुनिश्चित हो सके कि आपको असहज स्थिति का सामना न करना पड़े। तो, आप अपने डेटा का बैकअप कैसे ले सकते हैं? डेटा हानि साइबर हमले,