Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

किसी वेबसाइट से 'href' लिंक निकालने के लिए ब्यूटीफुल सूप का उपयोग कैसे किया जा सकता है?


BeautifulSoup एक थर्ड पार्टी पायथन लाइब्रेरी है जिसका उपयोग वेब पेजों से डेटा को पार्स करने के लिए किया जाता है। यह वेब स्क्रैपिंग में मदद करता है, जो विभिन्न संसाधनों से डेटा निकालने, उपयोग करने और हेरफेर करने की एक प्रक्रिया है।

वेब स्क्रैपिंग का उपयोग अनुसंधान उद्देश्यों के लिए डेटा निकालने, बाजार के रुझानों को समझने/तुलना करने, एसईओ निगरानी करने आदि के लिए भी किया जा सकता है।

विंडोज़ पर ब्यूटीफुल सूप इंस्टाल करने के लिए नीचे की लाइन चलाई जा सकती है -

pip install beautifulsoup4

निम्नलिखित एक उदाहरण है -

उदाहरण

from bs4 import BeautifulSoup
import requests
url = "https://en.wikipedia.org/wiki/Algorithm"
req = requests.get(url)
soup = BeautifulSoup(req.text, "html.parser")
print("The href links are :")
for link in soup.find_all('a'):
   print(link.get('href'))

आउटपुट

The href links are :
…
https://stats.wikimedia.org/#/en.wikipedia.org
https://foundation.wikimedia.org/wiki/Cookie_statement
https://wikimediafoundation.org/
https://www.mediawiki.org/

स्पष्टीकरण

  • आवश्यक पैकेज आयात किए जाते हैं, और उपनामित होते हैं।

  • वेबसाइट परिभाषित है।

  • url खोला गया है, और इससे डेटा पढ़ा जाता है।

  • वेबपेज से टेक्स्ट निकालने के लिए 'ब्यूटीफुल सूप' फ़ंक्शन का उपयोग किया जाता है।

  • वेबपेज डेटा से टेक्स्ट निकालने के लिए 'find_all' फ़ंक्शन का उपयोग किया जाता है।

  • href लिंक कंसोल पर प्रिंट होते हैं।


  1. पाइथन में सीबोर्न लाइब्रेरी में बार प्लॉट का उपयोग कैसे किया जा सकता है?

    सीबॉर्न एक पुस्तकालय है जो डेटा की कल्पना करने में मदद करता है। यह अनुकूलित थीम और उच्च स्तरीय इंटरफ़ेस के साथ आता है। पिछले प्लॉट्स में, हमने पूरे डेटासेट को ग्राफ पर प्लॉट किया था। बार प्लॉट की मदद से हम डेटा के वितरण की केंद्रीय प्रवृत्ति को समझ सकते हैं। बारप्लॉट फ़ंक्शन एक श्रेणीगत चर और एक स

  1. वेबसाइट से डेटा को एक्सेल में स्वचालित रूप से कैसे निकालें

    डेटा निकालना (डेटा संग्रह और अद्यतन) स्वचालित रूप से एक वेब पेज से आपके एक्सेल वर्कशीट में कुछ नौकरियों के लिए महत्वपूर्ण हो सकता है। एक्सेल आपको वेब पेज से डेटा एकत्र करने का अवसर देता है। यह उन लोगों के लिए सबसे अधिक उपयोग की जाने वाली एक्सेल सुविधाओं में से एक है जो अपने डेटा विश्लेषण कार्य के लि

  1. किसी वेबसाइट से एक्सेल में डेटा कैसे आयात करें?

    यह सर्वविदित है कि वर्ल्ड वाइड वेब में बहुत बड़ा उपयोगी डेटा होता है। हालाँकि, हमें किसी भी प्रकार का विश्लेषण करने से पहले डेटा को Microsoft Excel में आयात करना होगा। इस प्रकार के कार्य को पूरा करने के लिए आप दो विधियों का उपयोग कर सकते हैं। वेब से मैन्युअल रूप से बाहरी डेटा प्राप्त करें मान लीजिए