Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

Python में विकिपीडिया के Infobox से पाठ प्राप्त किया जा रहा है

इस लेख में, हम बीटिफुल सूप और पायथन में अनुरोधों का उपयोग करके विकिपीडिया के इन्फोबॉक्स से पाठ को परिमार्जन करने जा रहे हैं। हम इसे 10 मिनट में कर सकते हैं। यह सीधा है।

हमें bs4 और अनुरोध स्थापित करने की आवश्यकता है। स्थापित करने के लिए नीचे दिए गए आदेशों को निष्पादित करें।

pip install bs4
pip install requests

इन्फोबॉक्स से जो टेक्स्ट हम चाहते हैं उसे लाने के लिए कोड लिखने के लिए नीचे दिए गए चरणों का पालन करें।

  • bs4 आयात करें और मॉड्यूल का अनुरोध करें।
  • उस पृष्ठ पर एक HTTP अनुरोध भेजें जिसे आप request.get() पद्धति का उपयोग करके डेटा प्राप्त करना चाहते हैं।
  • bs4.BeautifulSoup क्लास का उपयोग करके प्रतिक्रिया टेक्स्ट को पार्स करें और इसे एक वेरिएबल में स्टोर करें।
  • विकिपीडिया पृष्ठ पर जाएं और उस तत्व का निरीक्षण करें जो आप चाहते हैं।
  • bs4 द्वारा प्रदान की गई उपयुक्त विधि का उपयोग करके तत्व खोजें।

आइए नीचे उदाहरण कोड देखें।

उदाहरण

# importing the module
import requests
import bs4

# URL
URL = "https://en.wikipedia.org/wiki/India"

# sending the request
response = requests.get(URL)

# parsing the response
soup = bs4.BeautifulSoup(response.text, 'html')

# Now, we have paresed HTML with us. I want to get the _motto_ from the wikipedia page.
# Elements structure
# table - class="infobox"
# 3rd tr to get motto

# getting infobox
infobox = soup.find('table', {'class': 'infobox'})

# getting 3rd row element tr
third_tr = infobox.find_all('tr')[2]

# from third_tr we have to find first 'a' element and 'div' element to get required data
first_a = third_tr.div.find('a')
div = third_tr.div.div

# motto
motto = f"{first_a.text} {div.text[:len(div.text) - 3]}"

# printing the motto
print(motto)

यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

आउटपुट

Satyameva Jayate "Truth Alone Triumphs"

निष्कर्ष

आप विकिपीडिया पृष्ठ में तत्व का निरीक्षण करके और उसे ढूंढकर अपनी इच्छानुसार कोई भी डेटा प्राप्त कर सकते हैं। यदि आपके पास ट्यूटोरियल के संबंध में कोई प्रश्न हैं, तो उनका उल्लेख टिप्पणी अनुभाग में करें।


  1. मैं पायथन में कीबोर्ड से कॉपी किए गए टेक्स्ट को कैसे पेस्ट करूं?

    पायथन कई अंतर्निहित पुस्तकालय और मॉड्यूल प्रदान करता है जो विभिन्न पायथन अनुप्रयोगों को विकसित करने में अतिरिक्त सुविधाओं को लागू करने का एक तरीका प्रदान करता है। पाइपरक्लिप किसी भी पायथन एप्लिकेशन में कॉपी और पेस्ट ऑपरेशन को लागू करने के लिए क्रॉस-प्लेटफ़ॉर्म पायथन मॉड्यूल में से एक है। इसे पायथन ए

  1. पायथन में किसी लेबल से टेक्स्ट कैसे निकालें?

    Tkinter एक पायथन लाइब्रेरी है जिसका उपयोग GUI- आधारित एप्लिकेशन बनाने और विकसित करने के लिए किया जाता है। इस लेख में, हम देखेंगे कि किसी लेबल से टेक्स्ट को कैसे हटाया जाए, जिसमें कुछ टेक्स्ट होगा। किसी लेबल से टेक्स्ट हटाने के लिए, हम एक संबद्ध बटन बनाएंगे जो लेबल के लिए ट्रिगर के रूप में कार्य करे

  1. पायथन में विकिपीडिया डेटा कैसे निकालें?

    इस लेख में, हम देखेंगे कि पायथन का उपयोग करके विकिपीडिया डेटा कैसे निकाला जाता है। वेबसाइटों से मेटा जानकारी प्राप्त करने के लिए वेब स्क्रैपर्स बनाने के लिए पायथन का व्यापक रूप से उपयोग किया जाता है। इस लेख के लिए, हम विकिपीडिया स्रोत यूआरएल से डेटा प्राप्त करने के लिए विकिपीडिया एपीआई और पुस्तकालय