Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> HTML

पायथन में HTML टेबल्स डेटा को CSV में कैसे सेव करें

<घंटा/>

समस्या:

डेटा वैज्ञानिक के लिए सबसे चुनौतीपूर्ण कार्यों में से एक डेटा एकत्र करना है। जबकि तथ्य यह है कि वेब में बहुत सारे डेटा उपलब्ध हैं, यह केवल स्वचालन के माध्यम से डेटा निकाल रहा है।

परिचय..

मैं मूल संचालन डेटा निकालना चाहता था जो कि https://www.tutorialspoint.com/python/python_basic_operators.htm से HTML तालिकाओं में एम्बेडेड है।

हम्म, डेटा कई HTML तालिकाओं में बिखरा हुआ है, यदि केवल एक HTML तालिका है, तो जाहिर है कि मैं .csv फ़ाइल में कॉपी और पेस्ट का उपयोग कर सकता हूं।

हालांकि, अगर एक ही पेज में 5 से ज्यादा टेबल हैं तो जाहिर तौर पर यह दर्द है। है ना?

इसे कैसे करें..

1.यदि आप एक csv फ़ाइल बनाना चाहते हैं तो मैं आपको शीघ्रता से दिखाऊंगा कि कैसे आसानी से एक csv फ़ाइल बनाई जा सकती है।

<पूर्व>आयात csv# फ़ाइल को राइट मोड में खोलें, यदि नहीं मिली तो यह oneFile =open('test.csv', 'w+')Data =csv.writer(File)# My HeaderData.writerow(('Column1') बनाएगी , 'कॉलम 2', 'कॉलम 3'))# रेंज में मैं के लिए डेटा लिखें(20):डेटा.राइटरो((i, i+1, i+2))# मेरी फाइल को बंद करेंफाइल.क्लोज()

आउटपुट

निष्पादित होने पर उपरोक्त कोड इस कोड के समान निर्देशिका में एक test.csv फ़ाइल उत्पन्न करता है।

पायथन में HTML टेबल्स डेटा को CSV में कैसे सेव करें

2. अब हम https://www.tutorialspoint.com/python/python_dictionary.htm से एक HTML तालिका प्राप्त करते हैं और इसे CSV फ़ाइल के रूप में लिखते हैं।

पहला कदम आयात करना है।

<पूर्व> urllib से csv आयात करें।
  • HTML फ़ाइल खोलें और urlopen का उपयोग करके इसे html ऑब्जेक्ट में संग्रहीत करें।

आउटपुट

html =urlopen(url)soup =BeautifulSoup(html, 'html.parser')
  • एचटीएमएल टेबल के अंदर टेबल ढूंढें और टेबल डेटा लाएं। प्रदर्शन के उद्देश्य से मैं केवल पहली तालिका निकाल रहा हूँ [0]

आउटपुट

टेबल =सूप.find_all('table')[0]rows =table.find_all('tr')

आउटपुट

<पूर्व>प्रिंट (पंक्तियां)

आउटपुट

[Sr.No.Function विवरण के साथ, 1cmp(dict1, dict2)

दोनों dict के तत्वों की तुलना करता है।

, 2len(dict)

शब्दकोश की कुल लंबाई देता है। यह शब्दकोश में मदों की संख्या के बराबर होगा।

, 3str(dict)

एक शब्दकोश का प्रिंट करने योग्य स्ट्रिंग प्रतिनिधित्व तैयार करता है

, 4type(variable)

पारित चर का प्रकार देता है। यदि पारित चर शब्दकोश है, तो यह एक शब्दकोश प्रकार लौटाएगा।

]

5.अब हम डेटा को csv फ़ाइल में लिखेंगे।

उदाहरण

फ़ाइल =open('my_html_data_to_csv.csv', 'wt+')Data =csv.writer(File)try:पंक्तियों में पंक्ति के लिए:FilteredRow =[] पंक्ति में सेल के लिए।find_all(['td', 'th ']):FilteredRow.append(cell.get_text())Data.writerow(FilteredRow)आखिरकार:File.close()

6.परिणाम अब my_html_data_to_csv.csv फ़ाइल में सहेजे गए हैं।

उदाहरण

हम ऊपर बताई गई हर चीज़ को एक साथ रखेंगे।

उदाहरण

<पूर्व> urllib से csv आयात करें। ) सूप =ब्यूटीफुल सूप (एचटीएमएल, 'एचटीएमएल.पार्सर')# पहले टैबलेट को एक्सट्रेक्ट करें =सूप.फाइंड_ऑल ('टेबल')[0] रो =टेबल.फाइंड_ऑल ('टीआर')# फाइल में कंटेंट लिखेंफाइल =ओपन 'my_html_data_to_csv.csv', 'wt+')डेटा =csv.writer(फ़ाइल)कोशिश करें:पंक्तियों में पंक्ति के लिए:FilteredRow =[]पंक्ति में सेल के लिए।find_all(['td', 'th']):FilteredRow.append (cell.get_text())Data.writerow(FilteredRow)आखिरकार:File.close()

एचटीएमएल पेज में टेबल।

पायथन में HTML टेबल्स डेटा को CSV में कैसे सेव करें


  1. JSON को एक्सेल CSV फ़ाइल में कैसे बदलें

    संभावना है कि आपने JSON . के बारे में सुना हो फ़ाइल, और हो सकता है कि अभी हाल ही में किसी ने आपको इनमें से एक फ़ाइल भेजी हो। अब, JSON फ़ाइल खोलना कठिन नहीं है, हालांकि, इसे Microsoft Excel में कनवर्ट करना अधिक समझदारी होगी (सीएसवी) प्रारूप आसान उपयोग के लिए। सवाल यह है कि कोई JSON फाइल को एक्सेल में

  1. टेक्स्ट (TXT/CSV) फाइल को एक्सेल फाइल में कैसे बदलें

    यदि आपके पास टेक्स्ट फ़ाइल में आइटम्स की सूची है और आप टेक्स्ट फ़ाइल से डेटा को Microsoft Excel में आयात करना चाहते हैं , आप उन्हें मैन्युअल रूप से लिखे बिना ऐसा कर सकते हैं। एक्सेल में एक विकल्प है जो उपयोगकर्ताओं को .txt फ़ाइल से सभी टेक्स्ट को स्प्रेडशीट में आयात करने की अनुमति देता है ताकि उपयोग

  1. एक्सेल फाइल को सीएसवी के रूप में कॉमा के साथ कैसे सेव करें (3 उपयुक्त तरीके)

    एक अल्पविराम द्वारा अलग किए गए मान (सीएसवी ) फ़ाइल अल्पविराम के साथ एक सीमांकित पाठ फ़ाइल है। यह विभिन्न प्रकार के डेटा विश्लेषण के दौरान काम आता है। कभी-कभी आपको Excel . को सहेजना पड़ सकता है फ़ाइल को CSV . के रूप में दर्ज करें आगे उपयोग के लिए फ़ाइल। इस लेख में Excel save को बचाने के लिए 3 उपयु