Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन के साथ माइक्रोसॉफ्ट वर्ड कैसे पढ़ें?

परिचय...

कोई अपराध नहीं, मुझे Microsoft शब्द पसंद नहीं है और न ही स्प्रेडशीट। डेटा इंजीनियरिंग विशेषज्ञ होने के नाते, मुझे अक्सर Microsoft Word में परीक्षकों से परीक्षा परिणाम प्राप्त होते हैं। साँस! वे स्क्रीन शॉट्स, लिंक, बड़े, बहुत बड़े, बहुत बड़े पैराग्राफ को कैप्चर करने से लेकर वर्ड डॉक्यूमेंट में इतनी सारी जानकारी डालते हैं। माइक्रोसॉफ्ट वर्ड में साधारण टेक्स्ट दस्तावेज़ या छोटी जानकारी को बड़े, धीमे, गंदे-से-खुले जानवरों में बदलने के लिए विशेष प्रतिभा थी जो अक्सर मशीन से मशीन में स्वरूपण खो देते हैं।

लेकिन, मुझे इस तथ्य को स्वीकार करने की आवश्यकता है कि जो मेरे लिए बुरा है वह दूसरों के लिए बहुत अच्छा है और इसके विपरीत।

संदर्भ में वापस, शब्द के लिए पायथन समर्थन बहुत अच्छा नहीं है। पायथन-डॉक्क्स पुस्तकालय उपयोगकर्ताओं को दस्तावेज़ बनाने और फ़ाइल के आकार और शीर्षक जैसे मूल फ़ाइल डेटा को पढ़ने की क्षमता देता है, वास्तविक सामग्री नहीं। इसलिए, मेरे लिए परीक्षण परिणामों को संसाधित करने के लिए कस्टम कोड के साथ आना होगा।

मैं इंटरनेट पर उपलब्ध एक नमूना शब्द दस्तावेज़ आयात करूंगा। फ़ाइल स्थान पर है - https://file-examples-com.github.io/uploads/2017/02/file-sample_100kB.docx।

इसे कैसे करें...

1. आइए आयात से शुरू करें।

from zipfile import ZipFile
from urllib.request import urlopen
from io import BytesIO

2.अब हम एक दूरस्थ Word दस्तावेज़ को बाइनरी फ़ाइल ऑब्जेक्ट के रूप में पढ़ेंगे। फिर हम ज़िपफाइल लाइब्रेरी का उपयोग करके इसे अनज़िप करते हैं, और फिर अनज़िप की गई फ़ाइल को पढ़ते हैं, जो कि XML है।

बेशक, हम सामग्री को प्रिंट करेंगे।

file_url = 'https://file-examples-com.github.io/uploads/2017/02/file-sample_100kB.docx'

# read the word document
wordDocx = urlopen(file_url).read()
wordDocx = BytesIO(wordDocx)
document = ZipFile(wordDocx)

#get the xml content
xml_content = document.read('word/document.xml')

# print the xml content
print(xml_content.decode('utf-8'))



Lorem ipsum 



Lorem ipsum dolor बैठो आमेट, कंसेक्टूर एडिपिसिसिंग एलीट। ननक एसी फौसीबस ओडियो। 



 Vestibulum neque Massa, scelerisque Sit amet ligula eu, congue molestie mi. प्रेज़ेंट यूट वेरियस सेम। नुलम और पोर्टीटर आर्कू, नेक लैकिनिया निसी। Ut ac dolor vitae odio interdum condimentum। विवामस डैपिबस सोडालेस एक्स, विटे मेसुआडा इप्सम कर्सस कॉन्वलिस। मेकेनास सेड एजेस्टस नाला, एसी कॉन्डिमेंटम ओरसी। Mauris diam felis, vulputate ac suscipit et, iaculis non est. Curabitur semper arcu ac ligula semper, nec luctus nisl blandit. इंटीजर लैसिनिया एंटे एसी लिबरो लोबोर्टिस इम्परडाइट। Nullam mollis convallis ipsum, ac accumsan nunc व्हीकल विटे। नुल्ला एगेट जस्टो इन फेलिस ट्रिस्टिक फ्रिंजिला। मोरबी सिट एमेट टॉर्चर क्विस रिसस ऑक्टर कॉन्डिमेंटम। उलमकॉर्पर एलीट में मोरबी। Nulla iaculis टेलुस सिट एमेट मौरिस टेम्पस फ्रिंजिला।

   Maecenas mouris lectus, lobortis et purus mattis, blandit dictum teleus.

 Maecenas non lorem quistellus placerat varius. 

Null facilisi. 

ऐनियन कॉन्ग्यू फ्रिंजिला जस्टो यूट एलिकम। 

Mauris id ex इरेट। Nunc vulputate neque vitae Justo facilisis, non condimentum ante sagittis. 

मोरबी विवरा सेम्पर लोरेम नेक मोलेस्टी। 

Maecenas Tincidunt est efficitur ligula euismod, सिट amet ornare est vulputate.

 

 

 



  



 

 w:val='both'/> 

  

 गैर मौरिस जस्टो में। डुइस वेहिकुला मील वेल मील प्रीटियम, एक विवरा इरेट एफिसिटुर। क्रैस एलिकम इस्ट एसी एरोस वेरियस, आईडी इयाकुलिस डुई ऑक्टर। डुइस प्रीटियम नेक लिगुला, एट पुल्विनर मील प्लेसरेट एट। नुल्ला नेक ननक सिट एमेट नन पोसुरे वेस्टिबुलम। यूटी आईडी नेक एगेट टॉर्चर मैटिस ट्रिस्टिक। डोनेक एंटे एस्ट, ब्लैंडिट सिट एमेट ट्रिस्टिक वेल, लैकिनिया पुल्विनार आर्कू। पेलेंटेस्क स्केलेरिस्क फेरमेंटम एरेट, आईडी पॉसुरे जस्टो पुल्विनर यूटी। क्रैस आईडी एरोस सेड एनिम एलिकम लोबोर्टिस। सेड लोबोर्टिस निस्ल यूट एरोस एफिसिटुर टिनसीडंट। क्रैस जस्टो मील, पोर्टिटर क्विस मैटिस वेल, अल्ट्रीसिस यूट पुरुस। यूट फैसिलिसिस एट लैकस ईयू कर्सस।

  Eleifend velit vitae libero sollicitudin euismod. फ्यूस विटे वेस्टिबुलम वेलिट। पेलेंटेस्क वल्पुटेट लेक्टस क्विस पेलेंटेस्क कमोडो। अलिकम इरेट वोल्पत। एजेस्टास वेलिट में वेस्टिबुलम। पेलेंटेस्क फेरमेंटम निस्ल विटे फ्रिंजिला वेनेनाटिस। इतियाम आईडी मौरिस विटे ओरसी मैक्सिमस अल्ट्रीसीज। 



 C रास फ्रिंजिला इप्सम मैग्ना, फ्रिंजिला डुई कमोडो ए.

 
 
 

 Lorem ipsum
 
Lorem ipsum
 <डब्ल्यू:बाएं डब्ल्यू:वैल ='सिंगल' डब्ल्यू:एसजेड ='2' डब्ल्यू:स्पेस ='0' w:color='000001'/>
Lorem ipsum

1

 

            
  1. पायथन ओपनसीवी में एक छवि कैसे पढ़ा जाए?

    पायथन ओपनसीवी में एक छवि को पढ़ने के लिए, हम निम्नलिखित कदम उठा सकते हैं - फ़ाइल से छवि लोड करें। छवि को निर्दिष्ट विंडो में प्रदर्शित करें। दबाई गई कुंजी की प्रतीक्षा करें। सभी HighGUI विंडो को नष्ट कर दें। उदाहरण import cv2 img = cv2.imread("baseball.png", cv2.IMREAD_COLOR) cv2.imshow(

  1. माइक्रोसॉफ्ट वर्ड पैराग्राफ कैसे बनाएं और पायथन में इमेज कैसे डालें?

    परिचय... डेटा इंजीनियरिंग विशेषज्ञ होने के नाते, मुझे अक्सर Microsoft Word में परीक्षकों से परीक्षा परिणाम प्राप्त होते हैं। साँस! वे स्क्रीन शॉट्स और बहुत बड़े पैराग्राफ कैप्चर करने से लेकर वर्ड डॉक्यूमेंट में इतनी सारी जानकारी डालते हैं। दूसरे दिन, मुझे परीक्षण टीम द्वारा टूल जेनरेट किए गए टेक्स

  1. Microsoft Word के साथ व्याकरण का निःशुल्क उपयोग कैसे करें

    अधिकांश कार्यालय नौकरियों के लिए, व्याकरण कौशल बहुत महत्वपूर्ण हैं क्योंकि वे उस सामग्री को बनाते हैं जिसे आप आसानी से पढ़ सकते हैं और समझ सकते हैं। लेकिन यह सुनिश्चित करना कि आपके द्वारा बनाई गई प्रत्येक रिपोर्ट या सामग्री के साथ आपका व्याकरण शीर्ष पर है और वास्तव में आपकी उत्पादकता को नुकसान पहुंच