ऐसे बहुत से तरीके हैं जिनसे आप वेब से संसाधन डाउनलोड कर सकते हैं। अपने ब्राउज़र के अलावा, जब आप कुछ और करते हैं तो आप वेब से संसाधन डाउनलोड करने के लिए wget जैसे टूल का भी उपयोग कर सकते हैं। इस लेख में, हम आपको मैक पर wget को डाउनलोड और उपयोग करने का तरीका दिखाते हैं।
wget क्या है (और इसका उपयोग किस लिए किया जाता है)?
अनजान लोगों के लिए, wget एक ओपन-सोर्स गैर-इंटरैक्टिव कमांड-लाइन उपयोगिता है जो आपको एक निर्दिष्ट URL से संसाधन डाउनलोड करने में मदद करती है। क्योंकि यह गैर-संवादात्मक है, wget पृष्ठभूमि में या आपके लॉग इन करने से पहले भी काम कर सकता है।
यह GNU टीम का एक प्रोजेक्ट है, और यदि आपके पास खराब इंटरनेट कनेक्शन है तो यह बहुत अच्छा है। इसका मतलब है कि यह अन्यथा गैर-इष्टतम स्थितियों में मजबूत है।
एक बार जब आप wget इंस्टॉल कर लेते हैं, तो आप कमांड चलाएंगे और अपनी फाइलों के लिए एक गंतव्य निर्दिष्ट करेंगे। आगे हम आपको बताएंगे कि यह कैसे करना है।
मैक पर wget कैसे इंस्टॉल करें
इससे पहले कि आप wget इंस्टॉल करें, आपको पैकेज मैनेजर की जरूरत है। जबकि wget macOS के साथ शिप नहीं करता है, आप Homebrew का उपयोग करके इसे डाउनलोड और इंस्टॉल कर सकते हैं - उपलब्ध सर्वोत्तम मैक पैकेज मैनेजर।
<एच3>1. Homebrew डाउनलोड और इंस्टॉल करेंHomebrew स्थापित करने के लिए, पहले एक टर्मिनल विंडो खोलें और निम्न कमांड निष्पादित करें:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
यह curl
. का उपयोग करता है मैकोज़ पर पहले से स्थापित रूबी इंस्टॉलेशन के भीतर शिप करने वाली फ़ाइलों को डाउनलोड करने का आदेश।
एक बार जब आप Enter दबाते हैं कमांड चलाने के लिए, इंस्टॉलर आपको स्पष्ट विवरण देगा कि क्या होगा।
आपके द्वारा पुष्टि करने के बाद, इंस्टॉलर चलेगा।
2. कमांड लाइन से wget इंस्टॉल करें
अगला, हम wget को स्थापित करने के लिए Homebrew का उपयोग करना चाहते हैं। टर्मिनल से फिर से दौड़ें:
brew install wget
इंस्टॉलर आपको लाइव प्रगति अपडेट देगा, और आपको यहां बहुत कम करने की आवश्यकता है। प्रक्रिया सीधी और स्वचालित है। हालांकि, अगर आपके पास पहले से Homebrew स्थापित है, तो brew update
run चलाना सुनिश्चित करें अपने सभी सूत्रों की नवीनतम प्रतियां प्राप्त करने के लिए।
एक बार जब आप अपने टर्मिनल में एक नया संकेत देखते हैं, तो आप संसाधनों को डाउनलोड करने के लिए मैक पर wget का उपयोग करने के लिए तैयार हैं।
वेब संसाधन डाउनलोड करने के लिए wget का उपयोग कैसे करें
wget का उपयोग करके URL से दूरस्थ संसाधन डाउनलोड करने के लिए, आप निम्न संरचना का उपयोग करना चाहेंगे:
wget -O path/to/local.copy https://example.com/url/to/download.html
यह URL में निर्दिष्ट फ़ाइल को आपकी मशीन पर निर्दिष्ट स्थान पर सहेज लेगा।
यदि आप -O
. को हटा देते हैं "ध्वज," आपका डाउनलोड स्थान वर्तमान कार्यशील निर्देशिका होगा।
उदाहरण के लिए, हम डाउनलोड फ़ोल्डर में एक वेबपेज डाउनलोड करना चाहते हैं:
wget -O /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html
हालांकि, -O
. के बिना भी ऐसा करने के लिए ध्वज, हमें निर्देशिका को बदलने की आवश्यकता होगी (cd downloads
) wget चलाने से पहले:
wget /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html
आपको डाउनलोड की प्रगति के बारे में पूरी जानकारी मिल जाएगी, हालांकि, कितनी जल्दी wget है, यह जानकारी रीयल-टाइम अपडेट के बजाय डाउनलोड के सारांश के समान है।
पुनरावर्ती निर्देशिका कैसे डाउनलोड करें
wget के साथ एक संपूर्ण निर्देशिका ट्री डाउनलोड करने के लिए, आपको -r
. का उपयोग करने की आवश्यकता है /--recursive
और -np
/--no-parent
झंडे:
wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/
यह निर्दिष्ट निर्देशिका के भीतर दस्तावेज़ों पर पाए गए किसी भी लिंक का अनुसरण करने का कारण बनेगा। वहां से यह संपूर्ण निर्दिष्ट URL पथ का पुनरावर्ती डाउनलोड करेगा।
साथ ही, -e robots=off
पर भी ध्यान दें आज्ञा। यह robots.txt फ़ाइल में प्रतिबंधों की उपेक्षा करता है। सामान्य तौर पर, संक्षिप्त डाउनलोड को रोकने के लिए robots.txt को अक्षम करना एक अच्छा विचार है।
wget के साथ अतिरिक्त फ़्लैग का उपयोग करना
आप पाएंगे कि wget एक लचीला उपकरण है, क्योंकि यह कई अन्य अतिरिक्त झंडों का उपयोग करता है। यह बहुत अच्छा है यदि आपके पास अपने डाउनलोड के लिए विशिष्ट आवश्यकताएं हैं।
आइए डाउनलोड प्रक्रिया को नियंत्रित करने और लॉग बनाने पर ध्यान केंद्रित करने वाले दो क्षेत्रों पर एक नज़र डालें।
नियंत्रित करें कि wget संसाधनों को कैसे डाउनलोड करेगा
डाउनलोड प्रक्रिया को सेट करने में आपकी मदद करने के लिए कई फ़्लैग हैं। यहाँ कुछ सबसे उपयोगी हैं:
wget -X /absolute/path/to/directory
दूरस्थ सर्वर पर एक विशिष्ट निर्देशिका को बाहर कर देगा।wget -nH
"होस्टनाम" निर्देशिकाओं को हटा देता है। दूसरे शब्दों में, यह प्राथमिक डोमेन नाम को छोड़ देता है। उदाहरण के लिए, wgetwww.w3.org
को छोड़ देगा पिछले उदाहरण में फ़ोल्डर औरHistory
. से शुरू करें इसके बजाय निर्देशिका।wget --cut-dirs=#
फ़ाइलों को डाउनलोड करना शुरू करने से पहले यूआरएल के नीचे निर्देशिकाओं की निर्दिष्ट संख्या को छोड़ देता है। उदाहरण के लिए,-nH --cut-dirs=1
"ftp.xemacs.org/pub/xemacs/" के निर्दिष्ट पथ को केवल "/xemacs/" में बदल देगा और स्थानीय डाउनलोड में खाली पैरेंट निर्देशिकाओं की संख्या को कम कर देगा।wget -R index.html
/wget --reject index.html
निर्दिष्ट फ़ाइल नाम से मेल खाने वाली किसी भी फाइल को छोड़ देगा। इस मामले में, यह सभी अनुक्रमणिका फ़ाइलों को बाहर कर देगा। तारांकन (*) एक वाइल्डकार्ड है, जैसे "*.png"। यह पीएनजी एक्सटेंशन वाली सभी फाइलों को छोड़ देगा।wget -i file
इनपुट फ़ाइल से लक्ष्य URL निर्दिष्ट करता है। यह इनपुट फ़ाइल HTML प्रारूप में होनी चाहिए, या आपको--force-html
का उपयोग करना होगा HTML को पार्स करने के लिए फ़्लैग करें.wget -nc
/wget --no-clobber
गंतव्य में पहले से मौजूद फ़ाइलों को अधिलेखित नहीं करेगा।wget -c
/wget --continue
आंशिक रूप से डाउनलोड की गई फ़ाइलों का डाउनलोड जारी रहेगा।wget -t 10
विफल होने से पहले संसाधन को 10 बार तक डाउनलोड करने का प्रयास करेगा।
wget डाउनलोड प्रक्रिया को नियंत्रित करने के अलावा और भी बहुत कुछ कर सकता है, क्योंकि आप भविष्य के संदर्भ के लिए लॉग भी बना सकते हैं।
लॉगिंग के स्तर को समायोजित करें
आप निम्न झंडे को wget का उपयोग करते समय प्राप्त होने वाले आउटपुट को नियंत्रित करने के आंशिक तरीके के रूप में भी मान सकते हैं।
wget -d
डिबगिंग आउटपुट सक्षम करता है।wget -o path/to/log.txt
लॉग-इन मानक आउटपुट प्रदर्शित करने के बजाय निर्दिष्ट निर्देशिका में लॉगिंग आउटपुट सक्षम करता है।wget -q
त्रुटि संदेशों सहित सभी wget के आउटपुट को बंद कर देता है।wget -v
वर्बोज़ आउटपुट के wget के डिफ़ॉल्ट को स्पष्ट रूप से सक्षम करता है।wget --no-verbose
लॉग संदेश बंद कर देता है लेकिन त्रुटि संदेश प्रदर्शित करता है।
आप अक्सर जानना चाहेंगे कि डाउनलोड के दौरान क्या हो रहा है, इसलिए हो सकता है कि आप इन झंडों का अन्य लोगों की तरह उपयोग न करें। फिर भी, यदि आपके पास डाउनलोड का एक बड़ा बैच है और यह सुनिश्चित करना चाहते हैं कि आप किसी भी समस्या को ठीक कर सकते हैं, तो लॉग या आउटपुट की कमी एक मान्य दृष्टिकोण है।
निष्कर्ष
जब आप वेब पेज और अन्य संसाधनों को डाउनलोड करने के लिए अपने ब्राउज़र या किसी अन्य GUI का उपयोग कर सकते हैं, तो आप कमांड लाइन के साथ समय बचा सकते हैं। wget जैसा टूल शक्तिशाली है - आपके ब्राउज़र से कहीं अधिक - और तेज़ भी है। wget की क्षमताओं के पूर्ण विवरण के लिए, आप wget के GNU मैन पेज की समीक्षा कर सकते हैं।
यदि आप पाते हैं कि wget आपके लिए काम नहीं कर रहा है, तो यह आपके वाई-फाई कनेक्शन की समस्या का निदान करने का समय हो सकता है। क्या आप वेब संसाधनों को डाउनलोड करने के लिए मैक पर wget का उपयोग करेंगे? अपने विचार नीचे टिप्पणी अनुभाग में साझा करें!