अपस्केल:स्थानीय एआई इमेज अपस्केलिंग-कोई क्लाउड की आवश्यकता नहीं
<पी> अपस्केल - एआई के साथ, स्थानीय स्तर पर, बिना किसी बादल के अपनी छवियों को बेहतर बनाएं <पी> अपडेट किया गया:6 सितंबर, 2024 <पी> आम तौर पर, मैं एआई की कई चीजों से घृणा करता हूं। इसलिए नहीं कि आर्टिफिशियल इंटेलिजेंस के विचार में स्वाभाविक रूप से कुछ भी गलत है। नहीं, जो चीज़ मुझे नापसंद है वह है एआई होने का दावा करने वाली प्रौद्योगिकियों और उत्पादों के बारे में चर्चा और प्रचार, जबकि वे, सबसे अच्छे रूप में, महिमामंडित आँकड़े हैं, विपणन बकवास की एक मोटी परत के साथ लिपटे हुए हैं। अब... मान लीजिए कि आपके पास बहुत सारी पुरानी, कम रिज़ॉल्यूशन वाली, धुंधली छवियां हैं। क्या आप उन्हें बेहतर बना सकते हैं? एआई के साथ? <पी> यदि आपने 2000 के दशक की शुरुआत से टीवी अपराध शो देखे हैं, तो आप बस चीजों को "बढ़ाते" हैं। केवल, हर बार जब आप किसी छवि को अपग्रेड करते हैं, तो जेम्स मैक्सवेल और लुडविग बोल्ट्ज़मैन अपनी कब्र में घूमते हैं, क्योंकि आप थर्मोडायनामिक्स के नियमों का उल्लंघन कर रहे हैं। एन्ट्रापी और वह। शून्य से डेटा बनाना। जादू. लेकिन वास्तव में एआई-संचालित कार्यक्रम यही वादा करते हैं। सवाल यह है कि क्या आप अपनी आत्मा को क्लाउड ओवरलोड के सामने समर्पित किए बिना एआई कर सकते हैं? आह, ऐसा लगता है जैसे आप कर सकते हैं, आख़िरकार! ऐसा ही एक टूल है अपस्केल। ओपन-सोर्स, क्रॉस-प्लेटफॉर्म, एआई इमेज एन्हांसर। शानदार लगता है. अब, आइए देखें कि क्या यह वास्तव में विज्ञापित के रूप में काम करता है। <पी>
आसान सेटअप, वास्तव में ऑफ़लाइन
<पी> किसी भी प्रकार की एआई सामग्री के लिए मेरी आवश्यकता स्थानीय सेटअप बनाने की क्षमता है। और बहुत अधिक कदम उठाए बिना. अपस्केल इन दोनों बक्सों की जाँच करता है। मैंने स्नैप स्टोर से टूल का स्नैप संस्करण डाउनलोड किया, और प्रोग्राम को कुबंटू 24.04 (लिनक्स) में स्थापित किया। कोई भी समस्या नहीं, एक सरल और त्वरित तैनाती। <पी> इसके बाद, मैंने प्रोग्राम का नेटवर्क कनेक्शन भी अक्षम कर दिया। स्नैप्स सैंडबॉक्स्ड लिनक्स एप्लिकेशन हैं, और आपके पास घोषित संसाधनों तक उनकी पहुंच को चुनिंदा रूप से सक्षम या अक्षम करने की क्षमता है। इस विशेष मामले में, अपस्केल को आपके घर (फ़ाइलों के लिए), ओपनजीएल और ऐसे (वास्तविक प्रतिपादन और प्रसंस्करण के लिए), और कई अन्य संसाधनों तक पहुंच की आवश्यकता है। नेटवर्क प्लग भी सूचीबद्ध है, और डिफ़ॉल्ट रूप से सक्षम है। यह अधिकांश स्नैप्स के लिए सत्य है, और यह कोई समस्या नहीं है। <पी> लेकिन यह देखने के लिए कि क्या अपस्केल वास्तव में 100% स्थानीय जादू कर सकता है, मैंने मैन्युअल रूप से नेटवर्क प्लग को डिस्कनेक्ट कर दिया। सभी व्यावहारिक उद्देश्यों के लिए, जहां तक प्रोग्राम का सवाल है, मेरी मशीन में किसी भी तरह का नेटवर्क नहीं है। इसके बाद, मैंने अपस्केल लॉन्च किया और इसका उपयोग कई छवियों को "ठीक" करने के लिए किया। कोई समस्या नहीं, कोई शिकायत नहीं. बहुत बढ़िया. अलग-अलग ग्राफ़िक्स कार्ड आवश्यकताएँ (वल्कन-संगत)
<पी> यदि आप अपस्केल का उपयोग करना चाहते हैं, तो आपको एक ऐसी मशीन की आवश्यकता होगी जिसमें अपेक्षाकृत आधुनिक और सक्षम असतत ग्राफिक्स कार्ड हो। अधिकांश एकीकृत जीपीयू काम नहीं करेंगे। सवाल यह है कि आधुनिक और सक्षम का वास्तव में मतलब क्या है? खैर, मेरा टेस्ट बॉक्स 2014 आइडियापैड लैपटॉप है, जिस पर मैंने हाल ही में एसएसडी अपग्रेड के बाद कुबंटू 24.04 स्थापित किया है। सिस्टम में एक पुराना एनवीडिया कार्ड है। और इसने बिल्कुल ठीक काम किया। शायद नवीनतम पीढ़ी के उपकरणों जितना तेज़ नहीं, लेकिन अपस्केल ने बिना किसी समस्या या समस्या के कार्यों को संभाला। वहां, ऐसा लगता है कि 10 साल पुराना लैपटॉप काफी अच्छा है। वास्तविक कार्य, कोई अच्छा?
<पी> अब, महत्वपूर्ण हिस्सा. क्या अपस्केल वास्तव में अच्छे परिणाम दे सकता है? इसका परीक्षण करने के लिए, मैंने कुछ पसंदीदा उम्मीदवारों की तलाश में अपने पुराने फ़ोटो के भंडार को खंगाला। मुझे तीन तस्वीरें मिलीं जिनके बारे में मुझे लगा कि प्रयोग के लिए ये अच्छे विकल्प होंगे। - एक स्की शैलेट की 1983 की तस्वीर (एक अच्छे 35 मिमी एनालॉग फिल्म कैमरे से ली गई) और बाद में एक सस्ते घरेलू उपयोग वाले स्कैनर (300 डीपीआई पर) का उपयोग करके मुद्रित फोटो को स्कैन करके डिजिटल किया गया।
- एक मानव की 2004 की तस्वीर, मिश्रित रोशनी की स्थिति में, कुछ अतिरिक्त धुंधलेपन के साथ।
- एक सोती हुई बिल्ली की 2005 की तस्वीर, साधारण 720x540px रिज़ॉल्यूशन पर, फोन चैट और मेल और न जाने क्या-क्या पर भेजी गई थी, और संभवत:रास्ते में दो या तीन बार किसी भी प्रोग्राम द्वारा उपयोग किए गए और इस तरह से संपीड़ित किया गया था।
<पी> अपस्केल में एक बहुत अच्छा, मैत्रीपूर्ण यूआई है। उपयोग करने में बहुत सुविधाजनक. बाईं ओर, आपके पास एक साइडबार है जो आपको अपनी छवियों को लोड करने देता है (बैच प्रोसेसिंग के लिए कई फाइलों सहित), एन्हांसमेंट मॉडल का चयन, स्केल और आउटपुट फ़ोल्डर। बहुत सीधा-सादा. दाईं ओर, आपको मूल फ़ोटो दिखाई देगी, और एक बार प्रसंस्करण पूरा हो जाने पर, एक लंबवत स्लाइडर भी होगा, जो आपको "पहले" और "बाद" परिणामों की जांच करने देता है। <पी>
<पी>
<पी> मैंने फ़ोटो को अपस्केल में लोड किया और प्रोग्राम चलने दिया... <पी> मेरी पुरानी 2014 मशीन पर, 2500x2500px फोटो को 4 गुना तक बढ़ाने में लगभग 7 मिनट लगते हैं। यह काफी उचित है। हालाँकि, चित्र में मॉडल को मिलने वाली जानकारी के आधार पर समय काफी भिन्न हो सकता है। दानेदारपन और प्रकाश का स्तर भी अंतिम परिणाम को प्रभावित करते हैं। यदि आप इससे भी अधिक उच्च छवि पैमाने कारक का उपयोग करते हैं, या एक मूल छवि का उपयोग करते हैं जो पहले से ही काफी बड़ी है, तो समय आसानी से 20-30 मिनट हो सकता है। हालाँकि, कुल मिलाकर, प्रदर्शन काफी अच्छा है। <पी> सोती हुई बिल्ली की छवि के साथ, परिणाम उत्कृष्ट थे। तेज़ रेंडर (10 सेकंड), ठोस सुधार। आप निश्चित रूप से अधिक विवरण देख सकते हैं। तो, हमारे पास एक फ़ाइल है जिसमें 16x अधिक पिक्सेल हैं, और फिर भी, यह अधिक स्पष्ट और तेज है। उत्तम तो नहीं, लेकिन निश्चित रूप से बढ़िया। अब, यह एक कम-रिज़ॉल्यूशन वाली छवि थी, जिसमें अच्छी रोशनी, स्पष्टता और कंट्रास्ट था। <पी>
<पी>
<पी> मैंने आगे मानव की फोटो के साथ प्रयास किया। परिणाम... तटस्थ थे। मैं वास्तव में नई छवि की गुणवत्ता में कोई सुधार नहीं देख सका। यह बड़ा था, लेकिन "त्रुटियाँ" भी थीं। यहां, हमारे पास एक बड़ी तस्वीर है, दो प्रकार की रोशनी है, (मूल) तस्वीर का बायां आधा हिस्सा दाईं ओर की तुलना में धुंधला (और गहरा) है, साथ ही उचित मात्रा में दाने भी हैं। अपस्केल यहां कुछ खास नहीं कर पाया. <पी>
<पी> स्की शैलेट के परिणाम वास्तव में मूल के उलट थे। जिस उत्पाद से मैंने शुरुआत की थी, वह महंगा उत्पाद उससे भी बदतर था। जबकि फोटो में अच्छी रोशनी है, बहुत अधिक दानेदारपन और बड़ी मात्रा में बारीक विवरण (पेड़ और घास) भी हैं। मेरा अनुमान है कि छवि के पहले से ही अत्यधिक व्यस्त हिस्से पर किसी भी प्रकार के एक्सट्रपलेशन के परिणामस्वरूप अधिक शोर होता है। मैंने बहुत से मॉडलों को आज़माया, जिनमें सबसे बेहतरीन ULTRASHARP भी शामिल है, और फिर भी इसमें कोई सुधार नहीं हुआ। <पी>
<पी>
<पी> इनमें से किसी ने भी मेरे फोटो नंबर 3 के साथ काम नहीं किया। <पी> यहां घास वाले भाग का एक ज़ूम किया हुआ भाग है। जैसा कि आप मूल (बाईं ओर) में देख सकते हैं, इसमें बहुत अधिक दाने हैं। यह पुराने एनालॉग फिल्म के उपयोग, फिल्म विकास, कुछ दशकों तक शेल्फ पर रखी गई फोटो, उसके बाद लगभग पंद्रह साल पहले एक सस्ते, ऑफ-द-शेल्फ डिजिटल स्कैनर (यद्यपि 300 डीपीआई के साथ) का उपयोग करके स्कैनिंग और अब एआई-अपस्केल्ड परिणामों का एक संयोजन है। "बेहतर" घास धुंधली है। यही बात आकाश और बालों के लिए भी लागू होती है। इस मामले में, छवि संभवतः उतनी ही तीव्र होगी जितनी हो सकती है, जब तक कि एक नया मॉडल विकसित और प्रशिक्षित न किया जा सके जो कि मूल में आपके द्वारा देखे गए विशिष्ट "डॉट" पैटर्न पर प्रशिक्षित किया जा सके। लेकिन यह किसी भी अन्य चीज़ की तुलना में अधिक शोर में कमी है, क्योंकि छवि का आकार अच्छा है (2500x2000px अधिक या कम)। <पी>
संकेत:आपको छवियों को बड़ा करने की आवश्यकता नहीं है
<पी> यहाँ एक महत्वपूर्ण अवलोकन है. आपको फ़ोटो को बड़ा करने की आवश्यकता नहीं है. आप X1 स्केलिंग फ़ैक्टर का उपयोग करके मूल आकार बनाए रख सकते हैं। एल्गोरिदम यथासंभव लुप्त जानकारी को प्रक्षेपित करने का प्रयास करेगा। यह देखने के लिए एक अच्छा, प्रथम-पास दृष्टिकोण हो सकता है कि क्या आपको कोई सुधार मिलता है। समय भी बचाता है. <पी>
समग्र परिणाम, पूर्व-निष्कर्ष, एनवीडिया प्राइम पर एक तरफ
<पी> कार्यक्रम के साथ लगभग 50 छवियों को संसाधित करने के बाद, जिसमें लोग और दृश्य दोनों शामिल हैं, मैं कई निष्कर्षों पर पहुंचा हूं। इनमें से कुछ एक आश्चर्य के रूप में आते हैं, जबकि अन्य को कार्यक्रम के FAQ में स्पष्ट रूप से उल्लिखित किया गया है। - चमत्कार की उम्मीद मत करो. आपको कुछ सुधार मिल सकते हैं, लेकिन यह वह नहीं कर सकता जो आपकी कल्पना करती है।
- अपस्केल कम दानेदारपन, अच्छी रोशनी और मध्यम मात्रा में विवरण वाली छवियों पर सबसे अच्छा काम करता है।
- यदि आपके पास पहले से ही बड़ी, हाई-रेजोल्यूशन, हाई-डीपीआई तस्वीरें हैं जो बिल्कुल खराब हैं, यानी धुंधली और शोर वाली हैं, तो अपस्केल इस काम के लिए सही उपकरण नहीं है। यह चीजों को थोड़ा सुधार सकता है, लेकिन यदि शोर कारक किसी भी मॉडल एल्गोरिदम स्मूथिंग और सन्निकटन से "बड़ा" है, तो आपको कोई सार्थक परिणाम नहीं दिखाई देगा।
- REAL-ESRGAN ULTRASHARP की तुलना में अधिक चिकनी छवियां बनाता है, इसलिए यह ऊपर उल्लिखित सीमाओं के भीतर दानेदार या अधिक धुंधली छवियों के लिए बेहतर अनुकूल है। हालाँकि, आप यहां-वहां कुछ स्पष्टता खो देंगे। हमेशा एक समझौता.
<पी> इसके अलावा, मैं लिनक्स सेटअप से काफी खुश था: - कुबंटु 24.04 के साथ शुरुआती समस्याओं के बावजूद, यह अब ठीक हो गया है और ठीक से काम करता है।
- इंस्टॉलेशन सरल था (स्नैप के माध्यम से), और उपयोग सीधा था - और वास्तव में ऑफ़लाइन।
- कार्यक्रम की मामूली आवश्यकताएं हैं - मेरा 10-वर्षीय लैपटॉप खूबसूरती से काम करता है।
- मेरा हाइब्रिड ग्राफ़िक्स सेटअप त्रुटिपूर्ण ढंग से काम कर रहा था। एनवीडिया कार्ड को PRIME ऑन-डिमांड के लिए कॉन्फ़िगर किया गया है, इसलिए यह जरूरत पड़ने पर अधिक शक्तिशाली कार्ड का उपयोग करता है, जबकि बाकी समय, बैटरी बचाने के लिए, यह एकीकृत कार्ड का उपयोग करता है। मैंने अपस्केल चलाते समय व्यवहार की जाँच की, और वास्तव में, एनवीडिया-एसएमआई एनवीडिया जीपीयू के साथ चल रहे प्रोग्राम को दिखा रहा था। अत्यधिक ताप भी नहीं.
<पी>
<पी> एनवीडिया 535 ड्राइवर, ऑन-डिमांड सेटअप, सामान्य तापमान, वास्तव में अच्छा। निष्कर्ष
<पी> अधिकांश आधुनिक कार्यक्रम मेह हैं। वास्तव में। अपस्केल इस आधुनिक सामान्यता का अपवाद है। एक बड़ा अपवाद. यह एक सुंदर, सुरुचिपूर्ण कार्यक्रम है. अच्छा जीयूआई, सरल उपयोग, सरल और साफ इंस्टॉलेशन, काम का सही मायने में ऑफ़लाइन मोड, कई मॉडल, अच्छा प्रदर्शन, जीपीयू की तुलना में मामूली आवश्यकताएं, और परिणाम जो सही नहीं तो बिल्कुल ठीक हैं। मेरी किताब में, यह वास्तव में एक बहुत अच्छी राशि है। मेरी अपेक्षा से कहीं अधिक। <पी> यदि आपके पास छोटी, विवरण-सरल तस्वीरें या छवियां हैं, जिनमें समान प्रकाश और कम मात्रा में धुंधलापन और शोर है, तो आपको सर्वोत्तम परिणाम मिलेंगे। यदि आपकी फ़ाइलें इन शर्तों को पूरा करती हैं, तो आप अपस्केल से बहुत सुखद परिणाम की उम्मीद कर सकते हैं। यदि नहीं, तो परिणाम अच्छे से लेकर निराशाजनक तक होंगे। बस इसके प्रति सचेत रहें. अब, जैसा कि कहा गया है, यह वास्तव में एक शानदार छोटा उपकरण है, और परीक्षण के लायक है। इसके बाद, मैं ImageMagick और GIMP का उपयोग करके उपरोक्त सभी को मैन्युअल रूप से आज़माने जा रहा हूँ। मैं देखना चाहता हूं कि लिनक्स में कमांड-लाइन टूल का उपयोग करके हाथ से कितना फोटो सुधार और अपस्केलिंग किया जा सकता है। यह मेरे अगले ट्यूटोरियल का विषय होगा। बने रहें. <पी> चीयर्स.