URL एन्कोडिंग, URL के भीतर विशेष अर्थ वाले अमुद्रणीय वर्णों या वर्णों का एक ऐसे प्रतिनिधित्व में अनुवाद करने का अभ्यास है जो वेब ब्राउज़र और सर्वर द्वारा स्पष्ट और सार्वभौमिक रूप से स्वीकार किया जाता है। इन पात्रों में शामिल हैं -
- ASCII नियंत्रण वर्ण - अमुद्रणीय वर्ण आमतौर पर आउटपुट नियंत्रण के लिए उपयोग किए जाते हैं। कैरेक्टर रेंज 00-1F हेक्स (0-31 दशमलव) और 7F (127 दशमलव)। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
- गैर-ASCII नियंत्रण वर्ण - ये 128 वर्णों के ASCII वर्ण सेट से परे वर्ण हैं। यह श्रेणी आईएसओ-लैटिन वर्ण सेट का हिस्सा है और इसमें आईएसओ-लैटिन सेट 80-एफएफ हेक्स (128-255 दशमलव) का संपूर्ण "शीर्ष आधा" शामिल है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
- आरक्षित वर्ण - ये विशेष वर्ण हैं जैसे डॉलर चिह्न, एम्परसेंड, प्लस, कॉमन, फ़ॉरवर्ड स्लैश, कोलन, सेमी-कोलन, इक्वल साइन, प्रश्न चिह्न और "एट" सिंबल। URL के अंदर इन सभी के अलग-अलग अर्थ हो सकते हैं, इसलिए इन्हें एन्कोड करने की आवश्यकता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
- असुरक्षित वर्ण - ये रिक्त स्थान, उद्धरण चिह्न, प्रतीक से कम, प्रतीक से बड़ा, पाउंड वर्ण, प्रतिशत वर्ण, बायां घुंघराले ब्रेस, दायां घुंघराले ब्रेस, पाइप, बैकस्लैश, कैरेट, टिल्ड, बाएं स्क्वायर ब्रैकेट, दायां स्क्वायर ब्रैकेट, ग्रेव एक्सेंट हैं . ये वर्ण विभिन्न कारणों से URL में गलत समझे जाने की संभावना प्रस्तुत करते हैं।