टेक्स्ट स्टेग्नोग्राफ़ी किसी अन्य टेक्स्ट में गुप्त टेक्स्ट संदेश को एक कवरिंग संदेश के रूप में छिपाने या प्रारंभिक गुप्त संदेश से संबंधित एक कवर संदेश बनाने का एक तरीका है।
टेक्स्ट स्टेग्नोग्राफ़ी में मौजूदा टेक्स्ट के फ़ॉर्मेटिंग को बदलने से लेकर टेक्स्ट के भीतर शब्दों को बदलने, रैंडम कैरेक्टर सीक्वेंस बनाने या पठनीय टेक्स्ट बनाने के लिए संदर्भ-मुक्त व्याकरण का उपयोग करने तक कुछ भी शामिल हो सकता है।
छवि, ऑडियो या वीडियो फ़ाइल में मौजूद अनावश्यक डेटा की कमी के कारण टेक्स्ट स्टेग्नोग्राफ़ी को सबसे कठिन माना जाता है। टेक्स्ट दस्तावेज़ों का तंत्र उसकी पहचान के समान है, जबकि चित्र सहित अन्य प्रकार के दस्तावेज़ों में, दस्तावेज़ की संरचना उसकी पहचान से भिन्न होती है।
इस प्रकार, ऐसे दस्तावेज़ों में, यह संबंधित आउटपुट में एक प्रसिद्ध परिवर्तन किए बिना दस्तावेज़ की संरचना में परिवर्तन सीखकर जानकारी छिपा सकता है।
एक छवि या एक ऑडियो फ़ाइल में अगम्य परिवर्तन किए जा सकते हैं, लेकिन, पाठ फ़ाइलों में, एक अतिरिक्त अक्षर या विराम चिह्न भी एक आकस्मिक पाठक द्वारा उल्लेखनीय हो सकता है। यह पाठ फ़ाइल को सहेज सकता है जिसके लिए कम मेमोरी की आवश्यकता होती है और इसका तेज़ और साथ ही सरल संचार इसे अन्य प्रकार की स्टेग्नोग्राफ़िक विधियों के लिए बेहतर बनाता है।
टेक्स्ट स्टेग्नोग्राफ़ी को आम तौर पर तीन प्रकारों में परिभाषित किया जा सकता है, जिसमें प्रारूप आधारित रैंडम और सांख्यिकीय पीढ़ी, भाषाई विधियाँ शामिल हैं जो इस प्रकार हैं -
प्रारूप आधारित तरीके - प्रारूप आधारित विधियों में डेटा को छुपाने के लिए पाठ के प्रारूप को भौतिक रूप से बदलना शामिल है। इस पद्धति में विशिष्ट दोष हैं। यदि स्टेगो फ़ाइल को वर्ड प्रोसेसर के साथ खोला जाता है, तो गलत वर्तनी और अतिरिक्त सफेद रिक्त स्थान की पहचान हो जाएगी।
परिवर्तित फोंट आकार मानव पाठक के लिए संदेह को उत्तेजित कर सकते हैं। इसके अलावा, यदि प्रारंभिक सादा पाठ सुलभ है, तो इस सादे पाठ की संदिग्ध स्टेग्नोग्राफ़िक पाठ के साथ तुलना करने से पाठ का हेरफेर किया हुआ तत्व काफी दिखाई दे सकता है।
यादृच्छिक और सांख्यिकीय पीढ़ी - रैंडम और स्टैटिस्टिकल जेनरेशन में, इसे एक ज्ञात प्लेनटेक्स्ट के अनुरूप रोका जा सकता है, स्टेग्नोग्राफर अपने स्वयं के कवर टेक्स्ट बनाने का सहारा लेते हैं। वर्णों के यादृच्छिक दृश्य क्रम में डेटा छुपाना एक तरीका है।
एक अन्य विधि में, शब्द की लंबाई और अक्षर आवृत्तियों की सांख्यिकीय विशेषताओं का उपयोग उन शब्दों को उत्पन्न करने के लिए किया जाता है जो दी गई भाषा में वास्तविक शब्दों के समान सांख्यिकीय गुण होते हैं।
भाषाई स्टेग्नोग्राफ़ी - भाषाई स्टेग्नोग्राफ़ी विशेष रूप से उत्पन्न और परिवर्तित पाठ के भाषाई गुणों पर विचार करती है, और कुछ मामलों में, भाषाई तंत्र का उपयोग उस स्थान के रूप में करती है जिसमें संदेश गुप्त होते हैं।
CFG पेड़ की संरचना बना सकता है जिसका उपयोग बिट्स को छुपाने के लिए किया जा सकता है जहां बाईं शाखा '0' को परिभाषित करती है और दाहिनी शाखा '1' से संबंधित होती है।
जीएनएफ में एक व्याकरण का भी उपयोग किया जा सकता है जहां उत्पादन में पहली पसंद बिट 0 को परिभाषित करती है और दूसरी पसंद बिट 1 को परिभाषित करती है। इस विधि में कुछ नुकसान हैं। सबसे पहले, एक छोटा व्याकरण कई पाठ दोहराव की ओर ले जाएगा।
दूसरे, हालांकि पाठ व्याकरणिक रूप से त्रुटिहीन है, लेकिन सिमेंटिक आर्किटेक्चर की एक खामी है। परिणाम वाक्यों की एक श्रृंखला है जिसका एक दूसरे से कोई संबंध नहीं है।