
साहित्यिक चोरी हमेशा शिक्षकों, लेखकों, संपादकों और अन्य लोगों के लिए एक मुद्दा रहा है जो नियमित रूप से शब्दों और विचारों से निपटते हैं, और यह केवल इंटरनेट के आगमन और कॉपी-पेस्ट फ़ंक्शन के कारण और भी बदतर हो गया है। साहित्यिक चोरी की जाँच करने वाला सॉफ़्टवेयर मदद कर सकता है, लेकिन हर प्रोग्राम में एक बड़ा डेटाबेस या एक सटीक एल्गोरिथम नहीं होता है। कुछ स्केचियर चेकर्स सबमिट की गई सामग्री का उपयोग अपने उद्देश्यों के लिए भी कर सकते हैं। यहां तक कि सबसे अच्छे चेकर्स के पास भी 100 प्रतिशत सफलता दर नहीं होती है। लेकिन यह जानना कि साहित्यिक चोरी के लिए टेक्स्ट की जांच करने वाले टूल कैसे काम करते हैं, आपको यह तय करने में मदद करेंगे कि कौन से उपकरण आपके समय के लायक हैं।
साहित्यिक चोरी-चेकर्स कैसे काम करते हैं?

टेक्स्ट-मिलान सॉफ़्टवेयर के प्रत्येक भाग का अपना दृष्टिकोण होता है। अधिकांश एक ही मूल सिद्धांत पर काम करते हैं:स्रोत सामग्री के डेटाबेस के खिलाफ दर्ज सामग्री की जांच करें और समानताएं देखें। संभावित रूप से चोरी की जा सकने वाली सामग्री की विशाल मात्रा को ध्यान में रखते हुए, हालांकि, यह कोई मामूली कार्य नहीं है। एक सरल लाइन-बाय-लाइन खोज हमेशा के लिए लेगी और अव्यावहारिक रूप से संसाधन-गहन होगी।
इसीलिए अधिकांश उपकरण जो साहित्यिक चोरी के लिए पाठ की जाँच करते हैं, फ़िंगरप्रिंटिंग का उपयोग करते हैं। डेटाबेस में टेक्स्ट के प्रत्येक टुकड़े और उनके द्वारा जांचे गए टेक्स्ट के प्रत्येक टुकड़े के लिए, वे नमूनों के सेट निकालते हैं और प्रत्येक को एक हैशिंग एल्गोरिदम के माध्यम से चलाते हैं जो प्रत्येक इनपुट के लिए एक अद्वितीय पहचानकर्ता उत्पन्न करता है।

यदि किसी पेपर में फ़िंगरप्रिंट है जो डेटाबेस में एक के समान है, तो इसका मतलब है कि उन दोनों में एक ही इनपुट है और साहित्यिक चोरी हो सकती है। यह अनिवार्य रूप से कम सटीकता का परिणाम देता है, लेकिन एक अच्छा फ़िंगरप्रिंटिंग एल्गोरिदम कागज से इस तरह से नमूने ले सकता है कि यह न केवल सटीक मिलान बल्कि साहित्यिक चोरी का पता लगा सकता है जहां कुछ सामग्री को बदल दिया गया है - जैसे कि कताई कार्यक्रम द्वारा।
यदि प्रोग्राम को फ़िंगरप्रिंट मैच मिलता है, तो यह केवल साहित्यिक चोरी के संभावित उदाहरण को फ़्लैग कर सकता है और इसे एक दिन कह सकता है। उच्च-गुणवत्ता वाला सॉफ़्टवेयर, हालांकि, अक्सर टेक्स्ट लाइन को लाइन से जांचने के लिए सीधे स्ट्रिंग मिलान का उपयोग करेगा। यह एक ऐसा कार्य है जो डेटाबेस के संकुचित होने के बाद बहुत अधिक कम्प्यूटेशनल रूप से हल्का हो जाता है। यह प्रारंभिक फ़िंगरप्रिंट हिट की पुष्टि करने में मदद करता है और अंतिम निर्णय लेने वाले मनुष्यों के लिए बहुत अधिक डेटा प्रदान करता है।
एक अच्छे साहित्यिक चोरी परीक्षक में देखने योग्य बातें
एक साहित्यिक चोरी चेकर के पास होना चाहिए:
- मजबूत गोपनीयता नीति (उदाहरण के लिए, वे आपकी सामग्री को स्टोर/बेच नहीं करते हैं)
- बड़ा डेटाबेस
- अच्छा एल्गोरिथम

गोपनीयता नीति
कई मुफ्त (या, अधिक बार, फ्रीमियम) साहित्यिक चोरी चेकर्स वैध हैं, विज्ञापनों के माध्यम से या प्रीमियम संस्करण बेचकर पैसा कमाते हैं। हालांकि, कुछ कम-साक्षर लोग वास्तव में आपके द्वारा चेक किए गए लेखन को ले रहे हैं और इसे अपने उद्देश्यों के लिए उपयोग कर रहे हैं। यह अंत में एक अध्ययन वेबसाइट पर सामग्री के रूप में इस्तेमाल किया जा सकता है या इसके शब्दों को बदलने के लिए "स्पिनर" के माध्यम से चलाया जा सकता है और यातायात उत्पन्न करने के लिए एक लेख के रूप में रखा जा सकता है। गोपनीयता नीति की जांच करना और साइट की प्रतिष्ठा की त्वरित जांच करना एक अच्छा विचार है। विशेष रूप से ऐसा करें यदि यह थोड़ा सा स्केच या सच होने के लिए बहुत अच्छा लगता है।
डेटाबेस
यदि साहित्यिक चोरी चेकर के पास सही स्रोत सामग्री तक पहुंच नहीं है, तो वह यह नहीं बता पाएगा कि वह सामग्री कब चोरी हुई है। यह आमतौर पर सबसे बड़ी चीज है जो निम्न-गुणवत्ता वाले साहित्यिक चोरी चेकर्स को उनके प्रीमियम समकक्षों से अलग करती है। किसी और के स्वामित्व वाली पुस्तकों, लेखों और अन्य सामग्री के संग्रह तक पहुँच प्राप्त करना मुफ़्त या आसान नहीं है, इसलिए कई टूल केवल इंटरनेट की जाँच कर सकते हैं। हालांकि, यही वह जगह है जहां बहुत सारी साहित्यिक चोरी होती है, इसलिए यदि आप साहित्यिक चोरी की जांच कर रहे हैं तो किताबों, जर्नल लेखों या अन्य निजी सामग्री तक पहुंच सबसे महत्वपूर्ण है कि किसी ने थोड़ा और काम किया हो।
एल्गोरिदम
अधिकांश साहित्यिक चोरी-चेकर्स स्पष्ट रूप से अपने एल्गोरिथ्म को प्रकट नहीं करते हैं, लेकिन परिणामों की गुणवत्ता और सटीकता इस बात का एक अच्छा संकेतक है कि यह कितनी अच्छी तरह से बनाया गया है। इसे सीधे मापना मुश्किल हो सकता है, लेकिन यह कितना विवरण देता है, उपयोगकर्ता समीक्षाओं को पढ़ना, और यह देखने के लिए परीक्षण करना कि क्या यह अन्य स्रोतों से आपके द्वारा कॉपी की गई सामग्री का पता लगा सकता है, आपको यह एक अच्छा विचार दे सकता है कि साइट कितनी व्यापक खोज करती है। उदाहरण के लिए, यदि मुफ़्त संस्करण विकिपीडिया लेख से कॉपी-पेस्ट लेने में विफल रहता है, तो आप शायद भुगतान किए गए संस्करण के बहुत गहन होने की उम्मीद नहीं कर सकते।
सर्वश्रेष्ठ साहित्यिक चोरी चेकर
व्यावसायिक स्तर के साहित्यिक चोरी चेकर्स ज्यादातर एक कीमत पर आते हैं, और उपलब्ध अधिकांश मुफ्त विकल्प या तो Google से भी बदतर हैं या उनकी गोपनीयता नीतियां हैं, जिसका अर्थ है कि वे आपकी सामग्री का उपयोग अपने उद्देश्यों के लिए कर रहे हैं। सबसे अच्छा आपको मुफ्त में मिलने की संभावना है या तो कुछ परीक्षण पृष्ठ या एक साधारण रिपोर्ट जो आपको बताती है कि क्या साहित्यिक चोरी मौजूद है। उत्तरार्द्ध अभी भी उपयोगी हो सकता है क्योंकि यह आपको यह आकलन करने का एक त्वरित तरीका देता है कि आपको अधिक गहन टूल का उपयोग करना चाहिए या मैन्युअल रूप से एक पेपर के माध्यम से जाना चाहिए।
मैंने नीचे दिए गए प्रत्येक टूल का परीक्षण कई टेक्स्ट (मेरे द्वारा लिखे गए लेख, विकिपीडिया प्रविष्टियाँ, और समाचार स्रोत) का उपयोग करके किया और वे सभी स्रोतों के साथ-साथ साहित्यिक चोरी की सामग्री की सही पहचान करने में सक्षम थे। मैंने कुछ पूरी तरह से मुफ्त साइटों का परीक्षण किया, लेकिन उनमें से कई मेरे लेखों के अंशों की पहचान करने में असमर्थ थीं और यहां तक कि बीबीसी और विकिपीडिया से कॉपी-पेस्ट को पकड़ने में भी विफल रहे, जबकि एक त्वरित Google खोज में साहित्यिक चोरी की सामग्री तुरंत आ गई। <एच3>1. गूगल
यदि कोई विशिष्ट पाठ है जिस पर आपको साहित्यिक चोरी होने का संदेह है, तो Google वास्तव में एक बेहतरीन पहला पड़ाव है। आप एक बार में केवल 32 शब्दों की खोज कर सकते हैं, लेकिन यह अक्सर उस वेबसाइट, पेपर, या पुस्तक को चालू करने के लिए पर्याप्त हो सकता है जिससे किसी ने कॉपी किया है, भले ही उन्होंने कुछ शब्दों को बदल दिया हो।
<एच3>2. व्याकरणिक रूप से
आपके लिए पूर्ण साहित्यिक चोरी परिणाम प्राप्त करने के लिए व्याकरण के लिए इसकी संपादन सेवा की सदस्यता की आवश्यकता होती है, लेकिन प्रारंभिक जांच के लिए कोई शुल्क नहीं है, जो आपको बताता है कि साहित्यिक चोरी होने की संभावना है या नहीं। यह बहुत सारे अन्य ऐप्स के साथ आपको मिलता है, और मैंने इसे ज्यादातर समय सही ढंग से फ़्लैग किया गया साहित्यिक चोरी पाया, जिससे यह एक अच्छा प्रथम-पंक्ति मुक्त विकल्प बन गया।
<एच3>3. SearchEngineReports
यह मूल रूप से एक Google रैपर है, लेकिन यह मुफ़्त है और वास्तव में कई अन्य मुफ़्त विकल्पों की तुलना में बेहतर काम करता है। मैंने इसमें जो कुछ डाला, उसमें से अधिकांश को सही मिला। SearchEngineReports आपको प्रति खोज पाठ के 2,000 शब्दों की जांच करने देता है (खोजों की संख्या पर कोई ऊपरी सीमा नहीं है) और इसे Google टुकड़े के माध्यम से चलाता है, आपको बताता है कि कौन से वाक्य हिट उत्पन्न करते हैं। यह आपको भविष्य में पता लगाने से बचने के लिए साहित्यिक चोरी की सामग्री को फिर से लिखने का विकल्प भी देता है, जिसकी मैं आपको सलाह नहीं देता।
<एच3>4. कॉपीलीक्स
कॉपीलीक्स आपको 2,500 शब्द, या लगभग 10 पृष्ठ, निःशुल्क जाँच देता है। यह बहुत व्यापक रूप से उपयोग किया जाता है, इसमें उपयोगकर्ता के अनुकूल इंटरफेस है, और इसमें जांच के लिए अकादमिक और वैज्ञानिक कार्यों का एक बड़ा डेटाबेस शामिल है। यदि आपको इंटरनेट सामग्री से परे जाने की आवश्यकता है, तो यह शुरू करने के लिए एक विश्वसनीय स्थान है। इसमें मेरे द्वारा फेंकी गई सभी ऑनलाइन सामग्री है।
5. क्वेटेक्स्ट

आपको तीन 500 शब्दों के चेक मुफ्त में मिलते हैं, और उसके बाद आपको सदस्यता लेनी होती है। क्यूटेक्स्ट की सटीकता और संपूर्णता के लिए अच्छी प्रतिष्ठा है, और, तदनुसार, इसने मेरे परीक्षणों में अच्छा प्रदर्शन किया। इसके डेटाबेस में बहुत सारी किताबें और लेख के साथ-साथ इंटरनेट सामग्री भी शामिल है। यदि आप कॉपीलीक्स की तुलना में व्यापक लेकिन सस्ता कुछ ढूंढ रहे हैं, तो क्वेटेक्स्ट शुरू करने के लिए एक अच्छी जगह है।
<एच3>6. प्लेगस्कैन
प्लागस्कैन में पुस्तकों, लेखों और अन्य ग्रंथों का एक व्यापक डेटाबेस है और एक विस्तृत विश्लेषण देता है, जो मेरे लिए, सभी साहित्यिक स्रोतों के बारे में पहचान करता है। नि:शुल्क परीक्षण 2,000 शब्दों के लिए अच्छा है, जिसके बाद आपको जारी रखने के लिए क्रेडिट खरीदना होगा। यदि आपके पास जांचने के लिए बड़ी मात्रा में टेक्स्ट नहीं है, तो निश्चित संख्या में शब्दों की जांच के लिए क्रेडिट खरीदने की प्रणाली अधिकांश अन्य साहित्यिक चोरी चेकर्स द्वारा पेश किए गए सदस्यता विकल्पों की तुलना में सस्ता हो सकती है।
कोई जादू की गोली नहीं है
साहित्यिक चोरी चेकर्स, विशेष रूप से बजट वाले, लगभग निश्चित रूप से सब कुछ पकड़ने में सक्षम नहीं होंगे। यदि कोई साहित्यकार अस्पष्ट स्रोतों का उपयोग करता है या पर्याप्त रूप से फिर से लिखता है, तो उन्हें चिह्नित करने के लिए एक मशीन बहुत कुछ नहीं कर सकती है, और यहां तक कि जानकार मनुष्यों को भी मूर्ख बनाया जा सकता है। हालांकि, वे रक्षा की एक अच्छी पहली पंक्ति हो सकते हैं, और कम से कम कम प्रयास वाली साहित्यिक चोरी को रोक सकते हैं।