आइए दी गई टेक्स्ट फ़ाइल को bar.txt नाम दें
हम पायथन टेक्स्ट फ़ाइल या फ़ंक्शन में डुप्लिकेट लाइनों को हटाने के लिए पायथन में फ़ाइल हैंडलिंग विधियों का उपयोग करते हैं। टेक्स्ट फ़ाइल या फ़ंक्शन को उसी निर्देशिका में होना चाहिए जिसमें पायथन प्रोग्राम फ़ाइल है। निम्नलिखित कोड टेक्स्ट फ़ाइल bar.txt में डुप्लिकेट को हटाने का एक तरीका है और आउटपुट foo.txt में संग्रहीत है। ये फ़ाइलें उसी निर्देशिका में होनी चाहिए जिसमें पायथन स्क्रिप्ट फ़ाइल है, अन्यथा यह काम नहीं करेगी।
फ़ाइल bar.txt इस प्रकार है
A cow is an animal. A cow is an animal. A buffalo too is an animal. Lion is the king of jungle.
उदाहरण
नीचे दिया गया कोड bar.txt में डुप्लिकेट लाइनों को हटा देता है और foo.txt में स्टोर कर देता है
# This program opens file bar.txt and removes duplicate lines and writes the # contents to foo.txt file. lines_seen = set() # holds lines already seen outfile = open('foo.txt', "w") infile = open('bar.txt', "r") print "The file bar.txt is as follows" for line in infile: print line if line not in lines_seen: # not a duplicate outfile.write(line) lines_seen.add(line) outfile.close() print "The file foo.txt is as follows" for line in open('foo.txt', "r"): print line
आउटपुट
फ़ाइल foo.txt इस प्रकार है
A cow is an animal. A buffalo too is an animal. Lion is the king of jungle.