CSV फ़ाइल या अल्पविराम से अलग की गई मान फ़ाइल प्लेटफ़ॉर्म पर डेटा संग्रहीत करने और रखने के लिए सबसे व्यापक रूप से उपयोग की जाने वाली फ़्लैट फ़ाइलों में से एक है। कॉलम अल्पविराम से अलग होते हैं और वैकल्पिक हेडर पंक्ति भी होती है जो प्रत्येक कॉलम के नाम को इंगित करेगी। पायथन कई मॉड्यूल का उपयोग करके सीएसवी फाइलों को पढ़ सकता है। इस लेख में हम देखेंगे कि कैसे अजगर में CSV लाइब्रेरी का उपयोग CSV फ़ाइल को पढ़ने और लिखने के लिए किया जा सकता है। CSV फ़ाइल को पढ़ने के लिए हम पांडा लाइब्रेरी को भी देख सकते हैं।
csv मॉड्यूल का उपयोग करके CSV फ़ाइल पढ़ना
हम CSV फ़ाइल (https://www.guru99.com/python-csv.html)
से प्राप्त कर सकते हैंउदाहरण
आयात csvसाथ खुला('C:\\iris.csv','rt')फ़ाइल के रूप में:csv_rows =csv.reader(file) पंक्ति के लिए csv_rows में:प्रिंट (पंक्ति)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
['sepal.length', 'sepal.width', 'petal.length', 'petal.width', 'varity']['5.1', '3.5', '1.4', '.2', 'सेटोसा'] ['4.9', '3', '1.4', '.2', 'सेटोसा'] ['4.7', '3.2', '1.3', '.2', 'सेटोसा'] [' 4.6', '3.1', '1.5', '.2', 'सेटोसा'] ['5', '3.6', '1.4', '.2', 'सेटोसा'] ['5.4', '3.9' , '1.7', '.4', 'सेटोसा'] ['4.6', '3.4', '1.4', '.3', 'सेटोसा'] …………………………>पंडों का उपयोग करके CSV फ़ाइल पढ़ना
पांडा पुस्तकालय का उपयोग सीएसवी फाइलों को पढ़ने के लिए भी किया जा सकता है। इसमें सीएसवी पढ़ने की विधि है जिसे सीधे पथ और फ़ाइल नाम को छोड़कर लागू किया जा सकता है। एक बार फ़ाइल पढ़ने के बाद यह एक डेटा सेट बन जाता है और फिर हम आवश्यकतानुसार डेटा सेट के विभिन्न भागों को प्रिंट कर सकते हैं।
उदाहरण
pddatainput =pd.read_csv('C:\\iris.csv')print("दिए गए डेटासेट मान :\n", datainput)#डेटासेटप्रिंट का आकार("\nडेटासेट का आकार है:\n",datainput.shape)#डेटासेटप्रिंट से कुछ पंक्तियों को प्रिंट करना ("\n डेटासेट से कुछ पंक्तियों को प्रिंट करना :\n",datainput[0:6])आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
दिए गए डेटासेट मान:sepal.length sepal.width petal.length petal.width विविधता0 5.1 3.5 1.4 0.2 Setosa1 4.9 3.0 1.4 0.2 Setosa2 4.7 3.2 1.3 0.2 Setosa3 4.6 3.1 1.5 0.2 Setosa4 5.0 3.6 1.4 0.2 सेटोसा .. ... ... ... ... ... ... 145 6.7 3.0 5.2 2.3 वर्जिनिका 146 6.3 2.5 5.0 1.9 वर्जिनिका 147 6.5 3.0 5.2 2.0 वर्जिनिका 148 6.2 3.4 5.4 2.3 वर्जिनिका 149 5.9 3.0 5.1 1.8 वर्जिनिका [150 पंक्तियां x 5 कॉलम] डेटासेट का आकार is :(150, 5) डेटासेट से कुछ पंक्तियों को प्रिंट करना:sepal.leng वें सेपल.चौड़ाई पेटल.लंबाई पंखुड़ी.चौड़ाई किस्म0 5.1 3.5 1.4 0.2 सेटोसा1 4.9 3.0 1.4 0.2 सेटोसा2 4.7 3.2 1.3 0.2 सेटोसा3 4.6 3.1 1.5 0.2 सेटोसा4 5.0 3.6 1.4 0.2 सेटोसा5 5.4 3.9 1.7 0.4 सेटोसाcsv मॉड्यूल का उपयोग करके CSV फ़ाइल लिखना
एक सीएसवी फ़ाइल बनाने के लिए हम पायथन सूचियों का उपयोग करते हैं हम एक सूची के रूप में प्रत्येक पंक्ति वाले डेटा सेट की घोषणा करते हैं और सभी पंक्तियों को एक बड़ी गायक सूची में सबलिस्ट किया जाता है। हम एक और डेटा सेट भी बनाते हैं जो सिर्फ हेडर पंक्ति का प्रतिनिधित्व करता है। फिर हम फ़ाइल को स्थानीय सिस्टम में लिखने के लिए राइटरो () और csv.writer जैसी विभिन्न विधियों का उपयोग करते हैं।
उदाहरण
आयात csvdata =["माह", "1958", "1959", "1960"]x =[["जन", 340, 360, 417], ["FEB", 318, 342, 391], ["मार्च", 362, 406, 419], ["एपीआर", 348, 396, 461], ["मई", 363, 420, 472], ["जून", 435, 472, 535],[" जुलाई", 491, 548, 622], ["अगस्त", 505, 559, 606], ["सितंबर", 404, 463, 508], ["अक्टूबर", 359, 407, 461], ["नवंबर" , 310, 362, 390], ["DEC", 337, 405, 432],]y ="C:\\years.csv" ओपन (y, 'w') के साथ काम के रूप में:z =csv.writer( काम) z.writerow(डेटा) z.writerows(x)आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
महीना,1958,1959,1960जनवरी,340,360,417FEB,318,342,391MAR,362,406,419APR,348,396,461मई,363,420,472जून,435,472,535JUL,491,548,622AUG,501,V,32,46,3102,T,559,463,506Sपंडों का उपयोग करके CSV फ़ाइल लिखना
Uisng पांडा हम एक डेटा फ्रेम बनाते हैं जो देश पंक्तियों के साथ-साथ पंक्तियों के शीर्षलेख भी हैं। फिर हम to_csv विधि का उपयोग करते हैं जो फ़ाइल नाम और पथ को पैरामीटर के रूप में टेक्स्ट करती है और डेटा को csv फ़ाइल में ले जाती है।
उदाहरण
पंडों से डेटाफ्रेमसी ={'महीना':['जन', 'एफईबी', 'मार्च'], '1958':['345', '435', '545'], '1959':[ '377', '135', '985'], '1960':['498', '354', '765'],}df =डेटाफ्रेम (सी, कॉलम =["महीना", "1958", " 1959", "1960"])export_csv =df.to_csv (r'C:\\years_p.csv', index =none, Header=True) # यहां आपको पाथ लिखना है, जहां रिजल्ट फाइल सेव की जाएगीप्रिंट (df)आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
महीना 1958 1959 19600 जनवरी 345 377 4981 फरवरी 435 135 3542 मार्च 545 985 765